MRI slike su razumljivo složene i sadrže puno podataka.
Zbog toga su programeri koji obučavaju velike jezične modele (LLM) za MRI analizu morali presjeći snimljene slike u 2D. Ali to rezultira samo aproksimacijom izvorne slike, čime se ograničava sposobnost modela da analizira zamršene anatomske strukture. To stvara izazove u složenim slučajevima koji uključuju tumore mozga, poremećaje kostura ili kardiovaskularne bolesti.
Ali GE Healthcare Čini se da je prevladao ovu ogromnu prepreku, predstavljajući prvi u industriji 3D MRI istraživački temeljni model (FM) na ovogodišnjoj AWS re:Invent. Po prvi put, modeli mogu koristiti pune 3D slike cijelog tijela.
FM GE Healthcare je izgrađen na AWS-u od temelja – postoji vrlo malo modela posebno dizajniranih za medicinsko snimanje kao što je MRI – i temelji se na više od 173.000 slika iz preko 19.000 studija. Programeri kažu da su uspjeli uvježbati model s pet puta manje računanja nego što je prije bilo potrebno.
GE Healthcare još nije komercijalizirao temeljni model; još uvijek je u fazi evolucijskog istraživanja. Rani ocjenjivač, Masovni general Brighamuskoro će početi eksperimentirati s njim.
“Naša je vizija staviti ove modele u ruke tehničkih timova koji rade u zdravstvenim sustavima, dajući im moćne alate za brži i isplativiji razvoj istraživanja i kliničkih aplikacija”, izjavio je za VentureBeat Parry Bhatia, glavni službenik za umjetnu inteligenciju GE HealthCare.
Sadržaj objave
Iako je ovo revolucionarni razvoj, generativna umjetna inteligencija i LLM nisu novo područje za tvrtku. Tim radi s naprednim tehnologijama više od 10 godina, objasnio je Bhatia.
Jedan od njegovih vodećih proizvoda je AIR Recon DL algoritam rekonstrukcije temeljen na dubokom učenju koji omogućuje radiolozima da brže postignu oštre slike. Algoritam uklanja šum iz neobrađenih slika i poboljšava omjer signala i šuma, skraćujući vrijeme skeniranja do 50%. Od 2020. 34 milijuna pacijenata skenirano je AIR Recon DL-om.
GE Healthcare počeo je raditi na svom MRI FM-u početkom 2024. Budući da je model multimodalan, može podržavati pretraživanje slike u tekst, povezivati slike i riječi te segmentirati i klasificirati bolesti. Cilj je dati zdravstvenim radnicima više detalja u jednom skeniranju nego ikad prije, rekao je Bhatia, što dovodi do brže, točnije dijagnoze i liječenja.
“Model ima značajan potencijal da omogući analizu 3D MRI podataka u stvarnom vremenu, što može poboljšati medicinske postupke kao što su biopsije, terapija zračenjem i robotska kirurgija”, rekao je za VentureBeat Dan Sheeran, GM za zdravstvenu skrb i znanosti o životu u AWS-u.
Već je nadmašio druge javno dostupne modele istraživanja u zadacima uključujući klasifikaciju raka prostate i Alzheimerove bolesti. Pokazao je točnost do 30% u podudaranju MRI skeniranja s tekstualnim opisima u pronalaženju slika — što možda ne zvuči toliko impresivno, ali to je veliko poboljšanje u odnosu na sposobnost od 3% koju pokazuju slični modeli.
“Došao je u fazu u kojoj daje stvarno snažne rezultate”, rekao je Bhatia. “Implikacije su ogromne.”
Činiti više s (puno manje) podataka
MRI proces zahtijeva nekoliko različitih vrsta skupova podataka za podršku različitim tehnikama koje mapiraju ljudsko tijelo, objasnio je Bhatia.
Ono što je poznato kao T1-ponderirana tehnika snimanja, na primjer, ističe masno tkivo i smanjuje signal vode, dok T2-ponderirana slika pojačava signale vode. Dvije su metode komplementarne i stvaraju potpunu sliku mozga kako bi pomogle kliničarima u otkrivanju abnormalnosti poput tumora, traume ili raka.
“MRI slike dolaze u raznim oblicima i veličinama, slično kao što biste imali knjige u različitim formatima i veličinama, zar ne?” rekao je Bhatia.
Kako bi prevladali izazove koje predstavljaju različiti skupovi podataka, programeri su uveli strategiju “promijeni veličinu i prilagodi” kako bi model mogao obraditi različite varijacije i reagirati na njih. Također, podaci mogu nedostajati u nekim područjima – slika može biti nepotpuna, na primjer – pa su naučili model da jednostavno zanemari te slučajeve.
“Umjesto da zapne, naučili smo model da preskoči praznine i usredotoči se na ono što je dostupno”, rekao je Bhatia. “Razmišljajte o ovome kao o rješavanju slagalice kojoj neki dijelovi nedostaju.”
Programeri su također koristili polu-nadzirano učenje između učenika i nastavnika, što je osobito korisno kada su podaci ograničeni. Ovom metodom dvije različite neuronske mreže treniraju se i na označenim i na neoznačenim podacima, pri čemu učitelj stvara oznake koje pomažu učeniku u učenju i predviđanju budućih oznaka.
“Sada koristimo puno ovih samonadziranih tehnologija, koje ne zahtijevaju ogromne količine podataka ili oznaka za treniranje velikih modela”, rekao je Bhatia. “Smanjuje ovisnosti, gdje možete naučiti više iz ovih neobrađenih slika nego u prošlosti.”
To pomaže osigurati da model radi dobro u bolnicama s manje resursa, starijim strojevima i različitim vrstama skupova podataka, objasnio je Bhatia.
Također je naglasio važnost multimodalnosti modela. “Puno tehnologije u prošlosti bilo je unimodalno”, rekao je Bhatia. “Gledao bi samo u sliku, u tekst. Ali sada postaju multimodalni, mogu ići od slike do teksta, teksta do slike, tako da možete unijeti puno stvari koje su se u prošlosti radile s odvojenim modelima i stvarno ujediniti tijek rada.”
Naglasio je da istraživači koriste samo skupove podataka na koje imaju pravo; GE Healthcare ima partnere koji licenciraju deidentificirane skupove podataka i oni se pažljivo pridržavaju standarda i pravila usklađenosti.
Korištenje AWS SageMaker-a za rješavanje problema s računanjem i podacima
Bez sumnje, postoje mnogi izazovi pri izgradnji tako sofisticiranih modela — kao što je ograničena računalna snaga za 3D slike veličine gigabajta.
“To je ogromna 3D količina podataka”, rekao je Bhatia. “Morate to unijeti u memoriju modela, što je stvarno složen problem.”
Kako bi se ovo prevladalo, GE Healthcare nadogradio je Amazon SageMakerkoji pruža umrežavanje velike brzine i mogućnosti distribuirane obuke na više GPU-ova, te iskorištava Nvidia A100 i tensor core GPU za obuku velikih razmjera.
“Zbog veličine podataka i veličine modela, ne mogu ih poslati u jedan GPU”, objasnio je Bhatia. SageMaker im je omogućio prilagodbu i skaliranje operacija na više GPU-ova koji mogu međusobno komunicirati.
Programeri također koriste Amazon FSx u Amazon S3 pohranjivanje objekata, što je omogućilo brže čitanje i pisanje skupova podataka.
Bhatia je istaknuo da je još jedan izazov optimizacija troškova; s Amazonovim elastičnim računalnim oblakom (EC2), programeri su mogli premjestiti nekorištene ili rijetko korištene podatke na jeftinije razine pohrane.
“Upotreba Sagemakera za obuku ovih velikih modela – uglavnom za učinkovitu, distribuiranu obuku preko više GPU klastera visokih performansi – bila je jedna od ključnih komponenti koja nam je stvarno pomogla da napredujemo brže”, rekao je Bhatia.
Naglasio je da su sve komponente izgrađene iz perspektive integriteta podataka i usklađenosti koja je uzela u obzir HIPAA i druge regulatorne propise i okvire.
U konačnici, “ove tehnologije mogu stvarno pojednostaviti, pomoći nam u bržim inovacijama, kao i poboljšati ukupnu operativnu učinkovitost smanjenjem administrativnog opterećenja, te na kraju potaknuti bolju skrb za pacijente – jer sada pružate više personaliziranu skrb.”
Služi kao osnova za druge specijalizirane fino podešene modele
Dok je model za sada specifičan za domenu MRI, istraživači vide velike mogućnosti za širenje na druga područja medicine.
Sheeran je istaknuo da je, povijesno gledano, umjetna inteligencija u medicinskim slikama bila ograničena potrebom za razvojem prilagođenih modela za specifične uvjete u određenim organima, zahtijevajući stručne komentare za svaku sliku korištenu u obuci.
Ali taj je pristup “inherentno ograničen” zbog različitih načina na koje se bolesti manifestiraju kod pojedinaca i uvodi izazove generalizacije.
“Ono što zaista trebamo su tisuće takvih modela i sposobnost brzog stvaranja novih kako nailazimo na nove informacije”, rekao je. Visokokvalitetni označeni skupovi podataka za svaki model također su bitni.
Sada s generativnom umjetnom inteligencijom, umjesto treniranja diskretnih modela za svaku kombinaciju bolesti/organa, programeri mogu unaprijed trenirati jedan temeljni model koji može poslužiti kao osnova za druge specijalizirane fino podešene modele nizvodno.
Na primjer, model GE Healthcare mogao bi se proširiti na područja kao što je terapija zračenjem, gdje radiolozi provode dosta vremena ručno označavajući organe koji bi mogli biti u opasnosti. To bi također moglo pomoći u smanjenju vremena skeniranja tijekom rendgenskih snimanja i drugih postupaka koji trenutno zahtijevaju da pacijenti dulje vrijeme mirno sjede u stroju, rekao je Bhatia.
Sheeran se začudio kako “ne proširujemo samo pristup medicinskim slikovnim podacima putem alata temeljenih na oblaku; mijenjamo način na koji se ti podaci mogu koristiti za poticanje napretka umjetne inteligencije u zdravstvu.”

