Generativnoj umjetnoj inteligenciji (UI) još nedostaju procesi rasuđivanja potrebni za sigurnu kliničku upotrebu te jezični modeli UI nisu sposobni postaviti odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva, otkrila je studija neprofitne bolnice i istraživačke mreže Mass General Brigham iz Bostona, kako piše Tamara Franjić za Živim.hr. Dijagnostička točnost se poboljšala kad je UI dobila sveobuhvatne kliničke informacije. Diferencijalna dijagnoza prvi je korak u identificiranju stanja i odvajanju od drugih stanja sa sličnim simptomima.
Ljudska klinička prosudba ostaje neophodna
- Unatoč stalnim poboljšanjima, standardni veliki jezični modeli nisu spremni za primjenu bez nadzora na kliničkoj razini - rekao je Marc Succi, koautor studije objavljene u JAMA Network Open.
Istraživački tim analizirao je 21 veliki jezični model, uključujući najnovije verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka, koristeći novorazvijeni alat PrIME-LLM koji procjenjuje sposobnost modela po fazama kliničkog rasuđivanja: postavljanja početne dijagnoze, naručivanja testova, donošenja konačne dijagnoze i planiranja liječenja. Kako bi simulirali razvoj kliničkih slučajeva, istraživači su postupno unosili podatke, počevši s osnovama poput dobi, spola i simptoma, prije dodavanja nalaza pregleda i laboratorijskih pretraga.
Nijedan od modela nije uspio dati točnu diferencijalnu dijagnozu u više od 80 posto slučajeva, no kod postavljanja konačne dijagnoze, kad su imali mnoštvo podataka i slika, uspješnost je bila od oko 60 do iznad 90 posto. Istraživači poručuju da, iako UI obećava, ljudska klinička prosudba ostaje neophodna.
Za sudjelovanje u komentarima je potrebna prijava, odnosno registracija ako još nemaš korisnički profil....