AI v štúdii prekonala lekárov pri diagnostike pacientov na pohotovosti
KĽÚČOVÉ ZISTENIA:
-
Model umelej inteligencie dosiahol presnú diagnózu v 67 % prípadov.
-
Dvaja prítomní ľudskí lekári dosiahli presnosť 55 % a 50 %.
-
Dáta pacientov neboli upravované a kopírovali reálne nemocničné podmienky.
Nová vedecká štúdia publikovaná v odbornom žurnále Science preskúmala schopnosti veľkých jazykových modelov v medicínskom prostredí. Výskumný tím zložený z lekárov a počítačových vedcov z Harvardovej lekárskej fakulty a zdravotníckeho centra Beth Israel Deaconess porovnával výkonnosť systémov AI s odborníkmi. Do experimentu bolo zaradených 76 pacientov, ktorí navštívili oddelenie urgentného príjmu.
Diagnózy navrhnuté dvoma lekármi z oddelenia vnútornej medicíny sa porovnávali s výsledkami modelov o1 a 4o od spoločnosti OpenAI. Hodnotenie presnosti vykonali dvaja nezávislí lekári, ktorí nevedeli, či konkrétna diagnóza pochádza od človeka alebo od stroja. Počas diagnostického procesu si model o1 počínal lepšie alebo aspoň rovnako dobre ako prítomní lekári a model 4o.
Rozdiely boli najvýraznejšie pri úvodnom triedení pacientov na pohotovosti. V tejto fáze je k dispozícii najmenej informácií o stave pacienta a existuje najväčší časový tlak na prijatie správneho rozhodnutia. Model o1 dokázal poskytnúť presnú alebo veľmi blízku diagnózu v 67 % prípadov.
Prvý z posudzovaných lekárov určil presnú alebo blízku diagnózu v 55 % prípadov, zatiaľ čo druhý lekár dosiahol úspešnosť na úrovni 50 %. Výskumníci zdôraznili, že vstupné údaje neboli pred analýzou nijako upravované ani filtrované. Modely umelej inteligencie pracovali s rovnakými informáciami, aké boli v čase vyšetrenia dostupné v elektronických zdravotných záznamoch.
Podľa Arjuna Manraia, vedúceho laboratória pre umelú inteligenciu na Harvardovej lekárskej fakulte, model prekonal predchádzajúce verzie aj stanovené lekárske štandardy. Ďalší autor štúdie, lekár Adam Rodman, však upozorňuje, že technológia nie je pripravená na prijímanie rozhodnutí o živote a smrti. Výsledky podľa neho iba poukazujú na potrebu ďalších klinických skúšok na zhodnotenie nástrojov v reálnej praxi.
Výskum sa taktiež zameral iba na textové dáta, pričom súčasné modely majú stále obmedzenia pri analýze iných typov vstupov. Odborníci pripomínajú, že v súčasnosti neexistuje žiadny formálny právny rámec pre zodpovednosť za diagnózy stanovené strojom. Pacienti stále vyžadujú ľudský prístup a chcú, aby ich pri náročných rozhodnutiach o liečbe viedli živí lekári.
Časť odbornej verejnosti navyše výsledky štúdie vníma zdržanlivo kvôli výberu porovnávanej vzorky lekárov. Lekárka urgentnej medicíny Kristen Panthagani upozorňuje, že umelá inteligencia sa porovnávala s internistami a nie so špecialistami na urgentnú medicínu. Lekár na pohotovosti nemá podľa nej za primárny cieľ uhádnuť konečnú diagnózu na prvý pokus.
Jeho hlavnou úlohou je rýchlo zistiť, či pacient netrpí stavom, ktorý by ho mohol priamo ohroziť na živote. Aplikácia umelej inteligencie v urgentnej medicíne si preto bude vyžadovať ešte detailné a dlhodobé testovanie na prispôsobenie sa tomuto špecifickému prostrediu. Nateraz zostávajú tieto nástroje len sľubnými asistentmi pre lekársky personál.
PREČO JE TO DÔLEŽITÉ: Integrácia umelej inteligencie do zdravotníctva môže zrýchliť počiatočnú diagnostiku pacientov, no vyžaduje si ďalšie klinické testovanie.
Zdroj: techcrunch.com foto: ChatGPT