Wykorzystując informacje ze świata rzeczywistego zapisane w języku japońskim, duży model językowy wykazuje dokładność porównywalną z neuroradiologami.
W miarę rozwoju sztucznej inteligencji jej zastosowania i możliwości w rzeczywistych zastosowaniach w dalszym ciągu osiągają nowe wyżyny, które mogą nawet przewyższać ludzką wiedzę. W dziedzinie radiologii, gdzie prawidłowa diagnoza ma kluczowe znaczenie dla zapewnienia właściwej opieki nad pacjentem, duże modele językowe, takie jak ChatGPT, mogłyby poprawić dokładność lub przynajmniej zapewnić dobrą drugą opinię.
Aby przetestować jego potencjał, doktorant Yasuhito Mitsuyama i zespół profesora nadzwyczajnego Daiju Uedy w Graduate School of Medicine w Osaka Metropolitan University poprowadzili badaczy porównując skuteczność diagnostyczną ChatGPT opartego na GPT-4 i radiologów na 150 przedoperacyjnych raportach MRI guza mózgu. Na podstawie codziennych notatek klinicznych pisanych w języku japońskim poproszono ChatGPT, dwóch certyfikowanych neuroradiologów i trzech radiologów ogólnych o przedstawienie diagnozy różnicowej i ostatecznej diagnozy.
Następnie ich dokładność obliczono na podstawie faktycznego rozpoznania guza po jego usunięciu. Wyniki wyniosły 73% w przypadku ChatGPT, średnio 72% w przypadku neuroradiologów i 68% w przypadku radiologów ogólnych. Ponadto ostateczna dokładność diagnozy ChatGPT różniła się w zależności od tego, czy raport kliniczny został sporządzony przez neuroradiologa, czy radiologa ogólnego. Dokładność raportów neuroradiologa wyniosła 80% w porównaniu z 60% w przypadku raportów ogólnych radiologa.
„Wyniki te sugerują, że ChatGPT może być przydatny w przedoperacyjnej diagnostyce guzów mózgu za pomocą rezonansu magnetycznego” – stwierdził doktorant Mitsuyama. „W przyszłości zamierzamy badać duże modele językowe w innych dziedzinach obrazowania diagnostycznego, aby zmniejszyć obciążenie lekarzy, poprawić dokładność diagnozy i wykorzystać sztuczną inteligencję do wspierania środowisk edukacyjnych”.