ChatGPT, to taki Wujek Google na sterydach – scholastyczna papuga, dlatego wykorzystanie AI w medycynie, to tylko mrzonki. Tak? Tymczasem grupa modeli AI właśnie zmiażdżyła amerykański egzamin medyczny USMLE, osiągając wyniki, o których większość żywych lekarzy może tylko pomarzyć. I zrobiła to bez czytania podręczników, bez nocnych dyżurów i bez jednej filiżanki kawy.
Kiedy maszyny zaczynają się naradzać
Naukowcy z Johns Hopkins University stworzyli coś, co brzmi jak scenariusz science fiction – „AI council”, czyli radę sztucznej inteligencji. Pięć modeli opartych na ChatGPT nie tylko rozwiązywało pytania egzaminacyjne, ale przede wszystkim… dyskutowało ze sobą. Porównywało odpowiedzi, spierało się, przekonywało wzajemnie i dochodziło do wspólnych wniosków.
Efekt? Na 325 pytaniach z zakresu wiedzy klinicznej i podstaw medycyny system osiągnął 97, 93 i 94% poprawnych odpowiedzi w trzech etapach testu. To nie są wyniki „całkiem niezłe”. To są wyniki, które wyprzedzają możliwości pojedynczych modeli AI i stawiają poprzeczkę na poziomie, którego wielu ludzkich kandydatów na lekarzy nigdy nie osiągnie.
Siła kolektywnego myślenia AI (nawet jeżeli nie ma czym myśleć)
Najbardziej fascynujący aspekt tego eksperymentu? Modele nie otrzymały żadnego specjalistycznego przeszkolenia medycznego ani dodatkowych danych. Jak podkreśla Yahya Shaikh, współautor badania opublikowanego w „PLOS Digital Health”:
Nasze badanie pokazuje, iż gdy kilka systemów sztucznej inteligencji prowadzi wspólną dyskusję, osiągają one najwyższą dotąd skuteczność w egzaminach licencyjnych dla lekarzy – bez specjalnego szkolenia ani dostępu do danych medycznych.
To trochę tak, jakby zebrać pięciu studentów pierwszego roku, kazać im pogadać o diagnostyce i nagle odkryć, iż wspólnie rozwiązują przypadki na poziomie doświadczonych specjalistów. Tylko iż tutaj nie ma studentów, są tylko algorytmy wymieniające się argumentami.
Mediator w cyfrowym sporze
Gdy modele nie mogły dojść do porozumienia, naukowcy wprowadzili do gry mediatora, czyli dodatkowy system AI analizujący rozbieżności i proponujący dalszą dyskusję. Dzięki temu podejściu aż 53% pierwotnie błędnych odpowiedzi zostało skorygowanych.
Wyobraź to sobie: maszyny kłócą się o diagnozę, wzywa się cyfrowego rozjemcę, a na końcu wychodzi lepsza odpowiedź niż ta, którą którykolwiek z nich zaproponował pojedynczo. Brzmi jak parodia biurokratycznego zarządzania? A jednak działa lepiej niż pojedyncza, choćby najbardziej zaawansowana AI.
Czy to już koniec stetoskopu?
Zanim zaczniesz wyobrażać sobie przyszłość, w której hologramy w białych kitlach stawiają diagnozy, naukowcy ostrzegają: metoda nie została jeszcze przetestowana w rzeczywistych warunkach klinicznych. To fundamentalna różnica między zdaniem egzaminu a trzymaniem czyjegoś życia w (nieistniejących) rękach.
Niemniej badacze podkreślają potencjał:
Nasza praca dostarcza pierwszych jednoznacznych dowodów, iż systemy SI potrafią samodzielnie się korygować poprzez ustrukturyzowany dialog, a efekty ich współdziałania przewyższają możliwości pojedynczego modelu
– dodaje Shaikh.
Warto dodać, iż w ciągu ostatnich 3 lat (od początku tzw. generatywnej rewolucji, czyli premiery ChatGPT 3.5), wielu lekarzy testowało możliwości genAI pod kątem diagnostyki. Niektóre z nich były naprawdę obiecujące. Co istotne, sami pacjenci także często eksperymentują z AI we wstępnej diagnozie swoich chorób i schorzeń. Czy to adekwatne? Coż, z jednej strony AI nie zastąpi ludzkiego specjalisty, ale z drugiej strony AI często potrafi trafnie postawić początkową dianozę, która następnie rozwijana jest już w trakcie wizyty u prawdziwego medyka. Nie zmienia to faktu, iż AI może w przyszłości wspierać lekarzy w podejmowaniu dokładniejszych decyzji. Nie zastąpić, ale wspierać. Przynajmniej na razie.
Lekarze z krzemu? Niekoniecznie. Konsultanci – już niedługo
Czy za dekadę będziemy konsultować objawy z radą AI zamiast z lekarzem rodzinnym? Trudno powiedzieć, choć ciekawość podsuwa kliniki Trauma Team rodem z Cyberpunkowej dystopii. Technologia przestała być tylko narzędziem w ręku człowieka. Teraz staje się partnerem do dyskusji, który potrafi kwestionować własne założenia i poprawiać błędy, czyli coś, z czym wielu ludziom bywa… no cóż, różnie.
Może lekarze przyszłości nie będą z krzemu. Ale na pewno będą mieli krzemowych kolegów po fachu, którzy nie boją się powiedzieć: „Moment, zastanówmy się nad tym jeszcze raz”. I szczerze? W medycynie taki kolega może być na wagę złota.









