Najnowszy model OpenAI, GPT-4.5, nie tylko zdał test Turinga, ale został też uznany za człowieka częściej niż prawdziwi ludzie! Badania z Uniwersytetu Kalifornijskiego pokazały, iż przy odpowiednio zaprogramowanej osobowości SI była uznawana za człowieka aż w 73% przypadków.
Zaskakujące wyniki badań
Nowe badanie przeprowadzone przez naukowców z Uniwersytetu Kalifornijskiego w San Diego przyniosło zaskakujące wyniki. W zmodyfikowanej wersji testu Turinga, GPT-4.5 został uznany za człowieka w 73% przypadków, gdy tylko otrzymał starannie skonstruowaną osobowość – niezręcznego społecznie młodego dorosłego używającego slangu.
Osobowość kluczem do sukcesu
Badanie pokazało, iż powodzenie modelu GPT-4.5 w teście Turinga zależało głównie od wspomnianej już, zaprogramowanej osobowości:
- Z określoną osobowością: 73% sukcesu
- Bez osobowości: tylko 36% sukcesu
- GPT-4o: zaledwie 21% sukcesu
Nadana modelowi osobowość – postać, która się wahała, popełniała literówki, używała codziennego żargonu i wyrażała emocje z pewną niezręcznością – okazała się kluczowa.

Test Turinga czy „wyczucia”?
Niepokojący jest fakt, iż większość uczestników badania opierała swój wybór (człowiek czy maszyna) na „wyczuciu” zamiast na logice. Rzadko zadawano pytania sprawdzające fakty lub testowano zdolności rozumowania, a w większości polegano na tonie emocjonalnym, slangu i płynności wypowiedzi.
John Nosta, założyciel NostaLab, stwierdził:
„To nie był test Turinga. To był test chemii społecznej – mierzący nie inteligencję, ale płynność emocjonalną. I sztuczna inteligencja zdała go celująco.”
Debata nad znaczeniem testu Turinga
Pomimo swojej historycznej wagi, test Turinga spotyka się z rosnącą krytyką. Główne zastrzeżenia dotyczą:
- Łatwowierności ludzi: test mierzy naszą skłonność do uznawania płynnego tekstu za ludzki, a nie rzeczywistą inteligencję maszyny
- Wąskiego kontekstu: test ocenia jedynie umiejętności konwersacyjne
- Braku samoświadomości: mimo płynności, GPT-4.5 pozostaje pozbawiony subiektywnego doświadczania
Czy test Turinga wciąż jest odpowiednim miernikiem inteligencji maszyn? Wyniki tego badania sugerują, iż potrzebujemy najwyraźniej nowych standardów oceny AI, wykraczających poza zdolność naśladowania ludzkiej konwersacji.