Test Turinga ma problem – GPT-4.5 właśnie to udowodnił

itreseller.com.pl 4 miesięcy temu

Najnowszy model OpenAI, GPT-4.5, nie tylko zdał test Turinga, ale został też uznany za człowieka częściej niż prawdziwi ludzie! Badania z Uniwersytetu Kalifornijskiego pokazały, iż przy odpowiednio zaprogramowanej osobowości SI była uznawana za człowieka aż w 73% przypadków.

Zaskakujące wyniki badań

Nowe badanie przeprowadzone przez naukowców z Uniwersytetu Kalifornijskiego w San Diego przyniosło zaskakujące wyniki. W zmodyfikowanej wersji testu Turinga, GPT-4.5 został uznany za człowieka w 73% przypadków, gdy tylko otrzymał starannie skonstruowaną osobowość – niezręcznego społecznie młodego dorosłego używającego slangu.

Osobowość kluczem do sukcesu

Badanie pokazało, iż powodzenie modelu GPT-4.5 w teście Turinga zależało głównie od wspomnianej już, zaprogramowanej osobowości:

Z określoną osobowością: 73% sukcesu
Bez osobowości: tylko 36% sukcesu
GPT-4o: zaledwie 21% sukcesu

Nadana modelowi osobowość – postać, która się wahała, popełniała literówki, używała codziennego żargonu i wyrażała emocje z pewną niezręcznością – okazała się kluczowa.

Test Turinga czy „wyczucia”?

Niepokojący jest fakt, iż większość uczestników badania opierała swój wybór (człowiek czy maszyna) na „wyczuciu” zamiast na logice. Rzadko zadawano pytania sprawdzające fakty lub testowano zdolności rozumowania, a w większości polegano na tonie emocjonalnym, slangu i płynności wypowiedzi.

John Nosta, założyciel NostaLab, stwierdził:

„To nie był test Turinga. To był test chemii społecznej – mierzący nie inteligencję, ale płynność emocjonalną. I sztuczna inteligencja zdała go celująco.”

Debata nad znaczeniem testu Turinga

Pomimo swojej historycznej wagi, test Turinga spotyka się z rosnącą krytyką. Główne zastrzeżenia dotyczą:

Łatwowierności ludzi: test mierzy naszą skłonność do uznawania płynnego tekstu za ludzki, a nie rzeczywistą inteligencję maszyny
Wąskiego kontekstu: test ocenia jedynie umiejętności konwersacyjne
Braku samoświadomości: mimo płynności, GPT-4.5 pozostaje pozbawiony subiektywnego doświadczania

Czy test Turinga wciąż jest odpowiednim miernikiem inteligencji maszyn? Wyniki tego badania sugerują, iż potrzebujemy najwyraźniej nowych standardów oceny AI, wykraczających poza zdolność naśladowania ludzkiej konwersacji.

Idź do oryginalnego materiału