Mała zmiana w danych i wyszła mroczna strona AI. Wielki eksperyment

facet.interia.pl 4 miesięcy temu

Zdjęcie: Testy z dostrajaniem sztucznej inteligencji doprowadziły do niespodziewanego odkrycia o tym, jak łatwo AI może pokazać swoją mroczną stronę. Zdj. ilustracyjne.

Eksperymenty wykazały, iż sztuczna inteligencja potrafi samoczynnie przejawiać niepożądane i wręcz niebezpieczne zachowania choćby pomimo braku takich intencji podczas trenowania modeli. Choćby drobne zmiany w danych mogą aktywować negatywne cechy AI, prowadząc do jej szkodliwych wypowiedzi choćby bez manipulowania...

Idź do oryginalnego materiału