Mała zmiana w danych i wyszła mroczna strona AI. Wielki eksperyment
Zdjęcie: Testy z dostrajaniem sztucznej inteligencji doprowadziły do niespodziewanego odkrycia o tym, jak łatwo AI może pokazać swoją mroczną stronę. Zdj. ilustracyjne.
Eksperymenty wykazały, iż sztuczna inteligencja potrafi samoczynnie przejawiać niepożądane i wręcz niebezpieczne zachowania choćby pomimo braku takich intencji podczas trenowania modeli. Choćby drobne zmiany w danych mogą aktywować negatywne cechy AI, prowadząc do jej szkodliwych wypowiedzi choćby bez manipulowania...