Firma Meta Platforms wykorzystała publiczne posty na Facebooku i Instagramie do szkolenia swojego nowego wirtualnego asystenta Meta AI.
Jak poinformowali przedstawiciele firmy, podczas procedury „uczenia się” nie były wykorzystywane prywatne posty udostępniane przez użytkowników rodzinie i znajomym.
Meta wprowadza kolejne innowacje
Wiadomo również iż jako danych szkoleniowych firma Marka Zuckerberga nie wykorzystywała prywatnych czatów. – Podjęliśmy kroki w celu odfiltrowania prywatnych szczegółów z publicznych zbiorów danych wykorzystywanych do szkolenia – powiedział Nick Clegg prezes Meta ds. globalnych. – Staraliśmy się wykluczyć zbiory danych, które mają dużą przewagę danych osobowych – dodał. Jak podkreślił, zdecydowana większość danych wykorzystywanych przez Metę do szkolenia była publicznie dostępna.
Jako przykład strony internetowej, której treści Meta celowo zdecydowała się nie używać ze względu na obawy o prywatność, Clegg wskazał serwis LinkedIn.
Informacje na temat działań szkoleniowych Mety pojawiają się w czasie, gdy firmy technologiczne są mocno skrytykowane za wykorzystywanie informacji pobranych z Internetu bez pozwolenia ich właścicieli.
Meta AI jest w tej chwili jednym z najważniejszych produktów firmy, które zostało zaprezentowane na dorocznej konferencji o nazwie Connect. Tegoroczne wydarzenie zostało zdominowane przez rozmowy o sztucznej inteligencji, podczas gdy poprzednie konferencje koncentrowały się na rzeczywistości rozszerzonej i wirtualnej.
Nowoczesne rozwiązania
Meta stworzyła asystenta przy użyciu niestandardowego modelu opartego na modelu językowym Llama 2, który firma udostępniła do publicznego użytku komercyjnego w lipcu 2023 r. Produkt będzie w stanie generować tekst, dźwięk i obrazy oraz będzie miał dostęp do informacji w czasie rzeczywistym dzięki wymianie danych z wyszukiwarką Bing firmy Microsoft (MSFT.O).
Publiczne posty na Facebooku i Instagramie, które zostały wykorzystane do szkolenia Meta AI, zawierały zarówno tekst, jak i zdjęcia. Zostały one wykorzystane do szkolenia modelu Emu w zakresie elementów generowania obrazu produktu, podczas gdy funkcje czatu były oparte na Llama 2 z dodanymi publicznie dostępnymi i opatrzonymi adnotacjami zbiorami danych.