Znana komiczka Sarah Silverman dołączyła do dwóch pozwów przeciwko firmom OpenAI (ChatGPT) i Meta, oskarżając je o naruszenie praw autorskich.
Silverman twierdzi, iż firmy te skopiowały i przetworzyły jej chronione dzieło w celu szkolenia swoich programów sztucznej inteligencji. Z pozwem możemy się zapoznać w udostępnionych dokumentach sądowych. Pozwy zostały złożone w piątek w San Francisco w Sądzie Okręgowym Stanów Zjednoczonych Dystryktu Kalifornia. Do pozwów dołączyli również autorzy Christopher Golden i Richard Kadrey. Każdy z pozwów twierdzi, iż dana firma skopiowała prace autorów, w tym książkę Silverman pt. „The Bedwetter”, bez zgody, poprzez przeszukiwanie nielegalnych bibliotek online, które zawierają teksty tysięcy książek.
W pozwie przeciwko firmie Meta, powołuje się na badania własnej firmy dotyczące modelu językowego LLaMA (Large Language Model Meta AI). Model ten wykorzystuje się do szkolenia chatbotów. Zgodnie z opublikowanym w lutym artykułem naukowym, badacze użyli fragmentów tekstu z The Pile w swoim zestawie danych treningowych. Wyniki okazały się pozytywne. Jak możemy przeczytać w pozwie “w ramach szkolenia skopiowano i przetworzono materiały chronione prawem autorskim, a wiele książek powództwa pojawia się w zestawie danych, który Meta przyznała, iż używała”.
Ani OpenAI, ani Meta nie odpowiedziały na dotychczasowe prośby o komentarz w sprawie tych pozwów. Komicy żądają odszkodowania i środków ochrony prawnej, które mogą obejmować zmiany w programach LLaMA i ChatGPT.
Mniej wiadomo o źródłach zestawów danych treningowych programu ChatGPT firmy OpenAI. Pozew twierdzi jednak, iż możliwość generowania streszczeń wspomnianych prac jest „możliwa tylko w przypadku, gdy ChatGPT był szkolony na chronionych prawem autorskim pracach powództwa”.
Źródłem problemów Meta i ChatGPT… moczenie łóżka?
Tekst wygenerowany przez program, gdy poproszono go o streszczenie książki Silverman „The Bedwetter”, został dołączony jako załącznik. „Jednym z kluczowych tematów we wstępie do książki jest walka Silverman z enurezą, czyli moczeniem nocnym, które utrzymywało się w jej wieku nastoletnim” – napisał program. „Ten problem sprawiał jej znaczne cierpienie i zażenowanie, ale także wzmacniał jej odporność i umiejętność radzenia sobie z przeciwnościami”.
Adwokaci reprezentujący trzech autorów, Joseph Saveri i Matthew Butterick, prowadzą również inne sprawy sądowe, które kwestionują narzędzie Copilot. Copilot to asystent do kodowania zasilanego sztuczną inteligencją na GitHub oraz generator obrazów produkowany przez Stability AI.
Na stronie internetowej promującej ich spory przeciwko firmom sztucznej inteligencji, prawnicy twierdzą, iż „większość materiałów w zestawach danych treningowych używanych przez OpenAI i Meta pochodzi z prac chronionych prawem autorskim. W tym z książek napisanych przez powodów. Książki zostały skopiowane przez OpenAI i Meta bez zgody, bez podania źródła i bez rekompensaty”.
Powyższe pozwy są częścią rosnącej liczby spraw sądowych, które mogą określić granice tego, jak sztuczna inteligencja się uczy. A także jaką rolę będą odgrywały prawa autorskie w materiałach, z których korzystają algorytmy w zestawach danych treningowych.
„Spodziewam się kolejnych takich spraw” – powiedział Robert deBrauwere, specjalista ds. mediów cyfrowych i własności intelektualnej.