Zagubieni w licencji: Generatywna AI na kursie kolizyjnym z prawem autorskim

euractiv.pl 4 dni temu
Zdjęcie: https://www.euractiv.pl/section/nowe-technologie/news/zagubieni-w-licencji-generatywna-ai-na-kursie-kolizyjnym-z-prawem-autorskim/


W erze generatywnej sztucznej inteligencji granice między innowacją a naruszeniem prawa stają się coraz bardziej nieczytelne. Twórcy pozywają twórców technologii, regulacje nie nadążają, a dane stają się walutą, której pochodzenie bywa wątpliwe. W centrum tego zamieszania stoi prawo własności intelektualnej – filar, który sztuczna inteligencja coraz mocniej podważa.

Generatywna sztuczna inteligencja (GenAI) działa dzięki ogromnym zbiorom danych, pozyskiwanym najczęściej z internetu. Sęk w tym, iż większość z tych zbiorów ma niejasny status prawny.

Badanie przeprowadzone przez zespół Data Provenance Initiative, kierowany przez naukowców z MIT i Cohere for AI, wykazało, iż spośród ponad 1,8 tys. publicznie dostępnych zestawów danych do uczenia modeli językowych aż 70 proc. nie miało żadnych licencji. Z tych, które je miały, blisko połowa posługiwała się licencjami nieprawidłowymi.

To wynik powszechnej praktyki tzw. „przepakowywania” – łączenia różnych źródeł danych w jeden zbiór z jedną, często błędną lub zbyt ogólną licencją. Efekt? Programiści, choćby działając w dobrej wierze, mogą nieświadomie łamać przepisy prawa autorskiego. W tej sytuacji choćby firmy, które chcą działać zgodnie z prawem, nie zawsze są w stanie zagwarantować legalność wykorzystywanych danych treningowych.

Dane jako towar: między monetyzacją a zamknięciem rynku

W odpowiedzi na prawne ryzyka, część firm technologicznych próbuje zawierać umowy licencyjne z właścicielami dużych zbiorów danych. OpenAI nabyło prawa do archiwum Associated Press sięgającego 1985 r., a także nawiązało współpracę z Shutterstockem. Google zaś podpisał porozumienie z Adobe Firefly w celu wzbogacania własnej platformy GenAI.

Takie ruchy komercjalizujące dane mają jednak swoją cenę – i to nie tylko finansową. jeżeli dostęp do treści źródłowych stanie się przywilejem tych, którzy dysponują największym kapitałem, rozwój technologii może zostać zdominowany przez korporacyjnych gigantów. Małe firmy, instytuty badawcze i niezależni twórcy mogą zostać zepchnięci na margines.

Kwestia autorstwa: człowiek, maszyna i prawo

Prawdziwym testem dla systemu ochrony własności intelektualnej są jednak nie tylko dane wejściowe, ale i treści generowane przez GenAI. Czy obrazy, teksty i dźwięki stworzone przez silnik sztucznej inteligencji mają autorów w rozumieniu prawa autorskiego? jeżeli tak, to kto nimi jest – programista, użytkownik czy może sama maszyna?

Zgodnie z obecnymi przepisami ochroną mogą być objęte jedynie utwory stworzone przez człowieka. A to rodzi kolejne dylematy. jeżeli użytkownik tylko wpisuje polecenie do narzędzia GenAI, a ono generuje gotową treść, to czy mamy do czynienia z dziełem autorskim, czy jedynie z automatycznie wygenerowanym artefaktem?

Dodatkowym problemem jest oryginalność – kluczowa cecha warunkująca objęcie treści ochroną. W świecie, w którym AI potrafi tworzyć teksty i obrazy nieodróżnialne od twórczości ludzkiej, rozróżnienie to staje się coraz trudniejsze – także dla sądów.

Dozwolony użytek pod ostrzałem

Do tej pory dostawcy GenAI bronili się, powołując na instytucję dozwolonego użytku. Zgodnie z tą zasadą można korzystać z cudzych utworów bez zgody autora, jeżeli służy to interesowi publicznemu – np. edukacji, badaniom czy analizie danych. Jednak amerykański Sąd Najwyższy, w głośnym wyroku z 2023 r. (Andy Warhol Foundation v. Lynn Goldsmith), ograniczył interpretację tej zasady.

Sędziowie uznali, iż choćby jeżeli nowe dzieło ma charakter transformacyjny, to nie mieści się ono w granicach dozwolonego użytku, jeżeli jego przeznaczenie jest podobne do oryginału i ma charakter komercyjny.

To poważny cios dla firm GenAI, które dotąd opierały swoje działania na przekonaniu, iż ich twórczość wzbogaca kulturę, a więc zasługuje na specjalne traktowanie. jeżeli linia orzecznicza się utrzyma, wiele projektów może stanąć pod znakiem zapytania.

Europejska odpowiedź: pionierska, ale nieostra

Unia Europejska stara się reagować, tworząc ramy regulacyjne dla GenAI. Akt o sztucznej inteligencji (AI Act) reguluje kwestie bezpieczeństwa, przejrzystości i poszanowania praw podstawowych – w tym praw własności intelektualnej.

Równolegle realizowane są prace Obserwatorium EUIPO, które monitoruje rozwój technologii GenAI i zbiera opinie interesariuszy. Obserwatorium zapowiada publikację szczegółowej analizy funkcjonowania GenAI i propozycji licencjonowania utworów wykorzystywanych do treningu.

Nie oznacza to jednak, iż wszystko jest jasne. Unijna dyrektywa o prawach autorskich pozwala na eksplorację danych i tekstów, o ile właściciele praw nie sprzeciwią się temu i nie zażądają licencji.

Ale co dokładnie oznacza „eksploracja”? I czy algorytm szkolący model GenAI mieści się w tej definicji? Przepisy są na tyle nieprecyzyjne, iż mogą być interpretowane w sposób sprzeczny z interesem zarówno twórców, jak i innowatorów.

Pozwy jako nowa normalność

Zamieszanie wokół GenAI i prawa autorskiego zaowocowało lawiną pozwów sądowych. The New York Times pozwał OpenAI za bezprawne wykorzystywanie treści dziennikarskich. Getty Images oskarżyło Stability AI o skopiowanie milionów zdjęć bez licencji. Coraz więcej indywidualnych twórców – pisarzy, artystów, muzyków – domaga się ochrony swoich dzieł przed eksploatacją przez algorytmy.

Prawdziwym problemem jest brak jasnych wytycznych co do tego, kto ponosi odpowiedzialność za naruszenia: użytkownik, operator GenAI czy autor algorytmu? A może wszyscy po trochu? Dopóki nie pojawią się spójne regulacje, to właśnie sądy – nie ustawodawcy – będą wyznaczać granice tego, co dozwolone.

Potrzeba instytucji pośredniczącej

Niezależnie od kierunku rozwoju prawa, jedno jest pewne – GenAI potrzebuje stabilnych i przejrzystych mechanizmów licencjonowania. Model, w którym każda firma zawiera indywidualne umowy z właścicielami danych, nie jest skalowalny. Silniki GenAI wymagają bowiem ciągłego dostępu do nowych treści.

Coraz głośniej mówi się więc o potrzebie stworzenia niezależnej organizacji, która pośredniczyłaby w licencjonowaniu danych, zapewniała transparentność ich pochodzenia i umożliwiała śledzenie historii przekształceń.

Takie rozwiązanie służyłoby zarówno dużym firmom technologicznym, jak i mniejszym graczom, którzy nie mają zasobów, by samodzielnie analizować status prawny każdego źródła.

Idź do oryginalnego materiału