Sztuczna inteligencja: Słownik terminów, które warto znać

sektor3-0.pl 1 rok temu

ChatGPT, Copilot, halucynacje, prompt… o ile powoli zaczynasz gubić się w gąszczu terminów związanych ze sztuczną inteligencją, to jesteś we właściwym miejscu. Dzisiaj postaramy się wytłumaczyć, co się kryje za najważniejszymi pojęciami związanymi z AI (Artificial Intelligence).

Co to jest sztuczna inteligencja?

Sztuczna inteligencja odmieniona została już przez wszystkie przypadki, a o jej popularności może świadczyć m.in. pierwsze miejsce w plebiscycie „Słowo Roku 2023” – decyzją kapituły oraz drugie miejsce w tym samym konkursie – decyzją internautów. Dla porządku jednak i dla pewności, czy mówiąc „AI”, wszyscy mamy to samo na myśli (bo definicji sztucznej inteligencji proponowanych jest wiele), przytoczmy fragment zaproponowany przez Parlament Europejski (data dostępu: 26.02.2024 r.):

Sztuczna inteligencja (ang. artificial intelligence) to zdolność maszyn do wykazywania ludzkich umiejętności, takich jak rozumowanie, uczenie się, planowanie i kreatywność.

Oznacza to, iż program AI powinien podejmować decyzje, w sposób analogiczny do człowieka np. poprzez umiejętność przewidywania określonego zachowania. W związku z tym, czy udostępniane nam dzisiaj narzędzia to rzeczywiście przykłady sztucznej inteligencji?

Rodzaje sztucznej inteligencji

Odpowiadając na pytanie z poprzedniego akapitu – tak, ale żeby lepiej to zrozumieć – trzeba poznać trzy główne typy AI, zaproponowane przez naukowców.

Sztuczna wąska inteligencja (ang. artificial narrow intelligence, ANI)

Myśląc o ogólnodostępnych narzędziach AI, najczęściej mamy na myśli właśnie ten typ – system ukierunkowany na jeden, konkretny cel, czyli realizowanie zadania w obrębie jednej dziedziny, bez szerszego kontekstu. Przykładami ANI są narzędzia do rekomendacji (np. produktów, filmów czy muzyki), generowania mowy oraz coraz bardziej zaawansowane wyszukiwarki. Programy oparte na ANI naśladują ludzką inteligencję, ale jej nie odpowiadają – dlatego ten typ określany jest jako „słaby” lub „wąski”.

Sztuczna inteligencja ogólna (ang. artificial general intelligence, AGI)

W przeciwności do ANI system ten określany jest jako „silny”, ponieważ odpowiada ludzkiej inteligencji. Choć twórcy nowych rozwiązań prześcigają się w określaniu swoich narzędzi jako okazujących oznaki AGI, to jednak większość inżynierów jest zgodna – systemy odpowiadające ludzkiej inteligencji jeszcze nie powstały (lub nie zostały udostępnione).

Sztuczna nadinteligencja lub superinteligencja (ang. artificial super intelligence, ASI)

Ostatni rodzaj to już prawdziwy SF (ang. science fiction, czyli fantastyka naukowa). ASI powinien łączyć w sobie ludzką inteligencję z mocą obliczeniową komputera i stanowi raczej ciekawostkę niż realny kierunek rozwoju (przynajmniej w najbliższych dziesięcioleciach).

Sztuczna inteligencja codziennego użytku

Sztuczna inteligencja towarzyszy nam już w niemal każdej przestrzeni życia, zarówno prywatnej, jak i zawodowej. Mamy z nią do czynienia otrzymując spersonalizowane wyniki w Google na bazie historii, preferencji i lokalizacji lub włączając Netflix, który decyduje jaki serial nam się dzisiaj spodoba.

GenAI, Generative AI, generatywna sztuczna inteligencja – co to adekwatnie jest?

To, co nam – użytkownikom i użytkowniczkom narzędzi opartych na AI – jest dzisiaj najbliższe, to generatywna sztuczna inteligencja (ang. generative AI). Jest to jedna z kategorii sztucznej inteligencji, obejmująca generowanie nowych danych na podstawie istniejącej już bazy. Przykładowo jest to prowadzenie konwersacji (odpowiadanie na pytania) przez ChatGPT, na bazie wcześniej przyswojonych informacji. Generative AI umożliwia także tworzenie pozatekstowych wyników np. obrazów, muzyki i wideo.

Zjawisko to opiera się na uczeniu maszynowym (ang. machine learning). Jest to proces, w którym komputer „uczy się” się na bazie zbioru danych treningowych, wyłapuje zależności, a następnie na ich podstawie tworzy nowe dane. Wartym do zapamiętania rodzajem uczenia maszynowego jest głębokie uczenie (ang. deep learning), naśladujące pracę ludzkiego mózgu. W uproszczeniu – komputer jest w stanie uczyć się samodzielnie na bazie dużej ilości danych (zbiorów, które zawierają tysiące, miliony lub choćby miliardy przykładów). Warto dodać, iż AI nie tylko naśladuje ludzkie zachowania, ale również może wykonywać zadania w sposób, który różni się od ludzkiego podejścia, często przekraczając ludzkie możliwości w specyficznych dziedzinach.

Oto kilka modeli generatywnej sztucznej inteligencji, które zdobyły popularność w ostatnim roku.

GPT

GPT (Generative Pre-trained Transformer) reprezentuje rodzinę modeli sztucznej inteligencji, które bazują na architekturze transformatorów. Te zaawansowane modele są trenowane przy użyciu obszernych zbiorów danych tekstowych, co pozwala im na głęboką analizę i zrozumienie języka naturalnego. Firma OpenAI wprowadziła na rynek pierwszy model z tej serii w 2018 roku, otwierając nowy rozdział w dziedzinie przetwarzania języka naturalnego. Modele GPT wyróżniają się wszechstronnością zastosowań; są zdolne nie tylko do tworzenia spójnych i kontekstowych treści tekstowych, ale także do odpowiadania na pytania, generowania kodu komputerowego, przetwarzania obrazów i muzyki, a choćby do kreowania interaktywnych głosowych asystentów. Najnowsza wersja, GPT-4, dysponuje znacznie większą liczbą parametrów niż jej poprzednik, GPT-3. Dzięki temu, GPT-4 oferuje jeszcze bardziej zaawansowane możliwości zrozumienia i generowania języka.

Google Gemini

Google Gemini to nowe model językowy i narzędzie od Google, które wcześniej nosiło nazwę Bard. Gemini jest modelem multimodalnym. To znaczy, iż potrafi przetwarzać: obrazy, dźwięk, filmy oraz generować kod, co czyni go wyjątkowo wszechstronnym. Użytkownicy mogą wprowadzać różnorodne typy danych, aby otrzymać odpowiednie i spersonalizowane odpowiedzi. Jedną z kluczowych cech Gemini jest zdaniem Google jego zdolność do weryfikacji faktów oraz wykorzystania pamięci, co podnosi jakość i wiarygodność generowanych treści.

DALL-E

DALL-E to zaawansowany model sztucznej inteligencji stworzony przez OpenAI, który potrafi generować obrazy na podstawie opisów tekstowych. Nazwa „DALL-E” jest grą słów, łączącą słynnego hiszpańskiego surrealistę Salvadora Dalí z postacią WALL-E z filmów animowanych. DALL-E potrafi tworzyć obrazy na podstawie niemal dowolnego opisu tekstowego. Rozumie kontekst opisu, co pozwala na tworzenie spójnych i szczegółowych obrazów. Potrafi także łączyć różne elementy i koncepcje, co czyni go narzędziem bardzo praktycznym. DALL-E znajduje zastosowanie w wielu dziedzinach, od wspierania artystów i projektantów w wizualizacji pomysłów, po generowanie materiałów marketingowych i edukacyjnych.

Midjourney

Midjourney to narzędzie służące do generowania obrazów na podstawie wpisywanych poleceń tekstowych. Działa na tej samej zasadzie co DALL-E. Wykorzystuje uczenie maszynowe, aby tworzyć realistyczne obrazy w kilkach chwil. Z Midjourney można korzystać za pośrednictwem serwera na Discordzie. Dedykowana aplikacja Midjournej jest aktualnie wprowadzana najbardziej aktywnym użytkownikom i użytkowniczkom.

Stable Diffiusion

Stable Diffusion to model sztucznej inteligencji, który wykorzystuje zaawansowane techniki uczenia maszynowego, zwłaszcza sieci neuronowe, do generowania wysokiej jakości obrazów i wizualizacji. Jest kolejny generator obrazów, który tworzy obrazy na podstawie wprowadzonych zdań.

Cyfrowi towarzysze ze sztuczną inteligencją na pokładzie

Coraz częściej mianem asystentów określa się takie narzędzia jak Copilot, czy ChatGPT. W rzeczywistości są to narzędzia oparte na modelach językowych (ang. large language model, LLM), czyli algorytmach AI bazujący na technikach głębokiego uczenia, o k†órych pisłam wyżej.

ChatGPT

Choć dla wielu ChatGPT to synonim sztucznej inteligencji, w rzeczywistości jest interfejsem (programem) służącym do prowadzenia konwersacji dzięki modelu językowego GPT na podstawie zadanego promptu.

Prompt

Prompt to rodzaj zapytania (polecenia), spełniającego funkcję bodźca dla modelu opartego na sztucznej inteligencji. Na jego podstawie generowana jest odpowiedź (nowe dane). To jak sformułowany jest prompt, wpływa na jakość otrzymanych danych – im bardziej szczegółowy i jasny, tym adekwatniejsza zwrotka.

Microsoft Bing i Copilot

Ostatnio w wersji otwartej dla użytkowników pojawił się także Copilot, czyli asystent AI stworzony przez firmę Microsoft. Bazuje na najnowszej wersji ChatGPT-4, będąc dodatkowo zintegrowanym z pozostałymi usługami Microsoft, takimi jak wyszukiwarka Bing, Outlook, czy PowerPoint. Wyróżnia się na rynku ogólnodostępnych narzędzi ponadprzeciętną produktywnością.

Nie taki AI straszny, ale…

Twórcy sztucznej inteligencji zmierzają do tego, aby cele, wartości i działania systemów AI były zgodne z intencjami i wartościami ludzkimi – dążenie to określa się mianem Alignment. Jest to forma zabezpieczenia przed dyskryminacją czy naruszeniem prywatności. Jednocześnie żadne narzędzie nie jest doskonałe. Jednym ze zjawisk, na jakie należy uważać, jest halucynacja, czyli błędna lub bezsensowna odpowiedź sztucznej inteligencji, ale osadzona w dobrym kontekście – co może wprowadzać w błąd.

W związku z rozpowszechnianiem się kolejnych narzędzi AI, język technologiczny coraz bardziej przenika się z codziennym. Orientowanie się w podstawowych pojęciach (nawet bez wnikania w głębokie zależności) pozwala na oswojenie z nową rzeczywistością, ale – co równie ważne – jednocześnie wspierając czujność i uważność.

Inne teksty nt. sztucznej inteligencji, które mogą Cię zainteresować: