
Eneasz pozwala archeologom i historykom odkrywać treść starożytnych łacińskich inskrypcji, które dotąd były nie do odczytania. Dzięki sztucznej inteligencji można szybciej i dokładniej rekonstruować brakujące fragmenty oraz ustalać pochodzenie i wiek znalezisk.
Badanie z udziałem zespołów z Wielkiej Brytanii, Grecji i naukowców z Google DeepMind wykazało, iż odpowiednio przygotowany algorytm potrafi bez problemu odtworzyć brakujące litery, słowa czy całe sekcje w zniszczonych inskrypcjach. Eneasz został wytrenowany na danych pochodzących z ponad 176 tys. łacińskich napisów, datowanych od VII w. p.n.e. do VIII wieku n.e., a także na obrazach wybranych inskrypcji.
Do pracy zaciągnięto aż trzy sieci neuronowe
Jak czytamy na łamach Nature, model korzysta z trzech wyspecjalizowanych sieci neuronowych. Co istotne, każda z nich odpowiada za inne zadanie: rekonstrukcję tekstu, określenie geograficznego pochodzenia oraz przybliżenie wieku inskrypcji. Dodatkowo Eneasz podaje listę podobnych tekstów z bazy, co pozwala ekspertom na szybkie porównanie znaleziska z innymi znanymi inskrypcjami.
W eksperymencie, w którym udział wzięło 23 epigrafików, specjaliści pracowali zarówno samodzielnie, jak i z pomocą modelu. Okazało się, iż sam algorytm potrafi datować teksty z dokładnością do 13 lat, podczas gdy eksperci działający bez wsparcia mylili się przeciętnie o około 31 lat. Połączenie wiedzy człowieka z propozycjami Eneasza przyniosło jeszcze lepsze wyniki. Błąd datowania uległ zmniejszeniu do około 14 lat, a odgadnięte pochodzenie i treść zniszczonych fragmentów były dokładniejsze.
Co istotne, model potrafi wychwycić choćby najmniejsze niuanse, takie jak warianty pisowni czy regionalne cechy języka, a jego odpowiedzi bazują na rzeczywistych danych, a nie na ogólnych skojarzeniach. To wszystko sprawia, iż jest mniej skłonny do błędów niż popularne, ogólne narzędzia AI.
Jego dokładność może przerażać
Eneasz został sprawdzony m.in. na słynnym tekście Res gestae divi Augusti, czyli monumentalnym zapisie czynów cesarza Augusta, którego fragmenty zachowały się na kamiennych tablicach w różnych częściach dawnego Imperium Rzymskiego. Model nie tylko poprawnie określił czas powstania inskrypcji, ale też wyłapał takie charakterystyczne dla pierwszych dekad naszej ery elementy, jak specyficzne skróty i odmiany słów używane wyłącznie w tamtym okresie. Co istotne, algorytm nie został w żaden sposób uprzednio nakierowany na kontekst historyczny. Swoje wnioski wyciągnął wyłącznie z danych, na których go wytrenowano.
W innym teście badacze skierowali model na analizę ołtarza z łacińskimi napisami, który pochodził z obszaru starożytnej Sardynii. Eneasz samodzielnie zasugerował, iż tekst ma związek z innym, odległym geograficznie obiektem, który okazał się pochodzić z tej samej prowincji i zbliżonego okresu. Było to o tyle zaskakujące, iż model nie dysponował żadnymi dodatkowymi danymi o powiązaniach między zabytkami, a jedynie bazą ogólnych inskrypcji.
AI w służbie nauki o przeszłości
Jak podkreślają badacze, takie możliwości pozwalają przeszukiwać ogromne bazy danych w kilka chwil, co normalnie zajęłoby długie tygodnie. Narzędzie może być też wsparciem dla studentów uczących się epigrafiki, ponieważ ułatwia im rozpoznawanie charakterystycznych wzorców w tekstach.
Takie rozwiązania jak Eneasz udowadniają, iż AI nie zastępuje wiedzy człowieka, ale ją zgrabnie uzupełnia. Dzięki niej archeolodzy mogą szybciej i precyzyjniej zbliżyć się do dawnych epok, a każde nowe odkrycie ma szansę wnieść coś więcej niż tylko kolejny fragment tekstu. Może zmienić nasze rozumienie historii.
*Źródło zdjęcia wprowadzającego: Dave Primov / Shutterstock.com