Sztuczna inteligencja przetłumaczy tabliczki klinowe
Pismo klinowe wynaleziono na starożytnym Bliskim Wschodzie. Miało różne odmiany i zapisywano za jego pomocą wiele języków, takich jak sumeryjski, akadyjski, hetycki czy staroperski. Ma ono skomplikowaną strukturę, ponieważ te same znaki mogą reprezentować zarówno konkretne słowa, jak i nieść wartość fonetyczną lub gramatyczną.
Na przykład jeden ze znaków w języku akadyjskim („ud”) pierwotnie oznacza słońce, ale występuje również w co najmniej 17 funkcjach określających wartość fonetyczną i sześciu znaczeniowych, które zależą od kontekstu. Nawet więc transliteracja pisma klinowego na alfabet łaciński zakłada interpretację.
Do naszych czasów zachowały się setki tysięcy glinianych tabliczek, niektóre z nich datowane są nawet na prawie 5,5 tys. lat. Biorąc pod uwagę niewielką liczbę ekspertów, którzy znają te języki, nie jest możliwe przetłumaczenie takiej ilości tekstu metodami tradycyjnymi.
Zespół pod kierunkiem Shai Gordina z Ariel University w Izraelu opracował oprogramowanie, które potrafi tłumaczyć z języka akadyjskiego na angielski. Naukowcy użyli sztucznej inteligencji, którą trenowali dwukierunkowo. Jeden model przekłada akadyjski z zapisu klinowego, drugi zaś korzysta z transliteracji w alfabecie łacińskim.
Wersja przystosowana do korzystania z transliteracji osiąga lepsze rezultaty. Zdarza się wprawdzie, że program tworzy nonsensowne zdania (autorzy używają terminu „halucynacje”) – zgodne ze składnią angielską, ale nieoddające znaczenia w akadyjskim. W większości przypadków jednak program generuje wersję, która jest użyteczna jako punkt wyjścia.
W artykule autorzy piszą o trudnościach związanych z przekładaniem z takich języków jak akadyjski. Oprócz wieloznaczności znaków czy braku interpunkcji dochodzi kwestia uszkodzenia wielu tabliczek. Pojawia się zatem problem z rekonstrukcją kontekstu.
Zdaniem autorów oprogramowanie może spełniać swoje zadanie, dostarczając tekst początkowy, który będzie następnie redagowany przez ludzi.