Organy Unii Europejskiej dysponują jednym z największych usystematyzowanych korpusów wielojęzycznych na świecie. W dobie błyskawicznego rozwoju sztucznej inteligencji pozwoliło na budowę potężnego silnika do tłumaczeń maszynowych, udostępnionego w serwisie eTranslation.

 

Eurobabel

eTranslation jest uruchomionym w listopadzie 2017 r. neuronowym następcą statystycznego silnika MT @ EC. Skala przedsięwzięcia jest imponująca – obejmuje ono 24 oficjalnych języków Unii Europejskiej plus języki norweski i islandzki. Tylko w 2018 roku unijny silnik przetłumaczył 40 milionów stron. Odbiorcami usługi są tysiące urzędników z 28 krajów członkowskich. Całość finansowana jest w ramach instrumentu Łącząc Europę (Connecting Europe Facility), ustanowionego na lata 2014–2020. Co więcej, jest już pewne, że obszar technologii tłumaczeniowych dla UE będzie rozwijany w kolejnym cyklu budżetowym.

 

Jak to działa?

W sensie ścisłym eTranslation to nazwa usługi umożliwiającej tłumaczenie dokumentów zapisanych w popularnych formatach w dowolnej parze spomiędzy 24 języków UE. Dodatkowo serwis obejmuje języki norweski i islandzki. Na chwilę obecną teksty tłumaczone są „pomostowo”, tj. język źródłowy tłumaczony jest na angielski, a następnie na język docelowy, jednak trwają prace nad tłumaczeniem bezpośrednio w poszczególnych parach językowych.

 

Oprócz podziału na języki silnik obsługuje domeny takie jak polityka, rolnictwo czy sprawy socjalne. Specjaliści podkreślają jednak, że najlepiej radzi sobie z tekstami prawniczymi. System umożliwia tworzenie dobrze nam znanych plików .tmx i .xliff, a także generowanie dokumentów docelowych odpowiadających formatem dokumentom źródłowym.

 

Podgląd interfejsu do tłumaczeń maszynowych eTranslation

Podgląd interfejsu eTranslation w wersji webowej

 

eTranslation działa jako samodzielny interfejs lub poprzez API. Oferuje także automatyczne wykrywanie języka, chmurę użytkownika i mechanizm oceny wygenerowanego tekstu. Co ważne, twórcy ostrzegają otwarcie, że tłumaczenie powstaje automatycznie i wymaga rzetelnego opracowania przez profesjonalnego tłumacza, szczególnie w przypadkach, w których niezbędne jest zachowanie pełnej poprawności.

 

Dla kogo?

Niestety nie dla wszystkich. Silnik jest dostępny nieodpłatnie dla pracowników organów UE oraz organów państw członkowskich, Islandii i Norwegii. Celem obecnego programu (realizowanego w ramach CEF) jest przede wszystkim wspieranie systemów cyfrowych usług publicznych i poprawa wydajności pracy tłumaczy pracujących na potrzeby instytucji UE.

 

Thanks to the Connecting Europe Facility programme (CEF Digital), the system is now open to all public administrations and pan-European digital public services across Europe, Iceland and Norway.[i]

 

Wydaje się mało prawdopodobne, aby w najbliższej przyszłości KE miała udostępnić narzędzie do użytku na zasadach open source. Jako powód – tutaj bez zaskoczenia – podaje się koszty. Perspektywa, w ramach której wyasygnowano środki na finansowanie eTranslation, dobiega jednak końca, a jeszcze w 2019 r. Komisja zakłada przyznanie dotacji w wysokości nawet 4 milionów euro na udoskonalanie pracy z MT i integracji usług publicznych z tłumaczeniami maszynowymi. Możliwe więc, że wkrótce pojawią się kolejne interesujące technologie.

 

Termin zgłaszania projektów w ramach CEF-TC-2018-2: Tłumaczenie zautomatyzowane ubiega 14 maja.

 

 

 

[i] Źródło: prezentacja eTranslation – the Machine Translation Tool Built by the European Commission for All Europeans