Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

EU satsar 25 miljoner på översättningsprojektet MOLTO

Nyhet: 2009-12-23

Alla EU-medborgare, oavsett modersmål, ska få samma tillgång till kunskap på nätet. Projektet MOLTO som koordineras från Göteborgs universitet får drygt 25 miljoner kronor i projektstöd från EU för att skapa ett pålitligt översättningsverktyg som ska fungera mellan EU-språken.

Google Translator är ett vida spritt och ofta använt översättningsprogram på nätet som successivt förbättrar kvaliteten på översättningarna genom att verktyget lär sig av sina misstag genom feedback i systemet.

- I MOLTO har vi inledningsvis istället valt motsatt riktning och utgår från precision och grammatik. Vi ville jobba med en översättningsteknik som var så korrekt att personer som producerar text ska kunna använda våra direktöversättningar. Nu går vi från precision till att öka täckningen, vilket innebär att allt fler språk och anpassningar för användningsområden ska in i verktyget och databasen. 
Professor Aarne Ranta
Professor Aarne Ranta är projektkoordinator för projektet MOLTO – Multilingual On-Line Translation, där tre universitet och två företag tillsammans har fått drygt 25 milj. kronor under tre år beviljade från EU. Utlysningen ligger inom området Maskinöversättning, där ett krav har varit att översättningen ska fungera för majoriteten av EU:s officiella språk.

Tekniken i MOLTO baserar sig på så kallad typteori som gör att forskarna på ett pålitligt sätt kan överföra en och samma innebörd från ett mänskligt språk till ett annat. Om man till exempel vill översätta en mening från engelska till finska, åstadkommer man en typteoretisk formel för den engelska innebörden, och formeln skapar sedan ett motsvarande uttryck på finska.

Systemet är tidskrävande att genomföra. Först måste alla ord för användningsområdet in i språkdatabasen. Varje ord ska sedan förses med en typ för de möjliga betydelser som ordet kan ha. Slutligen tar arbetet med att definiera grammatiken vid, där man måste tala om för systemet vilka kombinationer av ”typer” som är möjliga, vilka alternativa uttryck som finns, i vilken form orden kan förekomma och i vilken ordning de ska placeras.

Databasen med grammatiken kallas ”resursgrammatik”. MOLTO bygger på resursgrammatiken och programspråket Grammatical Framework, som Aarne Rantas grupp redan arbetat fram under ett antal år. MOLTO innehåller grammatiska regler för olika språk och hur språkens grammatik står relation till varandra . Som exempel kan man ta den engelska frasen ”What’s your name?” som på svenska översätts till ”Vad heter du?”. I den engelska frasen är ”your name ” subjektet, medan ”du” är subjekt i den svenska frasen. Svenskan har det speciella verbet ”heta” som saknas i engelskan. Sådana kopplingar håller MOLTO koll på.

- Pengarna från EU får vi för att utifrån tekniken i MOLTO skapa något som är användbart för översättning på nätet, säger Aarne Ranta. Som producent av webbsidor ska man kunna ladda ner verktyget med öppen källkod och fritt översätta webbsidor till ett antal olika språk samtidigt. Tekniken finns visserligen redan idag och vi har själva lagt tio år på att utveckla den, men den är krånglig att använda om man inte är datavetare.

Huvudtanken med EU-pengarna är just att anpassa verktyget och göra det användarvänligt för en stor skara användare. Det ska också bli mycket lätt för en användare att själv utöka grammatiken och lägga in nya ord.

I projektet kommer man att utveckla systemet för att passa olika användningsområden. Ett nytt område för översättning är patentsammanfattningar, där människor runt om i världen ska kunna ta del av ny teknik direkt när patentet släpps, utan att behärska det språk som patentbeskrivningen skrivits på. Tidigare har man fått anlita en stor mängd översättare när nya patent har släppts. Ett annat delprojekt handlar om att möta matematiklärares och studenters behov av att skapa en exakt terminologi när man översätter matematiska övningar. Ytterligare ett delprojekt gäller beskrivningar av kulturarv och museiföremål och att man ska kunna ta del av dessa oberoende av vilket språkområde man kommer ifrån.

Även om man inte har engelska som modersmål, får man på ett enkelt sätt tillgång till samma kunskapsmassa som personer från de anglosaxiska länderna. Tidigare var man rädd för att Internets intåg skulle öka engelskans dominans på bekostnad av andra språk, men så har det inte blivit. I det öppna lexikonet Wikipedia finns t.ex. trehundra språk representerade för närvarande. Ju mer MOLTO byggs ut med fler språk, desto mer idealiskt blir det för till exempel Wikipedia, där man kommer att kunna ha exakt samma innehåll på ett stort antal språk.

De universitet som finns med i Multilingual On-Line Translation är Göteborgs universitet som koordinator av projektet, Helsingfors universitet i Finland och Universitat Politècnica de Catalunya, Spanien. Företagen som ingår i projektet är Ontotext AD, Bulgarien och Matrixware GmbH, Österrike.

Kontaktinformation:
Professor Aarne Ranta
Institutionen för data- och informationsteknik
Tel: 031-772 1082

MOLTO:s projektsida

 

AV:

Kontaktinformation

Catharina Jerkbrant, kommunikatör

IT-fakulteten, 412 96 Göteborg

Besöksadress:
Lindholmsplatsen 1

Telefon:
031-772 4898, 0766-18 27 48

Sidansvarig: |Sidan uppdaterades: 2019-08-06
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?