Gå direkt till innehåll
Petter Ericsson, doktorand vid institutionen för datavetenskap. Foto: Ulrika Bergfors
Petter Ericsson, doktorand vid institutionen för datavetenskap. Foto: Ulrika Bergfors

Pressmeddelande -

Nya formella metoder för språkbehandling i datorn

När datorer behöver representera en menings innebörd används ofta grafer, bestående av noder och kanter, som är beräkningsmässigt svåra att verifiera. Genom att göra grafernas uppbyggnad tydlig kan många av svårigheterna hanteras mycket enklare. Petter Ericson försvarar resultaten i sin avhandling måndagen den 4 februari vid Umeå universitet.

De vanligaste metoderna för automatöversättning, exempelvis Google Translate, är baserade på väldigt enkla regler som utnyttjar enorma mängder data för att skapa goda översättningar, något som gör att översättningar till mindre språk ofta håller betydligt lägre kvalitet. Genom att använda mer komplexa metoder kan man uppnå högre kvalitet med mindre data, men själva databehandlingen kan i stället snabbt ta ohanterligt mycket datorkraft i anspråk.

Hemligheten ligger i att begränsa hur många olika gissningar som måste göras under verifikationsprocessen. I de flesta formella modeller behöver en verifikationsalgoritm gissa både ordning och struktur i grafen i flera olika steg, vilket lätt kan ta exponentiellt lång tid.

I Petter Ericsons modell är i stället både struktur och ordning möjlig att läsa ut direkt, och verifieringen kan anta att ingenting ändras under körning.

Det finns ett antal förutsättningar för att hans formalismer ska kunna användas, vilket begränsar användningsområdena, men preliminära tester ser lovande ut för de semantiska grafer som motiverat arbetet. Grafer används inom många områden, inte bara språkbehandling, och det finns goda förhoppningar för att våra formalismer ska ha andra tillämpningar.

- En central del av resultaten är att vi skapar en direkt koppling mellan

vissa grafer och enklare strukturer för vilka det redan finns välkända effektiva algoritmer. Som bonus blir det relativt självklart att bevisa ett stort antal relaterade egenskaper, även om det i flera fall dykt upp både en och två oväntade komplikationer, säger Petter Ericson.

I förlängningen kan de nya modellerna leda till förbättrad språkförståelse och automatöversättning, men de är så pass generellt uttryckta att de teoretiskt skulle gå att använda i nästan alla områden där grafers struktur och sammansättning behöver verifieras algoritmiskt på ett eller annat sätt.

Petter Ericson kommer från Holmsjön utanför Umeå och har studerat civilingenjörsprogrammet i teknisk datavetenskap vid Umeå universitet.

Läs hela avhandlingen digitalt

Om disputationen:

Måndagen den 4 februari försvarar Petter Ericson, Institutionen för datavetenskap vid Umeå universitet, sin avhandling med titeln: Order-preserving Graph Grammars. Svensk titel: Ordnade grafgrammatiker.
Disputationen äger rum klockan 13:00 i sal MA 121 vid Umeå universitet.
Fakultetsopponent är Professor Sebastian Maneth, Department of Computer Science, University of Bremen.


För mer information, kontakta gärna:

Petter Ericson, Institutionen för datavetenskap
Telefon: 090 786 77 88
E-post: petter.ericson@umu.se

Pressbild

Ämnen

Regioner


Umeå universitet
Umeå universitet är ett av Sveriges största lärosäten med drygt 32 000 studenter och 4300 anställda. Här finns internationellt väletablerad forskning och en stor mångfald av utbildningar. Vårt campus utgör en inspirerande miljö som inbjuder till gränsöverskridande möten – mellan studenter, forskare, lärare och externa parter. Genom samverkan med andra samhällsaktörer bidrar vi till utveckling och stärker kvaliteten i forskning och utbildning.

Kontakter

Ingrid Söderbergh

Ingrid Söderbergh

Forskningssamordnare Forskning vid Umeå Centre for Microbial Research, UCMR 070-60 40 334

Umeå universitet

Umeå universitet är ett bredduniversitet och ett av Sveriges största lärosäten med omkring 38 000 studenter och 4 600 medarbetare. Här finns en mångfald av utbildningar av hög kvalitet och forskning inom alla vetenskapsområden samt det konstnärliga området. Umeå universitet är också platsen för den banbrytande upptäckten av gensaxen CRISPR-Cas9 – en revolution inom gentekniken som tilldelats Nobelpriset i kemi.

Universitetet kännetecknas av en internationell atmosfär och en verksamhet som vilar på akademiska kärnvärden. Våra sammanhållna campus gör det lätt att mötas, samarbeta och utbyta kunskap, något som gynnar en dynamisk och öppen kultur där vi gläds åt varandras framgångar. Umeå universitet sätter en stolthet i att erbjuda en undervisnings- och forskningsmiljö av världsklass och bidrar till ny kunskap av global betydelse där hållbarhetsmålen i Agenda 2030 utgör drivkraft och inspiration. Här finns kreativa och nytänkande forskningsmiljöer som ger goda förutsättningar att ta sig an samhällets framtidsutmaningar. Genom långsiktiga samarbeten med organisationer, näringsliv och andra lärosäten bidrar universitetet till att utveckla norra Sverige som kunskapsregion. Den samhällsomvandling och de stora investeringar som pågår i norra Sverige skapar komplexa utmaningar men också möjligheter. För Umeå universitet handlar det om att bedriva forskning om och mitt i ett samhälle i omvandling samt att fortsätta erbjuda utbildningar för regioner som behöver expandera fort och hållbart.

Campus Umeå och Konstnärligt campus ligger nära Umeås centrum och intill ett av Sveriges största och mest välrenommerade universitetssjukhus. Utbildning bedrivs även på en rad andra orter som Skellefteå, Örnsköldsvik, Lycksele och Kiruna. Vid Umeå universitet finns den högt rankade Designhögskolan, den miljöcertifierade Handelshögskolan och landets enda arkitekthögskola med konstnärlig inriktning. Här finns också Bildmuseet och Umeås science center, Curiosum. Umeå universitet är ett av Sveriges fem riksidrottsuniversitet, har ett internationellt ledande arktiskt centrum och ett centrum för samisk forskning, Várdduo, som är Sveriges enda etablerade forskningsenhet för samisk forskning och urfolksforskning.