SVoG – Norsk storvokabular talegjenkjenner

I samarbeid med NTNU deltar SINTEF i et initielt prosjekt for utvikling av en generell storvokabulars talegjenkjenner for norsk. Aktiviteten er finansiert av Forskningsrådet.

Det tas utgangspunkt i tale, tekst og leksikalske ressurser fra konkursboet til Nordisk Språkteknologi (NST), som nå nylig er blitt gjort tilgjengelig. Utviklingen baseres på bruk av fritt tilgjengelig kildekode, slik at systemet vil være et godt grunnlag for videre forskningsbaserte aktiviteter innen storvokabular talegjenkjenning på norsk.

I dag finnes det ikke et slikt åpent system tilgjengelig i Norge. Kommersielt finnes det heller ikke systemer for generell diktering på norsk, men kun for spesielle domener (sykehussektoren). Dessuten er kommersielle systemer lukket, dvs. ikke egnet som utgangspunkt for videre åpen forskning og utvikling.

Anvendelsesområdene for en slik gjenkjenner vil være mange, med diktering som en ofte etterspurt anvendelse. Også innen telekommunikasjon (selvbetjeningstjenester), dialogsystemer (som f.eks. KUNSTI-prosjektet BRAGE), søk i mediedatabaser og hjelpemidler for funksjonshemmede vil dette ha stor nytte. Et eksempel på sistnevnte er teksting av direktesendte TV-programmer for hørselshemmede.

Selv innen begrensede domener hvor man ønsker at brukeren skal kunne benytte et naturlig språk, vil en storvokabular gjenkjenner ha et stort potensial.

Hovedutfordringene ligger i utviklingen av gode akustiske og statistiske språkmodeller for norsk, som kan gi en høy nok gjenkjenningsrate med akseptabel forsinkelse.

Målsettingen er at aktiviteten tidlig i 2008 skal føre fram til en første demonstrator for generell talegjenkjenning på norsk med et vokabular på minimum 20000 ord.

Kontaktperson:
Erik Harborg
Tlf.: 73 59 31 39


Publisert 17. januar 2008