Norsk lyd- og blindeskriftbibliotek (NLB) lanserer nye talesyntesestemmer.
Levert av NLB.
Talesyntese, eller «tekst-til-tale» brukes blant annet til å produsere studielitteratur, slik at blinde, svaksynte og personer med dysleksi eller andre lesevansker skal kunne ta utdanning ved universitet, høgskole og fagskoler.
NLB har nå fått utviklet to nye stemmer, en av disse er landets første talesyntese spesialutviklet for nynorsk med vestnorsk tonefall. Den nynorske stemmen har fått navnet Hulda og er bygget på stemmeinnspillinger lest inn av skuespiller Ane Barmen.
Samtidig med Hulda lanseres nyutviklede Clara, som leser bokmål.
Utviklingen har gått over en lengre periode, og de norske stemmeskuespillerne har brukt flere uker på å lese inn tekst, før databearbeidingen starter. De nye talesyntesene har bedre kvalitet og leser mer naturlig enn før. Da får lånerne bedre produkter med mer naturlig flyt.

Automatisk og rask produksjon
– For NLB er Hulda og Clara verktøy som gir raskere produksjon av lydutgivelser, forteller Mari Myksvoll i NLB. Det er spesielt viktig for aviser og tidsskrifter, som er «ferskvare» og ikke kan leses inn av mennesker på samme måte som skjønnlitteratur. Aviser blir produsert automatisk i løpet av natten slik at de kan leveres ferske hver morgen med opplesing av talesyntese, forklarer Myksvoll. Studielitteratur er også ferskvare og krever rask produksjon. Studenter trenger bøkene i starten av semesteret, ikke en uke før eksamen.
NLB med prosjektleder Myksvoll har jobbet tett med utviklerne av de nye stemmene, selskapet CereProc. Selskapet har blant annet erfaring med å lage stemmer som leser engelsk med flere ulike aksenter.
– Som oppdragsgivere har vi stilt strenge krav og gitt mange tilbakemeldinger underveis. Det var viktig for oss å få stemmer som lånerne opplever som både tydelige og behagelige. Våre studentlånere lytter til lange og ofte kompliserte fagtekster. Det krever mer enn for stemmer som leser opp GPS-anvisninger eller bussholdeplasser. Vi er fornøyde med resultatet, men kommer til å fortsette å forbedre både uttale av enkeltord, forkortelser og spesialtegn. Talesyntesestemmer blir egentlig aldri helt ferdig utviklet, for språket endrer seg og nye ord kommer til hele tiden.
CereProc har mulighet til å selge stemmene videre, slik at de kan brukes i flere sammenhenger. Det er planen at de vil lansere Hulda og Clara som egne apper i løpet av 2021.
Særnorske hensyn
NLB har også samarbeidet med Norsk Språkråd, som er godt kjent med problemstillingene rundt utvikling av talesynteser og talestyring. Benedicte Frostad i Norsk Språkråd har jobbet med utvikling av norske talesynteser for blant andre Google og Nuance. Hun kan fortelle at det er mange særnorske hensyn å ta i en slik utviklingsprosess.
– Den situasjonen vi har i Norge med to offisielle skriftspråk, samtidig som det ikke finnes noe standard talespråk er det ikke så mange andre land som har. Det kan være krevende med tanke på både talesyntese og talegjenkjenning. Det andre er at norsk er et tonespråk, der det noen ganger bare er tonen som gir betydningsmessig forskjell mellom to ord. I vår del av verden er det bare norsk og svensk av større språk som har dette, sier Frostad.
Maskiner må få tydelige regler
Talesyntesene blir utviklet ved hjelp av et såkalt tekstkorpus. Korpusbaserte talesynteser, som Hulda og Clara, blir utviklet ved at et menneske leser inn store mengder tekst. Det er segmenter av dette opptaket som blir satt sammen fortløpende i syntesen.
Maskinlæring er i bruk for å trene opp systemet. En stor del av utviklerjobben er å formulere regler for hvordan talesyntesen skal fungere. En rekke ting må spesifiseres, for eksempel hvordan forkortelser, tall og spesialtegn skal uttrykkes. Et uttaleleksikon spesifiserer uttalen av ordene.
– Noen kaller talesyntese en «irriterende robotstemme». Min erfaring er at de som har lesevansker fort blir vant til talesyntese. For dem er det viktigere om de får tilgang til teksten eller ikke, avslutter Myksvoll.
Om NLB
Norsk lyd- og blindeskriftbibliotek (NLB) er et offentlig bibliotek underlagt Kulturdepartementet. Tilbudet er gratis. NLB produserer og låner ut lydbøker, e-bøker og bøker i punktskrift til mennesker med funksjonsnedsettelser som gjør det vanskelig å lese. Årsaker til å bli låner kan være nedsatt syn, dysleksi eller andre fysiske og kognitive utfordringer som gjør lesing vanskelig. NLB har 100 000 lånere og tilbyr litteratur for barn, ungdom og voksne. Bokutvalget tilsvarer papirbokutvalget i folkebibliotekene og dekker alle sjangre, fra krim og serieromaner, til samtidslitteratur, lyrikk og faktabøker. Tilbudet omfatter aviser og tidsskrifter, og studielitteratur for studenter ved universitet, høgskole og fagskole. Aviser, tidsskrifter og de fleste studiebøkene produseres med talesyntese. Resten blir lest inn i egne studioer eller kjøpt fra kommersielle utgivere. Mer informasjon på www.nlb.no.