talesyntese – Store norske leksikon (original) (raw)
Talesyntese er teknologi som gjør datamaskiner i stand til å lese opp skrevet tekst. Teknologien brukes for eksempel i mobiltelefoner og til opplesning av tekstede TV-programmer og nettsider.
Talesyntese er en form for taleteknologi og er regnet som mindre teknologisk krevende å utvikle enn talegjenkjenning. Kvaliteten av talesyntese bedømmes utfra forståelighet og hvor naturlig talen høres ut.
Det finnes ulike systemer for talesyntese. Skjøtesyntese (også kalt konktatenativ syntese) er et system for å sette sammen lydsegmenter til sammenhengende tale og baserer seg på en database av innspilte taleopptak. Formantsyntese danner tale ved å generere syntetisk lyd på grunnlag av regler for hvilke formanter språkets fonemer er bygget opp av.
Talesyntese krever at teksten som skal leses opp prosesseres i henhold til bestemte regler som omgjør en sekvens av ortografiske tegn og skilletegn til en fonetisk representasjon. For at uttalen skal bli mest mulig naturlig innenfor en på forhånd valgt dialekt, må representasjonen være detaljert nok til å spesifisere ikke bare en sekvens av fonemer som skal gjengis, men også hvordan disse påvirker hverandre innbyrdes (blant annet vil en sekvens av fonemene /r/ og /s/ gjøres om til _sj_-lyden i østnorsk), og hva slags intonasjon som skal gjengis i en bestemt setning.