Speech synthesis (original) (raw)
Hizketaren sintesia giza-hizketaren emaitza artifiziala da. Xede honetarako erabiltzen den sistemari hizketaren sintetizatzaile deritzo, eta egikaritu egin daiteke bai softwarean bai hardwarean. Hizketaren sintesi sistemek, sarritan, TTS, text-to-speech edo testu-ahots bihurtzaile izena hartzen dute testua hizketa bihurtzeko duten gaitasunagatik. Hala ere, bezalako hizketa soilik itzul ditzaketen sistemak ere badaude.
Property | Value |
---|---|
dbo:abstract | تصنيع الكلام أو اصطناع الكلام أو تخليق الكلام هو إنتاج اصطناعي للكلام البشري. ويسمى نظام الكمبيوتر المستخدم لهذا الغرض خطاب كمبيوتر أو توليف الكلام، ويمكن تنفيذها في منتجات البرامج أو الأجهزة. النص إلى كلام (TTS) نظام تحويل لغة النص العادي إلى الكلام؛ أنظمة أخرى تجعل مثل تحويل نسخ لفظي إلى كلام.يمكن إنتاج الكلام المركب بواسطة وصل أجزاء من الحديث المسجل والذي يتم تخزينه في قاعدة بيانات. فالأنظمة تختلف في حجم وحدات تخزين الكلام. كما أن نظام مخازن الهواتف أو diphone يوفر أكبر مجموعة إنتاج صوتي، ولكن قد تفتقر إلى الوضوح. فإستخدماتها محددة المجال، ولتخزين الكلمات أو الجمل بأكملها بحيث يسمح لإنتاج عالي الجودة بدلا من ذلك يمكن للمازج الصوتي أن يدمج نموذج الجهاز الصوتي ذو خصائص أخرى للصوت البشري لإنشاء إخراج صوتي «اصطناعي» تماما.TTS أو Text-to-Speech هي تقنية تكنولوجية لمحاكاة الصوت البشري باستعمال الحاسوب أو أنظمة نطق مختلفة. فالمهمة الرئيسية لمحرك TTS هي تحويل الكلمات المكتوبة أو المخزنة على شكل نصوص إلى كلمات منطوقة بصوت بشري. من أشهر الشركات التي تطور تقنية للغة العربية هي شركة صخر للحاسب الآلي. يتم تقييمها قياساً على التشابه مع صوت الإنسان وقدرته على أن يكون مفهوماً بشكل واضح. يسمح تحويل النص إلى كلام للناس الذين يعانون من ضعف البصر أو إعاقة قراءة للاستماع إلى الأعمال المكتوبة على كمبيوتر المنزل. وشملت العديد من أنظمة تشغيل الكمبيوتر لتخليق الكلام منذ أوائل التسعينات. ويتألف نظام تحويل النص إلى كلام أو «المحرك» من جزئين: معالج الواجهة الأمامية الأمامي . مهام معالج الواجهة الأمامية أولا: أنه يحول النص الخام الذي يحتوي على رموز مثل الأرقام والمختصرات إلى مايعادل كلمات مكتوبة بها. وغالبا ما تسمى هذه العملية تطبيع النص، ما قبل المعالجة، أو ترميز' ' الواجهة الأمامية ثم يعين نسخ لفظي في علوم الكمبيوتر، التحليل المعجمي هو عملية تحويل سلسلة من الأحرف (كما هو الحال في برنامج كمبيوتر أو صفحة ويب) إلى سلسلة من الرموز (سلاسل مع «معنى» محدد) بالنسبة لكل كلمة، والأجزاء، وتحديد النص في وحدة لحنية، مثل شبه جملة شرط، والجملة. ويطلق على عملية تعيين التدوين الصوتي لعبارة أي تحويل النص إلى صوت أو -إلى صوت تحويل. التدوين الصوتي ومعلومات علم العروض التي يشكلون معا التمثيل اللغوي الرمزي الذي يتم إخراجه من قبل الواجهة الأمامية. والواجهة الخلفية، غالبا ما يشار إليها باسم المزج أو التوليف - ثم تقوم بتحويل التمثيل اللغوي الرمزي إلى صوت. في بعض الأنظمة، فإن هذا الجزء يشمل حسابات تستهدف علم العروض "" (درجة الصوت فترات الصوت), وهو بعد ذلك يحدد الخطاب المفترض على الإنتاج الصوتي. (ar) La síntesi de parla és la producció artificial de parla humana. Un sistema usat amb aquest propòsit rep el nom de sintetitzador de parla i es pot dur a terme en programari o en maquinari. La síntesi de veu es diu sovint en anglès text-to-speech (TTS) , en referència a la seva capacitat de convertir text en parla. No obstant això, hi ha sistemes que enlloc de produir veu a partir d'un text ho fan a partir de en parla. La veu sintètica és una veu artificial (no pregravada), generada mitjançant un procés de sintetització de la parla. La qualitat d'una veu sintètica vindrà donada per: * La seva intel·ligibilitat: amb quina facilitat/dificultat és entesa? * La seva naturalitat: en quina mesura s'assembla a la veu real d'un humà? (ca) Syntéza řeči je umělá tvorba lidské řeči. Počítačové programy používané k tomuto účelu se nazývají „syntezátory řeči“. Programy „text na řeč“ (text-to-speech, TTS) produkují řeč z textu psaného běžným jazykem; existují i programy, které jako vstup využívají fonetickou transkripci. Řeč může být tvořena spojováním úseků nahrané řeči, které jsou uloženy v databázi. Takovéto databáze mohou obsahovat např. fóny a difóny nebo celá slova. V prvním případě je kvantita možného výsledku upřednostňována před kvalitou, v druhém je to naopak. Některé syntetizátory mohou řeč tvořit simulací charakteristik lidské řeči a vytvářet tak doslova umělou řeč. Kvalita syntetizátoru řeči se posuzuje podle podobnosti výstupu s lidskou řečí. Schopné programy umožňují lidem se zrakovými vadami nebo poruchami čtení poslouchat psané texty. Mnoho operačních systémů obsahuje syntetizátory řeči od počátku 80. let. (cs) Ο όρος σύνθεση ομιλίας αναφέρεται στην τεχνητή παραγωγή της ανθρώπινης ομιλίας. Το υπολογιστικό σύστημα που χρησιμοποιείται για αυτόν τον σκοπό ονομάζεται συνθετητής ομιλίας, και μπορεί να εφαρμοστεί και σε προϊόντα λογισμικού και σε μηχανήματα υπολογιστών. Ένα σύστημα text-to-speech (TTS), δηλαδή "από-κείμενο-σε-ομιλία", μετατρέπει ένα κανονικό γλωσσικό κείμενο σε ομιλία. Άλλα συστήματα καθιστούν συμβολικές γλωσσικές αναπαραστάσεις, όπως οι φωνητικές καταγραφές, σε ομιλία. Ο συντιθέμενη ομιλία μπορεί να δημιουργηθεί με την συνένωση κομματιών ηχογραφημένου λόγου τα οποία αποθηκεύονται σε κάποια βάση δεδομένων. Τα συστήματα διαφέρουν στο μέγεθος των αποθηκευμένων μονάδων ομιλίας π.χ. ένα σύστημα που αποθηκεύει φώνους ή δίφωναπαρέχει μεγαλύτερη κάλυψη της εξαγόμενης ομιλίας, αλλά μπορεί να στερείται . Για συγκεκριμένους τομείς χρήσης, η αποθήκευση ολόκληρων λέξεων ή προτάσεων μπορεί να παρέχει υψηλής ποιότητας εξαγόμενη ομιλία. Εναλλακτικά, ένας συνθετητής μπορεί να συμπεριλάβει κάποιο μοντέλο της και άλλων χαρακτηριστικών της ανθρώπινης φωνής ώστε να δημιουργήσει ένα εντελώς "συνθετικό" φωνητικό αποτέλεσμα. Η ποιότητα ενός συνθετητή ομιλίας εξαρτάται από την ομοιότητα του με την ανθρώπινη φωνή και από την ικανότητα του να μπορεί να κατανοηθεί. Ένα ευκολονόητο πρόγραμμα text-to-speech επιτρέπει σε ανθρώπους με προβλήματα όρασης ή δυσκολίες ανάγνωσης να ακούν τα γραπτά κείμενά τους στον υπολογιστή του σπιτιού τους. Πολλά λειτουργικά συστήματα ηλεκτρονικών υπολογιστών συμπεριλαμβάνουν συνθετητές ομιλίας από τις αρχές της δεκαετίας του 1990. Ένα σύστημα (ή αλλιώς "μηχανή") text-to-speech αποτελείται από δύο μέρη: το και το . Το μετωπιαίο άκρο εκτελεί δύο βασικές εργασίες. Πρώτα, μετατρέπει το ανεπεξέργαστο κείμενο που περιέχει σύμβολα όπως αριθμούς και συντομεύσεις στις αντίστοιχες λέξεις ολογράφως. Αυτή η διαδικασία ονομάζεται ομαλοποίηση κειμένου, προ-επεξεργασία ή . Έπειτα, το μετωπιαίο άκρο αναθέτει φωνητικές καταγραφές σε κάθε λέξη, και διαιρεί και σηματοδοτεί το κείμενο σε μονάδες, όπως φράσεις και προτάσεις. Η διαδικασία ανάθεσης φωνητικών καταγραφών σε λέξεις ονομάζεται μετατροπή text-to-phoneme (από-κείμενο-σε-φώνημα) ή grapheme-to-phoneme (από-γράφημα-σε-φώνημα). Οι φωνητικές καταγραφές και οι προσωδιακές πληροφορίες αποτελούν την συμβολική γλωσσική αναπαράσταση, η οποία είναι το εξαγόμενο του μετωπιαίου άκρου. Τέλος, το νωτιαίο άκρο- συχνά αναφέρεται και ως ο συνθετητής- μετατρέπει την συμβολική γλωσσική αναπαράσταση σε ήχο. Σε ορισμένα συστήματα, το συγκεκριμένο κομμάτι συμπεριλαμβάνει και τον υπολογισμό της στοχευόμενης προσωδίας (την , τις διάρκειες των φωνημάτων), η οποία στην συνέχεια υπαγορεύεται στην εξαγόμενη ομιλία. (el) Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme. Ein Text-to-Speech-System (TTS) (oder Vorleseautomat) wandelt Fließtext in eine akustische Sprachausgabe. Grundsätzlich lassen sich zwei Ansätze zur Erzeugung von Sprachsignalen unterscheiden. Zum einen kann durch die sogenannte auf Sprachaufnahmen (Samples) zurückgegriffen werden. Zum anderen kann das Signal aber auch durch die sogenannte physiologische (artikulatorische) Modellierung vollständig im Rechner erzeugt werden. Während die ersten Systeme auf Formantsynthesen beruhten, basieren die zurzeit industriell eingesetzten Systeme vorwiegend auf Signalmodellierung. Ein besonderes Problem für die Sprachsynthese ist die Erzeugung einer natürlichen Sprachmelodie (Prosodie). (de) Parolsintezo estas la permaŝina produktado de homa parolo. Parolsintezilo estas ekipaĵo aŭ programaro, kiu ebligas tion. Nuntempe, parolsinteziloj utiligas komputilan teknikon, sed mekanikaj parolsinteziloj havas historion plurcentjaran. En pli malvasta senco, oni komprenas kiel "parolsintezo" la konvertadon de fonetika reprezento de diraĵo en aŭdeblan parolon. Por plene sukcesi, tia fonetika reprezento devas esti kompleta, kun indiko ne nur de la parolsonoj, sed ankaŭ de la intonacio. En pli vasta senco, oni komprenas kiel "parolsintezon" eltekstan parolsintezon (angle: "text-to-speech synthesis"). Tio estas konvertado de skriba teksto al parolo, kio postulas preparan paŝon: la teksto devas unue esti konvertita en fonetikan formon. Necesas tiel konverti ankaŭ ciferojn kaj aliajn neliterajn simbolojn kaj laŭeble ĝuste indiki la intonacion. Ekzistas diversaj metodoj de parolsintezo: * Kunĉeniga sintezo uzas erojn de registrita homa parolo. Oni povus ekzemple registri ĉiun el la vokaloj kaj konsonantoj de esperanto, prononcataj de unu parolanto, kaj kunĉeningi ilin laŭbezone. Tiu metodo tamen tute ne funkcias kontentige, ĉar la transiro inter sinsekvaj parolsonoj devas esti ĝusta por ke la parolo estu komprenebla. En pli sukcesaj metodoj tiaspecaj oni uzas aŭ “difonojn” aŭ pli longajn parolerojn. * Difona sintezo baziĝas sur registritaj versioj de ĉiuj son-sinsekvoj kiuj povas aperi en la sintezata lingvo. Ekzistas metodoj por modifi la prozodiajn ecojn de la registritaj difonoj por ke la daŭro de la parolsonoj kaj la intonacio estu ĝustaj. * Paroler-elekta sintezo (angle: “unit-selection synthesis”) utiligas larĝan datumbazon de registrita parolo, el kiu la plej longaj sinsekvoj, kiuj reaperas en la sintezota teksto, estas elektataj kaj kunĉenigataj. * Laŭregula sintezo ne uzas registritan parolon, sed la akustika signalo estas kreata per modelo de la homa parolproduktado. Tiaj sistemoj do postulas de la konstruantoj abundan kaj ekzaktan scion, kiu estas respegulata en la komprenebleco kaj natureco de la sinteza parolo. Ili baziĝas sur teorio en kiu la parolo estas konsiderata kiel rezulto de filtrado de origina sono. Ĉe plej multaj parolsonoj, la origina sono estiĝas en la laringo, kaj ĝi filtriĝas survoje trans la parolorgano. La ecoj de la filtro, inter kiuj la frekvencoj de la tiel nomataj “formantoj” estas la plej gravaj, varias laŭ la artikulacio. * Formanta sintezo ne simulas la artikulacion mem, sed nur la filtradon, kiun evidentigas studoj de la akustikaj ecoj de la parolo. * Artikulacia sintezo simulas la artikulacion mem. Artikulacia sintezo ankoraŭ ne povas konkurenci kun formanta sintezo, ĉar la akustikaj ecoj de la parolo estas pli bone konataj ol la detaloj de la artikulacio. Kelkaj ekzemploj de eltekstigaj sistemoj estas: * Festivalo * Flite * MBROLA (nur elparolilo) Bonekonataj eksteraj ekipaĵaj aparatoj estas, ekzemple: * Apollo * Double Talk PC Oni stablis pluraj marklingvoj por konverti tekston al elparolebla versio en XML-a formato. La plej tempe proksima estas , proponita de W3C (ankoraŭ en projekta stato nuntempe). Parolsintezaj marklingvoj devas esti distingitaj de dialogaj marklingvoj, kiel , kiu inkluzivas krom TAP markoj etikedojn rilate al parolrekono, dialogo demarŝo kaj per-voĉa telefona diskado. (eo) La síntesis de habla es la producción artificial del habla. El sistema computarizado que es usado con este propósito es llamado computadora de habla o sintetizador de voz y puede ser implementado en productos software o hardware. Un sistema text-to-speech (TTS) convierte el lenguaje de texto normal en habla; otros sistemas recrean la representación simbólica lingüística como transcripciones fonéticas en habla. El habla sintetizada puede ser creada a través de la concatenación de fragmentos de habla grabados que son almacenados en una base de datos. Los sistemas difieren en el tamaño de las unidades de habla almacenadas; un sistema que almacena fonos y difonos permite un mayor rango de sonidos pero carece de claridad. Para usos específicos, el tamaño del almacenamiento de palabras completas u oraciones permite una mayor calidad de audio. De manera alternativa, un sintetizador puede incorporar un modelo de tracto vocal u otras características de la voz humana para recrear completamente una voz "sintética". La calidad de un sintetizador de voz se juzga por la similitud que tenga con la voz humana y su habilidad para ser entendido con claridad. Un programa de conversión de texto en habla inteligible permite que las personas con discapacidades visuales o dificultades para leer puedan escuchar textos en una computadora. Muchos sistemas operativos tienen sintetizadores de voz integrados desde principios de los noventa. Un sistema o "motor" de texto a habla (TTS) está compuesto de dos partes: un front-end y back-end. El front-end tiene dos tareas principales. Primero, convertir el texto con caracteres, números, símbolos y abreviaciones en su equivalente en palabras escritas. Este proceso es llamado como "normalización del texto", "pre-procesamiento" o "tokenización", posteriormente el front-end asigna una transcripción fonética a cada palabra, marca y divide el texto en unidades prosódicas, como frases, cláusulas y oraciones. El proceso de asignar transcripciones fonéticas a las palabras es llamado conversión "texto a fonema" o "grafema a fonema". La información de transcripciones fonéticas o prosódicas preparan la información de la representación simbólica lingüística que es el resultado del front-end. El back-end, comúnmente referido como el "sintetizador", convierte la representación simbólica lingüística en sonido. En algunos sistemas, esta parte incluye el cómputo de "intención prosódica" (tono del perfil, duración de los fonemas), el cual es implementado en la voz de salida. (es) Hizketaren sintesia giza-hizketaren emaitza artifiziala da. Xede honetarako erabiltzen den sistemari hizketaren sintetizatzaile deritzo, eta egikaritu egin daiteke bai softwarean bai hardwarean. Hizketaren sintesi sistemek, sarritan, TTS, text-to-speech edo testu-ahots bihurtzaile izena hartzen dute testua hizketa bihurtzeko duten gaitasunagatik. Hala ere, bezalako hizketa soilik itzul ditzaketen sistemak ere badaude. (eu) La synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.Il s'agit, comme la reconnaissance vocale, d'une technologie permettant de construire des interfaces vocales. Parmi les applications, on peut citer la vocalisation d'écrans informatiques pour les personnes aveugles ou fortement malvoyantes (lecteur d'écran), ainsi que de nombreuses applications de serveurs vocaux téléphoniques, comme les annuaires vocaux de grande taille, où la synthèse vocale est la seule technique viable pour permettre la restitution sonore des noms et des adresses des abonnés. (fr) Sintesis bunyi atau ujaran sintesis adalah ucapan buatan manusia. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut ujaran sintesis, dan dapat diimplementasikan dalam perangkat lunak atau produk perangkat keras. Sistem text-to-speech (TTS) mengonversi teks bahasa normal menjadi bicara; sistem lain membuat representasi linguistik simbolis seperti transkripsii fonetik dalam pembicaraan. (in) Speech synthesis is the artificial production of human speech. A computer system used for this purpose is called a speech synthesizer, and can be implemented in software or hardware products. A text-to-speech (TTS) system converts normal language text into speech; other systems render symbolic linguistic representations like phonetic transcriptions into speech. The reverse process is speech recognition. Synthesized speech can be created by concatenating pieces of recorded speech that are stored in a database. Systems differ in the size of the stored speech units; a system that stores phones or diphones provides the largest output range, but may lack clarity. For specific usage domains, the storage of entire words or sentences allows for high-quality output. Alternatively, a synthesizer can incorporate a model of the vocal tract and other human voice characteristics to create a completely "synthetic" voice output. The quality of a speech synthesizer is judged by its similarity to the human voice and by its ability to be understood clearly. An intelligible text-to-speech program allows people with visual impairments or reading disabilities to listen to written words on a home computer. Many computer operating systems have included speech synthesizers since the early 1990s. A text-to-speech system (or "engine") is composed of two parts: a front-end and a back-end. The front-end has two major tasks. First, it converts raw text containing symbols like numbers and abbreviations into the equivalent of written-out words. This process is often called text normalization, pre-processing, or tokenization. The front-end then assigns phonetic transcriptions to each word, and divides and marks the text into prosodic units, like phrases, clauses, and sentences. The process of assigning phonetic transcriptions to words is called text-to-phoneme or grapheme-to-phoneme conversion. Phonetic transcriptions and prosody information together make up the symbolic linguistic representation that is output by the front-end. The back-end—often referred to as the synthesizer—then converts the symbolic linguistic representation into sound. In certain systems, this part includes the computation of the target prosody (pitch contour, phoneme durations), which is then imposed on the output speech. (en) 음성 합성(音聲合成, speech synthesis)은 말소리의 음파를 기계가 자동으로 만들어 내는 기술로, 간단히 말하면 모델로 선정된 한 사람의 말소리를 녹음하여 일정한 음성 단위로 분할한 다음, 부호를 붙여 합성기(speech computer, speech synthesizer)에 입력하였다가 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. TTS(text-to-speech)라고도 한다. 음성의 분절음을 합성하는 것은 어렵고 결과가 좋지 않기에, 분절음의 경계를 중심으로 앞 음성의 뒷부분과 뒤 음성의 앞부분을 함께 기록하여 이를 토대로 음성 합성을 하기도 한다. 이러한 이음 처리를 diphone 처리라고 한다. 음성 인식과 함께 번역 기계, 로봇 제조 기술 등 여러 곳에서 다양하게 쓰이고 있다. (ko) Spraaksynthese is het kunstmatig produceren van menselijke spraak. Ook wel: Text-to-Speech (TTS), Computerstem, Tekst-naar-Spraak, kunstmatige spraak.Het is onder meer een onderzoeksgebied binnen de kunstmatige intelligentie. Met behulp van spraaksynthese-software wordt geschreven (orthografische of fonetische) tekst omgezet in gesproken tekst. Het doel van spraaksynthese-software is om menselijke spraak zo goed mogelijk na te bootsen. (nl) 音声合成(おんせいごうせい、英: speech synthesis)とは、人間の音声を人工的に作り出すことである。 (ja) La sintesi vocale (in inglese speech synthesis) è la tecnica per la riproduzione artificiale della voce umana. Un sistema usato per questo scopo è detto sintetizzatore vocale e può essere realizzato tramite software o via hardware. I sistemi di sintesi vocale sono noti anche come sistemi text-to-speech (TTS) (in italiano: da testo a voce) per la loro possibilità di convertire il testo in parlato. Esistono inoltre sistemi in grado di convertire simboli fonetici in parlato. Il processo inverso è chiamato riconoscimento vocale. La sintesi vocale si può realizzare concatenando registrazioni di parti vocali memorizzate in un database. I vari sistemi di sintesi vocale si differenziano a seconda delle dimensioni dei campioni vocali memorizzati: un sistema che memorizza singoli fonemi o fonemi doppi consente di ottenere il numero massimo di combinazioni a discapito della chiarezza complessiva, mentre in altri sistemi concepiti per un impiego specifico si ricorre alla registrazione di parole intere o di intere frasi per ottenere un risultato di qualità elevata. In alternativa, un sintetizzatore può incorporare un modello dei tratti vocali e di altre caratteristiche umane per creare una voce completamente di sintesi. La qualità di un sintetizzatore vocale si valuta sulla base sia della somiglianza con la voce umana che con il suo livello di comprensibilità. Un programma di conversione da testo a voce con una buona resa può avere un ruolo importante nell'accessibilità, per esempio consentendo a persone con problemi di vista o di dislessia di ascoltare documenti scritti sul computer. Per questo tipo di applicazione fin dai primi anni ottanta molti sistemi operativi includono funzioni di sintesi vocale. (it) Síntese de fala é o processo de produção artificial de fala humana. Um sistema informático utilizado para este propósito é denominado sintetizador de fala, e pode ser implementado em software ou hardware. Um sistema texto-fala (TTS, na sigla em inglês) converte texto ortográfico em fala. Outros sistemas interpretam (como transcrição fonética) em fala. Fala sintetizada pode ser criada concatenando-se pedaços de fala gravada, armazenada num banco de dados. Os sistemas diferem no tamanho das unidades de fala armazenada. Um sistema que armazene fones ou alofones fornecem a maior faixa de saída, mas podem carecer de clareza. Para usos específicos, o armazenamento de palavras ou frases inteiras possibilita uma saída de alta qualidade. Alternativamente, um sintetizador pode incorporar um modelo do (caminho percorrido pela fala) e outras características da fala humana, para criar como saída uma fala completamente "sintética". A qualidade de um sintetizador de fala é determinada por sua similaridade com a fala humana e por sua capacidade de ser entendida. Um programa TTS inteligível permite que pessoas com deficiência visual ou com dificuldades de leitura possam ouvir obras escritas em um computador pessoal. Muitos sistemas operacionais têm incluído capacidade de síntese de fala desde o início da década de 1990. Na década de 1990, surgiram sistemas que fazem a operação inversa de converter fala para texto ortográfico. Um sistema texto-fala é composto de duas partes: um front-end e um back-end. O front-end tem duas tarefas principais. Primeiro, converter texto bruto contendo símbolos como números e abreviações no equivalente de palavras escritas. Este processo é muitas vezes chamado de normalização de texto, pré-processamento ou tokenização. Depois, atribuir transcrições fonéticas a cada palavra e dividir e marcar o texto em unidades como sentenças, frases e cláusulas. Este processo é chamado de conversão de texto para fonema ou grafema para fonema. As transcrições fonéticas e as informações da prosódia compõem a representação lingüística simbólica que é produzida pelo front-end. Então, o back-end (muitas vezes referido como o sintetizador) converte a representação lingüística simbólica em som. Em certos sistemas, esta parte inclui a computação da prosódia (contorno de tom, durações de fonemas), que é então imposta na fala de saída. (pt) Synteza mowy – dział przetwarzania mowy polegający na mechanicznej zamianie tekstu zapisanego w postaci znakowej na wypowiedź (mowę) w postaci dźwiękowej. Maszynę lub program komputerowy zamieniający tekst na mowę określa się mianem syntezatora mowy. W zależności od syntezatora, możemy uzyskać bardzo dokładną wymowę także słów nietypowych, literowanie różnych skrótów, odczytywanie liczb w tym również ułamków oraz odczytywanie dat poprzez dekomponowanie liczb. Syntezatory mowy mają wiele zastosowań. Pozwalają na zautomatyzowanie informowania bądź alarmowania użytkownika, są pomocne przy nauce języków obcych oraz tłumaczeniach, mogą także np. odczytywać dokumenty pisane alfabetem Brailla. (pl) Talsyntes (ofta även text-till-tal eller TTS, efter det engelska Text to speech) är namnet för tekniker för att skapa artificiellt tal för att efterlikna människans röst skapat med datorer. Talsyntes kan implementeras både i programvara och maskinvara. Man kan dela in talsyntes i två huvudtyper: 1. * En maskin som ska kunna läsa upp meningar i ett särskilt sammanhang, var och en bestående av ett antal förinspelade ord ur en begränsad mängd. 2. * En maskin som ska kunna läsa upp en tidigare okänd text på ett sätt som är rätt, tydligt samt behagligt att lyssna på. (sv) Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам; в узком смысле — формирование речевого сигнала по печатному[уточнить] тексту. Часть искусственного интеллекта. Синтезом речи прежде всего называется всё, что связано с искусственным производством человеческой речи. Синтезатор речи — структура, способная переводить текст/образы в речь, в программном обеспечении и/или аппаратных средствах. Голосовой движок — непосредственно система/ядро преобразования текста/команд в речь, это также может существовать независимо от компьютера. (ru) Си́нтез мо́влення (СМ) — перетворення друкарського тексту на мовний сигнал (в широкому сенсі — відновлення форми мовного сигналу за його параметрами. Комп'ютерна система, що здійснює синтез мовлення, називається синтезатором мовлення, (СМ) та може бути побудованою на основі програмного чи апаратного рішення. Система що спроможна виконувати конвертування нормального друкованого тексту на аудіо в реальному часі називається текст-у-мовлення (ТУМ, англ. text-to-speech, TTS). (uk) 語音合成是將人類語音用人工的方式所產生。若是將電腦系統用在語音合成上,則稱為語音合成器,而語音合成器可以用軟/硬體所實現。文字轉語音(Text-To-Speech,TTS)系統則是將一般語言的文字轉換為語音,其他的系統可以描繪語言符號的表示方式,就像音標轉換至語音一樣。 而合成後的語音則是利用在資料庫內的許多已錄好的語音連接起來。系統則因為儲存的語音單元大小不同而有所差異,若是要儲存phone以及diphone的話,系統必須提供大量的儲存空間,但是在語意上或許會不清楚。而用在特定的使用領域上,儲存整字或整句的方式可以達到高品質的語音輸出。另外,包含了聲道模型以及其他的人類聲音特徵參數的合成器則可以創造出完整的合成聲音輸出。 一個語音合成器的品質通常是決定於人聲的相似度以及語意是否能被了解。一個清晰的文字轉語音程式應該提供人類在視覺受到傷害或是得到失讀症時,能夠聽到並且在個人電腦上完成工作。從80年代早期開始,許多的電腦作業系統已經包含了語音合成器了。 (zh) |
dbo:soundRecording | dbr:Speech_synthesis__Sound__1 |
dbo:thumbnail | wiki-commons:Special:FilePath/TTS_System.svg?width=300 |
dbo:wikiPageExternalLink | https://www.youtube.com/watch%3Fv=CE6zy8aUwtQ https://www.youtube.com/watch%3Fv=SNqNM6Ccck8 |
dbo:wikiPageID | 42799 (xsd:integer) |
dbo:wikiPageLength | 74331 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1124161934 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Bellows dbr:Pressburg dbr:Roger_Bacon dbr:Samsung dbr:Electronics dbr:Milton_(game) dbr:Natural_language_processing dbr:Shoot_'em_up dbr:Telesensory_Systems dbr:Index_(database) dbr:Bell_Laboratories dbr:Bell_Labs dbr:Bishnu_S._Atal dbr:Deep_neural_network dbr:Denmark dbr:Dennis_H._Klatt dbr:Application_software dbr:Arcade_game dbc:History_of_human–computer_interaction dbr:Daisy_Bell dbr:Ulysses_S._Grant dbr:University_of_Brasília dbr:University_of_Calgary dbr:University_of_Portsmouth dbr:University_of_Washington dbr:Visual_impairment dbr:Voice_cloning dbr:Voice_quality dbr:Vowel dbr:Decision_tree dbr:Deep_learning_speech_synthesis dbr:Input_method dbr:Intelligibility_(communication) dbr:Intellivoice dbr:Number dbr:AT&T_Bell_Laboratories dbr:15.ai dbc:Applications_of_artificial_intelligence dbc:Speech_synthesis dbr:Command-line_interface dbr:Commodore_International dbr:Mattel dbr:Run_time_(program_lifecycle_phase) dbr:Russian_Academy_of_Sciences dbr:SIGGRAPH dbr:General_Instrument_SP0256 dbr:Louis_Gerstman dbr:Noise dbr:Text_normalization dbr:Reading_machine dbr:Electronic_game dbr:EnTourage_eDGe dbr:Free_Software_Foundation dbr:French_language dbr:Front_and_back_ends dbr:Garmin dbr:Germany dbr:Global_Positioning_System dbr:Gnuspeech dbr:Google dbr:Google_Toolbar dbr:Morpheme dbr:My_Little_Pony:_Friendship_Is_Magic dbr:Nagoya_University dbr:Concatenative_synthesis dbr:Conference_on_Neural_Information_Processing_Systems dbr:Context-sensitive_grammar dbr:1939_New_York_World's_Fair dbr:Android_(operating_system) dbr:Anime dbr:Ann_Syrdal dbr:AppleScript dbr:Apple_Computer dbr:Liaison_(French) dbr:MBROLA dbr:Mac_OS_X_Leopard dbr:Mac_OS_X_Snow_Leopard dbr:Mac_OS_X_Tiger dbr:Macintosh dbr:Chipset dbr:Signal_processing dbr:Biglobe dbr:Stealth_game dbr:Steve_Jobs dbr:Stratovox dbr:Clause dbr:Comparison_of_speech_synthesizers dbr:Computer_hardware dbr:Embedded_system dbr:Franklin_S._Cooper dbr:Fumitada_Itakura dbr:Fundamental_frequency dbr:Data_storage_device dbr:David_Bowman_(Space_Odyssey) dbr:Icophone dbr:Parsec_(video_game) dbr:Phonetic dbr:Phrase dbr:Pitch_(music) dbr:Plug-in_(computing) dbr:Podcast dbr:Speak_&_Spell_(toy) dbr:Spectrogram dbr:Speech dbr:Synthetic_phonics dbr:Max_Mathews dbr:Microsoft_Speech_Server dbr:BBC dbr:BBC_Micro dbc:Assistive_technology dbr:Timbre dbr:Tokenization_(lexical_analysis) dbr:TomTom dbr:Transfer_learning dbr:Twilight_Sparkle dbr:UK dbr:W3C dbr:Web_applications dbr:Web_browser dbr:Windows_2000 dbr:Windows_95 dbr:Windows_98 dbr:GLaDOS dbr:Code_Geass:_Lelouch_of_the_Rebellion_R2 dbr:HAL_9000 dbr:Line_spectral_pairs dbr:Linear_prediction dbr:Linear_predictive_coding dbr:Linguistics dbr:Lip_sync dbr:Vocoder dbr:Wolfgang_von_Kempelen's_Speaking_Machine dbr:Speech-generating_device dbr:Speech_processing dbr:Additive_synthesis dbr:Albertus_Magnus dbr:Alvin_Liberman dbr:Amazon_Alexa dbr:Amazon_Kindle dbr:Amiga dbr:AmigaOS dbr:DECtalk dbr:Dyslexia dbr:ESpeak dbr:Alpiner_(video_game) dbr:Alternation_(linguistics) dbr:Facial_expressions dbr:Festival_Speech_Synthesis_System dbr:Formants dbr:Nippon_Telegraph_and_Telephone dbr:NortonLifeLock dbr:Diphone dbr:Formant dbr:Grapheme dbr:Frequency_spectrum dbr:Text_corpus dbr:Fluttershy dbr:Video_game dbr:Part-of-speech_tagging dbr:Pronunciation dbr:Prosody_(linguistics) dbr:Reading_disability dbr:Real-time_computing dbr:Screen_reader dbr:Speaker_recognition dbr:Speech_recognition dbr:W3C_recommendation dbr:2001:_A_Space_Odyssey_(novel) dbr:Haskins_Laboratories dbr:International_Phonetic_Alphabet dbr:Intonation_(linguistics) dbr:Texas_Instruments dbr:The_Bronx dbr:Arthur_C._Clarke dbr:Assistive_technology dbr:Atari,_Inc. dbr:Atari_2600 dbr:Atari_5200 dbr:Atari_ST dbc:Computational_linguistics dbr:A_cappella dbr:Abbreviation dbr:Charles_Wheatstone dbr:Chinese_speech_synthesis dbr:Language dbr:Sunsoft dbr:TI-99/4A dbr:Codec dbr:Heteronym_(linguistics) dbr:Heuristic dbr:Hidden_Markov_model dbr:Homer_Dudley dbr:Homograph dbr:Word dbr:Text_to_speech_in_digital_television dbr:Digital_signal_processing dbr:Discrete_cosine_transform dbr:Doctor_Who dbr:Articulatory_synthesis dbc:Auditory_displays dbr:Philip_Rubin dbr:Phonation dbr:Phone_(phonetics) dbr:Phoneme dbr:Phonemic_orthography dbr:Phonetic_transcription dbr:Pitch_contour dbr:PlainTalk dbr:Portal_(series) dbr:Software_Automatic_Mouth dbr:Software_as_a_service dbr:Speech_coding dbr:Freeware dbr:Human_image_synthesis dbr:Personal_computer_game dbr:The_Voder dbr:IBM dbr:IBM_ViaVoice dbr:Intellivision dbr:Michael_J._Freeman dbr:Microprocessor dbr:Microsoft_Narrator dbr:Microsoft_Windows dbr:Milton_Bradley_Company dbr:National_Semiconductor dbr:NeXT dbr:Ogg dbr:Open-source_software dbr:Operating_system dbr:Orca_(assistive_technology) dbr:RSS dbr:Sega dbr:Christian_Gottlieb_Kratzenstein dbr:Wolfgang_von_Kempelen dbr:XML dbr:Yamaha dbr:Yamaha_FS1R dbr:MUSA_(MUltichannel_Speaking_Automaton) dbr:Magellan_Navigation dbr:Markup_language dbr:Maximum_likelihood dbr:SABLE dbr:Speech_Application_Programming_Interface dbr:Speech_Synthesis_Markup_Language dbr:Spelling dbr:Semantics dbr:Sentence_(linguistics) dbr:Software dbr:OS/2_Warp dbr:Voice_(phonetics) dbr:Waveform dbr:Symbolic_linguistic_representation dbr:Euphonia_(device) dbr:IBM_704 dbr:Quadrun dbr:Plosive dbr:Tenth_Doctor dbr:Readspeaker dbr:Gigabyte dbr:Manfred_R._Schroeder dbr:VoiceOver dbr:Votrax dbr:Paperless_office dbr:Phonotactics dbr:Physical_modelling_synthesis dbr:Sinewave_synthesis dbr:Syllable dbr:John_Larry_Kelly,_Jr dbr:Pattern_playback dbr:Texas_Instruments_LPC_Speech_Chips dbr:Rhotic_and_non-rhotic_accents dbr:PSOLA dbr:Silent_speech_interface dbr:VoiceXML dbr:Vocal_tract dbr:Electrotechnical_Laboratory dbr:MacinTalk dbr:Macintalk dbr:Waveforms dbr:Dysphonic dbr:E-book_readers dbr:Handheld dbr:PET_2001 dbr:E-mail_client dbr:Video_arcade dbr:Cost-performance_ratio dbr:General_Instrument_SP0256-AL2 dbr:PocketBook_eReader dbr:Silvester_II dbr:Call_centers dbr:Forrest_Mozer dbr:Voice_output_communication_aid dbr:Baidu_Research dbr:Berzerk_(arcade_game) dbr:Comparison_of_screen_readers dbr:Brazen_Head dbr:Speak_&_Spell_(game) dbr:Speech_impairment dbr:JSML dbr:File:Stephen_Hawking.StarChild.jpg |
dbp:description | A synthetic voice announcing an arriving train in Sweden. (en) |
dbp:filename | JärDa-utrop.ogg (en) |
dbp:format | dbr:Ogg |
dbp:title | Automatic announcement (en) |
dbp:wikiPageUsesTemplate | dbt:As_of dbt:Authority_control dbt:Citation_needed dbt:Columns-list dbt:Commons_category-inline dbt:Curlie dbt:IPA dbt:Listen dbt:Main dbt:Main_article dbt:Reflist dbt:See_also dbt:Short_description dbt:Speech_synthesis dbt:Third-party_inline dbt:Excerpt dbt:Natural_Language_Processing dbt:Sound_synthesis_types |
dcterms:subject | dbc:History_of_human–computer_interaction dbc:Applications_of_artificial_intelligence dbc:Speech_synthesis dbc:Assistive_technology dbc:Computational_linguistics dbc:Auditory_displays |
gold:hypernym | dbr:Production |
rdf:type | owl:Thing dbo:Company yago:WikicatArtificialIntelligenceApplications yago:WikicatAuditoryDisplays yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Application106570110 yago:Browser106571301 yago:CausalAgent100007347 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Demonstration106879180 yago:Display106879521 yago:Event100029378 yago:Intellectual109621545 yago:LivingThing100004258 yago:Object100002684 yago:Organism100004475 yago:Person100007846 yago:PhysicalEntity100001930 yago:Program106568978 yago:PsychologicalFeature100023100 yago:Work100575741 yago:Writing106359877 yago:WrittenCommunication106349220 yago:YagoLegalActor yago:YagoLegalActorGeo yago:YagoPermanentlyLocatedEntity dbo:MusicGenre yago:Software106566077 yago:Synthesist110687231 yago:Undertaking100795720 yago:VisualCommunication106873252 yago:Whole100003553 yago:WikicatFreeSoftwareProjects yago:WikicatSynthesizers |
rdfs:comment | Hizketaren sintesia giza-hizketaren emaitza artifiziala da. Xede honetarako erabiltzen den sistemari hizketaren sintetizatzaile deritzo, eta egikaritu egin daiteke bai softwarean bai hardwarean. Hizketaren sintesi sistemek, sarritan, TTS, text-to-speech edo testu-ahots bihurtzaile izena hartzen dute testua hizketa bihurtzeko duten gaitasunagatik. Hala ere, bezalako hizketa soilik itzul ditzaketen sistemak ere badaude. (eu) Sintesis bunyi atau ujaran sintesis adalah ucapan buatan manusia. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut ujaran sintesis, dan dapat diimplementasikan dalam perangkat lunak atau produk perangkat keras. Sistem text-to-speech (TTS) mengonversi teks bahasa normal menjadi bicara; sistem lain membuat representasi linguistik simbolis seperti transkripsii fonetik dalam pembicaraan. (in) 음성 합성(音聲合成, speech synthesis)은 말소리의 음파를 기계가 자동으로 만들어 내는 기술로, 간단히 말하면 모델로 선정된 한 사람의 말소리를 녹음하여 일정한 음성 단위로 분할한 다음, 부호를 붙여 합성기(speech computer, speech synthesizer)에 입력하였다가 지시에 따라 필요한 음성 단위만을 다시 합쳐 말소리를 인위로 만들어내는 기술이다. TTS(text-to-speech)라고도 한다. 음성의 분절음을 합성하는 것은 어렵고 결과가 좋지 않기에, 분절음의 경계를 중심으로 앞 음성의 뒷부분과 뒤 음성의 앞부분을 함께 기록하여 이를 토대로 음성 합성을 하기도 한다. 이러한 이음 처리를 diphone 처리라고 한다. 음성 인식과 함께 번역 기계, 로봇 제조 기술 등 여러 곳에서 다양하게 쓰이고 있다. (ko) Spraaksynthese is het kunstmatig produceren van menselijke spraak. Ook wel: Text-to-Speech (TTS), Computerstem, Tekst-naar-Spraak, kunstmatige spraak.Het is onder meer een onderzoeksgebied binnen de kunstmatige intelligentie. Met behulp van spraaksynthese-software wordt geschreven (orthografische of fonetische) tekst omgezet in gesproken tekst. Het doel van spraaksynthese-software is om menselijke spraak zo goed mogelijk na te bootsen. (nl) 音声合成(おんせいごうせい、英: speech synthesis)とは、人間の音声を人工的に作り出すことである。 (ja) Synteza mowy – dział przetwarzania mowy polegający na mechanicznej zamianie tekstu zapisanego w postaci znakowej na wypowiedź (mowę) w postaci dźwiękowej. Maszynę lub program komputerowy zamieniający tekst na mowę określa się mianem syntezatora mowy. W zależności od syntezatora, możemy uzyskać bardzo dokładną wymowę także słów nietypowych, literowanie różnych skrótów, odczytywanie liczb w tym również ułamków oraz odczytywanie dat poprzez dekomponowanie liczb. Syntezatory mowy mają wiele zastosowań. Pozwalają na zautomatyzowanie informowania bądź alarmowania użytkownika, są pomocne przy nauce języków obcych oraz tłumaczeniach, mogą także np. odczytywać dokumenty pisane alfabetem Brailla. (pl) Talsyntes (ofta även text-till-tal eller TTS, efter det engelska Text to speech) är namnet för tekniker för att skapa artificiellt tal för att efterlikna människans röst skapat med datorer. Talsyntes kan implementeras både i programvara och maskinvara. Man kan dela in talsyntes i två huvudtyper: 1. * En maskin som ska kunna läsa upp meningar i ett särskilt sammanhang, var och en bestående av ett antal förinspelade ord ur en begränsad mängd. 2. * En maskin som ska kunna läsa upp en tidigare okänd text på ett sätt som är rätt, tydligt samt behagligt att lyssna på. (sv) Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам; в узком смысле — формирование речевого сигнала по печатному[уточнить] тексту. Часть искусственного интеллекта. Синтезом речи прежде всего называется всё, что связано с искусственным производством человеческой речи. Синтезатор речи — структура, способная переводить текст/образы в речь, в программном обеспечении и/или аппаратных средствах. Голосовой движок — непосредственно система/ядро преобразования текста/команд в речь, это также может существовать независимо от компьютера. (ru) Си́нтез мо́влення (СМ) — перетворення друкарського тексту на мовний сигнал (в широкому сенсі — відновлення форми мовного сигналу за його параметрами. Комп'ютерна система, що здійснює синтез мовлення, називається синтезатором мовлення, (СМ) та може бути побудованою на основі програмного чи апаратного рішення. Система що спроможна виконувати конвертування нормального друкованого тексту на аудіо в реальному часі називається текст-у-мовлення (ТУМ, англ. text-to-speech, TTS). (uk) 語音合成是將人類語音用人工的方式所產生。若是將電腦系統用在語音合成上,則稱為語音合成器,而語音合成器可以用軟/硬體所實現。文字轉語音(Text-To-Speech,TTS)系統則是將一般語言的文字轉換為語音,其他的系統可以描繪語言符號的表示方式,就像音標轉換至語音一樣。 而合成後的語音則是利用在資料庫內的許多已錄好的語音連接起來。系統則因為儲存的語音單元大小不同而有所差異,若是要儲存phone以及diphone的話,系統必須提供大量的儲存空間,但是在語意上或許會不清楚。而用在特定的使用領域上,儲存整字或整句的方式可以達到高品質的語音輸出。另外,包含了聲道模型以及其他的人類聲音特徵參數的合成器則可以創造出完整的合成聲音輸出。 一個語音合成器的品質通常是決定於人聲的相似度以及語意是否能被了解。一個清晰的文字轉語音程式應該提供人類在視覺受到傷害或是得到失讀症時,能夠聽到並且在個人電腦上完成工作。從80年代早期開始,許多的電腦作業系統已經包含了語音合成器了。 (zh) تصنيع الكلام أو اصطناع الكلام أو تخليق الكلام هو إنتاج اصطناعي للكلام البشري. ويسمى نظام الكمبيوتر المستخدم لهذا الغرض خطاب كمبيوتر أو توليف الكلام، ويمكن تنفيذها في منتجات البرامج أو الأجهزة. النص إلى كلام (TTS) نظام تحويل لغة النص العادي إلى الكلام؛ أنظمة أخرى تجعل مثل تحويل نسخ لفظي إلى كلام.يمكن إنتاج الكلام المركب بواسطة وصل أجزاء من الحديث المسجل والذي يتم تخزينه في قاعدة بيانات. فالأنظمة تختلف في حجم وحدات تخزين الكلام. كما أن نظام مخازن الهواتف أو diphone يوفر أكبر مجموعة إنتاج صوتي، ولكن قد تفتقر إلى الوضوح. فإستخدماتها محددة المجال، ولتخزين الكلمات أو الجمل بأكملها بحيث يسمح لإنتاج عالي الجودة بدلا من ذلك يمكن للمازج الصوتي أن يدمج نموذج الجهاز الصوتي ذو خصائص أخرى للصوت البشري لإنشاء إخراج صوتي «اصطناعي» تماما.TTS أو Text-to-Speech هي تقنية تكنولوجية لمحاكاة الصوت البشري باستعم (ar) La síntesi de parla és la producció artificial de parla humana. Un sistema usat amb aquest propòsit rep el nom de sintetitzador de parla i es pot dur a terme en programari o en maquinari. La síntesi de veu es diu sovint en anglès text-to-speech (TTS) , en referència a la seva capacitat de convertir text en parla. No obstant això, hi ha sistemes que enlloc de produir veu a partir d'un text ho fan a partir de en parla. La veu sintètica és una veu artificial (no pregravada), generada mitjançant un procés de sintetització de la parla. La qualitat d'una veu sintètica vindrà donada per: (ca) Syntéza řeči je umělá tvorba lidské řeči. Počítačové programy používané k tomuto účelu se nazývají „syntezátory řeči“. Programy „text na řeč“ (text-to-speech, TTS) produkují řeč z textu psaného běžným jazykem; existují i programy, které jako vstup využívají fonetickou transkripci. Řeč může být tvořena spojováním úseků nahrané řeči, které jsou uloženy v databázi. Takovéto databáze mohou obsahovat např. fóny a difóny nebo celá slova. V prvním případě je kvantita možného výsledku upřednostňována před kvalitou, v druhém je to naopak. Některé syntetizátory mohou řeč tvořit simulací charakteristik lidské řeči a vytvářet tak doslova umělou řeč. (cs) Ο όρος σύνθεση ομιλίας αναφέρεται στην τεχνητή παραγωγή της ανθρώπινης ομιλίας. Το υπολογιστικό σύστημα που χρησιμοποιείται για αυτόν τον σκοπό ονομάζεται συνθετητής ομιλίας, και μπορεί να εφαρμοστεί και σε προϊόντα λογισμικού και σε μηχανήματα υπολογιστών. Ένα σύστημα text-to-speech (TTS), δηλαδή "από-κείμενο-σε-ομιλία", μετατρέπει ένα κανονικό γλωσσικό κείμενο σε ομιλία. Άλλα συστήματα καθιστούν συμβολικές γλωσσικές αναπαραστάσεις, όπως οι φωνητικές καταγραφές, σε ομιλία. (el) Unter Sprachsynthese versteht man die künstliche Erzeugung der menschlichen Sprechstimme. Ein Text-to-Speech-System (TTS) (oder Vorleseautomat) wandelt Fließtext in eine akustische Sprachausgabe. Grundsätzlich lassen sich zwei Ansätze zur Erzeugung von Sprachsignalen unterscheiden. Zum einen kann durch die sogenannte auf Sprachaufnahmen (Samples) zurückgegriffen werden. Zum anderen kann das Signal aber auch durch die sogenannte physiologische (artikulatorische) Modellierung vollständig im Rechner erzeugt werden. Während die ersten Systeme auf Formantsynthesen beruhten, basieren die zurzeit industriell eingesetzten Systeme vorwiegend auf Signalmodellierung. (de) Parolsintezo estas la permaŝina produktado de homa parolo. Parolsintezilo estas ekipaĵo aŭ programaro, kiu ebligas tion. Nuntempe, parolsinteziloj utiligas komputilan teknikon, sed mekanikaj parolsinteziloj havas historion plurcentjaran. En pli malvasta senco, oni komprenas kiel "parolsintezo" la konvertadon de fonetika reprezento de diraĵo en aŭdeblan parolon. Por plene sukcesi, tia fonetika reprezento devas esti kompleta, kun indiko ne nur de la parolsonoj, sed ankaŭ de la intonacio. Ekzistas diversaj metodoj de parolsintezo: Kelkaj ekzemploj de eltekstigaj sistemoj estas: (eo) La síntesis de habla es la producción artificial del habla. El sistema computarizado que es usado con este propósito es llamado computadora de habla o sintetizador de voz y puede ser implementado en productos software o hardware. Un sistema text-to-speech (TTS) convierte el lenguaje de texto normal en habla; otros sistemas recrean la representación simbólica lingüística como transcripciones fonéticas en habla. (es) La synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.Il s'agit, comme la reconnaissance vocale, d'une technologie permettant de construire des interfaces vocales. Parmi les applications, on peut citer la vocalisation d'écrans informatiques pour les personnes aveugles ou fortement malvoyantes (lecteur d'écran), ainsi que de nombreuses applications de serveurs vocaux (fr) Speech synthesis is the artificial production of human speech. A computer system used for this purpose is called a speech synthesizer, and can be implemented in software or hardware products. A text-to-speech (TTS) system converts normal language text into speech; other systems render symbolic linguistic representations like phonetic transcriptions into speech. The reverse process is speech recognition. (en) La sintesi vocale (in inglese speech synthesis) è la tecnica per la riproduzione artificiale della voce umana. Un sistema usato per questo scopo è detto sintetizzatore vocale e può essere realizzato tramite software o via hardware. I sistemi di sintesi vocale sono noti anche come sistemi text-to-speech (TTS) (in italiano: da testo a voce) per la loro possibilità di convertire il testo in parlato. Esistono inoltre sistemi in grado di convertire simboli fonetici in parlato. Il processo inverso è chiamato riconoscimento vocale. (it) Síntese de fala é o processo de produção artificial de fala humana. Um sistema informático utilizado para este propósito é denominado sintetizador de fala, e pode ser implementado em software ou hardware. Um sistema texto-fala (TTS, na sigla em inglês) converte texto ortográfico em fala. Outros sistemas interpretam (como transcrição fonética) em fala. (pt) |
rdfs:label | Speech synthesis (en) تصنيع كلامي (ar) Síntesi de veu (ca) Syntéza řeči (cs) Sprachsynthese (de) Σύνθεση ομιλίας (el) Parolsintezo (eo) Hizketaren sintesi (eu) Síntesis de habla (es) Synthèse vocale (fr) Sintesis bunyi (in) Sintesi vocale (it) 음성 합성 (ko) 音声合成 (ja) Spraaksynthese (nl) Synteza mowy (pl) Síntese de fala (pt) Синтез речи (ru) Talsyntes (sv) Синтез мовлення (uk) 语音合成 (zh) |
rdfs:seeAlso | dbr:Emotional_speech_recognition dbr:Speech-generating_device dbr:Microsoft_Agent |
owl:sameAs | freebase:Speech synthesis freebase:Speech synthesis http://linked-web-apis.fit.cvut.cz/resource/proprietary_voice_output_format_format yago-res:Speech synthesis wikidata:Speech synthesis dbpedia-af:Speech synthesis dbpedia-ar:Speech synthesis http://ast.dbpedia.org/resource/Síntesis_de_fala dbpedia-bg:Speech synthesis dbpedia-ca:Speech synthesis dbpedia-cs:Speech synthesis dbpedia-da:Speech synthesis dbpedia-de:Speech synthesis dbpedia-el:Speech synthesis dbpedia-eo:Speech synthesis dbpedia-es:Speech synthesis dbpedia-et:Speech synthesis dbpedia-eu:Speech synthesis dbpedia-fa:Speech synthesis dbpedia-fi:Speech synthesis http://fo.dbpedia.org/resource/Talusyntesa dbpedia-fr:Speech synthesis dbpedia-he:Speech synthesis http://hi.dbpedia.org/resource/वाक्_संश्लेषण dbpedia-hu:Speech synthesis dbpedia-id:Speech synthesis dbpedia-is:Speech synthesis dbpedia-it:Speech synthesis dbpedia-ja:Speech synthesis dbpedia-kk:Speech synthesis dbpedia-ko:Speech synthesis http://lv.dbpedia.org/resource/Runas_sintēze dbpedia-ms:Speech synthesis http://my.dbpedia.org/resource/စာသားမှအသံပြောင်းလဲပေးသောစနစ် dbpedia-nl:Speech synthesis dbpedia-nn:Speech synthesis dbpedia-no:Speech synthesis dbpedia-pl:Speech synthesis dbpedia-pt:Speech synthesis dbpedia-ru:Speech synthesis dbpedia-sh:Speech synthesis dbpedia-simple:Speech synthesis dbpedia-sr:Speech synthesis dbpedia-sv:Speech synthesis http://ta.dbpedia.org/resource/பேச்சொலியாக்கம் http://tg.dbpedia.org/resource/Синтези_нутқ dbpedia-th:Speech synthesis dbpedia-tr:Speech synthesis dbpedia-uk:Speech synthesis http://ur.dbpedia.org/resource/تالیف_کلام dbpedia-vi:Speech synthesis dbpedia-zh:Speech synthesis https://global.dbpedia.org/id/d7i7 |
prov:wasDerivedFrom | wikipedia-en:Speech_synthesis?oldid=1124161934&ns=0 |
foaf:depiction | wiki-commons:Special:FilePath/Stephen_Hawking.StarChild.jpg wiki-commons:Special:FilePath/Computer_and_speech_synthesiser_housing,_19_(9663804888).jpg wiki-commons:Special:FilePath/DNC(Differentiable_Neural_Computer).png wiki-commons:Special:FilePath/Fidelity_Chess_Challenger_Voice.jpg wiki-commons:Special:FilePath/SoftVoice.svg wiki-commons:Special:FilePath/TTS_System.svg |
foaf:isPrimaryTopicOf | wikipedia-en:Speech_synthesis |
is dbo:academicDiscipline of | dbr:Matti_Antero_Karjalainen dbr:Raimo_Olavi_Toivonen |
is dbo:genre of | dbr:Vocaloid dbr:FreeTTS dbr:ESpeak dbr:Amazon_Polly dbr:Software_Automatic_Mouth dbr:Vocaloid__VocaloWitter__1 |
is dbo:industry of | dbr:Cepstral_(company) |
is dbo:knownFor of | dbr:Ann_Syrdal dbr:Alan_W._Black |
is dbo:product of | dbr:Loquendo dbr:TuVox dbr:Nuance_Communications dbr:SpeechFX |
is dbo:regionServed of | dbr:IFlytek |
is dbo:type of | dbr:15.ai |
is dbo:wikiPageDisambiguates of | dbr:Speech_(disambiguation) dbr:Synthesis |
is dbo:wikiPageRedirects of | dbr:History_of_speech_synthesis dbr:List_of_open-source_speech_synthesis_software dbr:Computer-generated_speech dbr:Emotional_speech_synthesis dbr:Applications_of_speech_synthesis dbr:Text-to-speech dbr:AI_voice_generator dbr:Evaluation_of_speech_synthesis dbr:Speech_Synthesis dbr:Speech_synthesizer dbr:Neural_Text-to-Speech dbr:Computer-generated_voice dbr:Diphone_synthesis dbr:Text-To-Voice dbr:Text-to-Voice dbr:Text_to_Voice dbr:Text_to_voice dbr:Voice_synthesizer dbr:Text-To-Speech dbr:Text-to-Speech dbr:Text-to-speech_engine dbr:Text-to-speech_software dbr:Text-to-speech_synthesizer dbr:Text-to-voice dbr:Text2Speech dbr:TextAloud dbr:Text_To_Speech dbr:Text_to_MP3 dbr:Text_to_Speech dbr:Text_to_audio dbr:Text_to_mp3 dbr:Microsoft_Voices dbr:Text_to_speech dbr:Synthesised_speech dbr:Synthesize_speech dbr:Synthesized_speech dbr:Synthetic-talking dbr:Synthetic_talking dbr:Synthetic_voice dbr:Synthetic_voices dbr:Synthetictalking dbr:Formant_Synthesis dbr:Formant_synthesis dbr:Print-to-speech dbr:Singing_synthesizer dbr:Voice_generation dbr:Voice_synthesis dbr:Voice_synthesiser dbr:Speech_simulation dbr:Speech_synth dbr:Speech_syntheses dbr:Speech_synthesiser dbr:Speech_synthesizers |
is dbo:wikiPageWikiLink of | dbr:Canadian_Journey dbr:Carnegie_Mellon_University dbr:Amebis dbr:AmigaBASIC dbr:Amiga_music_software dbr:Poznań_Główny_railway_station dbr:Praat dbr:Publication_history_of_Anarky dbr:Punch-Out!!_(arcade_game) dbr:Q*bert dbr:Robot dbr:Robotron_Group dbr:Schwa dbr:Electro_(music) dbr:Enon_(robot) dbr:List_of_computing_and_IT_abbreviations dbr:List_of_datasets_for_machine-learning_research dbr:List_of_eponymous_tests dbr:List_of_flashcard_software dbr:Meltdown_(1986_video_game) dbr:Milton_(game) dbr:Mycroft_(software) dbr:NECA_Project dbr:NNG_(company) dbr:Natural_language_generation dbr:MC_Hawking dbr:Telesensory_Systems dbr:WGU-20 dbr:Progress_in_artificial_intelligence dbr:Project_575 dbr:1938_in_science dbr:1939_in_science dbr:2021_in_British_television dbr:Bell_Labs dbr:Berzerk_(video_game) dbr:Bondwell dbr:BonziBuddy dbr:David_Gerrold dbr:Apple_Advanced_Technology_Group dbr:Apptek dbr:History_of_speech_synthesis dbr:Jon_Briggs dbr:List_of_Google_Easter_eggs dbr:List_of_Java_APIs dbr:List_of_Kenny_vs._Spenny_episodes dbr:List_of_Red_vs._Blue_characters dbr:List_of_open-source_speech_synthesis_software dbr:List_of_pioneers_in_computer_science dbr:Persian_Speech_Corpus dbr:Peter_Shilton's_Handball_Maradona dbr:Renault_9_and_11 dbr:RiffTrax:_The_Game dbr:Currah dbr:Daisy_Bell dbr:Universal_translator dbr:UoSAT-1 dbr:UoSAT-2 dbr:Utau dbr:Valley_Metro_Bus dbr:Vanguard_(video_game) dbr:Video_game_music dbr:Vocaloid dbr:Voder dbr:Voice_user_interface dbr:Voiceroid dbr:Vought_Airtrans dbr:Deep_learning_speech_synthesis dbr:Development_of_Windows_Vista dbr:Dysarthria dbr:East_vs._West:_Berlin_1948 dbr:Index_of_cognitive_science_articles dbr:Index_of_linguistics_articles dbr:Intelligent_Speech_Analyser dbr:Intellivoice dbr:Interactive_voice_response dbr:International_Community_for_Auditory_Display dbr:Kyiv_Laboratory_for_Artificial_Intelligence dbr:Sudhir_Ahuja dbr:Lightwriter dbr:Lin_Yutang's_Chinese-English_Dictionary_of_Modern_Usage dbr:List_of_linguists dbr:List_of_mergers_and_acquisitions_by_Alphabet dbr:List_of_people_with_locked-in_syndrome dbr:Robert_B._Ingebretsen dbr:Optacon dbr:Rain_in_England dbr:The_Age_of_Spiritual_Machines dbr:Sakura_HyperMedia_Desktop dbr:Norwegian_Library_of_Talking_Books_and_Braille dbr:RoboSapien dbr:15.ai dbr:Cologne_Stadtbahn dbr:Colossus:_The_Forbin_Project dbr:Comparison_of_web_browsers dbr:Computer-generated_speech dbr:Computer_World dbr:Control_Panel_(Windows) dbr:CoolSpeech dbr:Cowon dbr:Crusher_Joe dbr:Crypton_Future_Media dbr:Ananova dbr:MathMagic dbr:Matti_Antero_Karjalainen dbr:Mechanical_Turk dbr:Eloquens_(software) dbr:General_Instrument_SP0256 dbr:General_MIDI dbr:Generative_audio dbr:Louis_Gerstman dbr:Numbers_station dbr:Text_normalization dbr:Voice_font dbr:Roland_MC-303 dbr:Reading_machine dbr:Raimo_Olavi_Toivonen dbr:1988_in_science dbr:Clifford_A._Pickover dbr:Electric_Café dbr:Electrical_engineering dbr:Emacspeak dbr:Emotional_speech_synthesis dbr:FreeTTS dbr:GNOME dbr:GPS_for_the_visually_impaired dbr:Glossary_of_artificial_intelligence dbr:Golden_age_of_arcade_video_games dbr:Google_Cloud_Platform dbr:Google_Lens dbr:Google_Translate dbr:Gorf dbr:Multimodal_interaction dbr:My_Talking_Tom dbr:NOAA_Weather_Radio dbr:Nails_(2017_film) dbr:Concatenative_synthesis dbr:Corruption_(1988_video_game) dbr:The_Mix_(Kraftwerk_album) dbr:The_Plane_Train dbr:The_Real_World:_London dbr:The_Theory_of_Everything_(2014_film) dbr:They_Saved_Lisa's_Brain dbr:LaTurbo_Avedon dbr:2020_Nashville_bombing dbr:Android_Donut dbr:Android_version_history dbr:Anki_(software) dbr:Ann_Syrdal dbr:Antichrist_Superstar dbr:Applications_of_speech_synthesis dbr:Arabic_Speech_Corpus dbr:Benoit_&_Sergio dbr:Lex_(album) dbr:Linguatec dbr:Looping_(video_game) dbr:Loquendo dbr:MBROLA dbr:Magic_Desk dbr:Magnavox_Odyssey_2 dbr:Chiptune dbr:Siri dbr:SmartAction dbr:Star_Wars_(1983_video_game) dbr:Stephen_E._Levinson dbr:Stephen_Hawking dbr:Stratovox dbr:Comparison_of_speech_synthesizers dbr:Computational_linguistics dbr:Computer-assisted_language_learning dbr:Computer_facial_animation dbr:Computer_science dbr:Ys_I_&_II dbr:Zektor dbr:Zero-5 dbr:Emotion_Markup_Language dbr:Franklin_S._Cooper dbr:Frontend_and_backend dbr:Fumitada_Itakura dbr:Icophone dbr:Ignatius_Mattingly dbr:Lernout_&_Hauspie dbr:Phishing dbr:Piergiorgio_Welby dbr:Pocket_Operators dbr:Pronunciation_Lexicon_Specification dbr:Public_address_system dbr:Speak_&_Spell_(toy) dbr:Spectrogram dbr:Speech_(disambiguation) dbr:Spoofing_attack dbr:Synthesis dbr:Synthesizer dbr:Synthesizer_(disambiguation) dbr:Synthetic_data dbr:Texas_Instruments_Professional_Computer dbr:Text,_Speech_and_Dialogue dbr:Text-to-speech dbr:Maupiti_Island_(video_game) dbr:Max_Mathews dbr:Mazin_Gilbert dbr:Michael_Kubovy dbr:Microsoft_Plus! dbr:Microsoft_Speech_API dbr:Microsoft_Voice_Command dbr:Microsoft_text-to-speech_voices dbr:Viterbi_algorithm dbr:2001:_A_Space_Odyssey_(soundtrack) dbr:Austin_Maestro dbr:Automated_airport_weather_station dbr:Automatik_Text_Reader dbr:Bubble_System dbr:CMU_Pronouncing_Dictionary dbr:Adobe_Voco dbr:Catherine_Browman dbr:CereProc dbr:Three_of_a_Kind_(The_X-Files) dbr:Timeline_of_arcade_video_game_history dbr:Top_Gun:_Maverick dbr:TuVox dbr:Turing_test dbr:WDR_VERA dbr:WHYA dbr:WIPK dbr:WQXI_(AM) dbr:WYCD dbr:Werner_Meyer-Eppler dbr:What_the_Dub? dbr:Whiz_Kids_(TV_series) dbr:Wiktionary dbr:Windows_Speech_Recognition dbr:Doll_Factory dbr:Dr._Sbaitso dbr:GLaDOS dbr:Game_accessibility dbr:HAL_9000 dbr:HTK_(software) dbr:Jewish_Herald-Voice dbr:John_Fekner dbr:K-NFB_Reader dbr:Katherine_Safford_Harris dbr:Language_Technologies_Institute dbr:Language_and_Communication_Technologies dbr:Language_education dbr:Lankhor dbr:Larry_Heck dbr:Linear_predictive_coding dbr:Linguistics dbr:Linguistics_in_science_fiction dbr:Lip_reading dbr:List_of_Adobe_software dbr:Speech_technology dbr:Vocoder dbr:Speech-generating_device dbr:Rashumon dbr:Speech_processing dbr:Roomba dbr:Smart_toy dbr:24_Hour_Church_of_Elvis dbr:A._G._Ramakrishnan dbr:AI_voice_generator dbr:AT&T_Labs dbr:Acapela dbr:Additive_synthesis dbr:Adobe_Creative_Cloud dbr:Airstream_mechanism dbr:Alice_(virtual_assistant) dbr:Alvin_Liberman dbr:Amazon_Alexa dbr:Amazon_Echo dbr:Amelia_(company) dbr:AmigaOS dbr:Amiga_1000 dbr:Anarky dbr:Cultural_legacy_of_the_Titanic dbr:Cyberpunk_(album) dbr:Cyborg dbr:ESpeak dbr:EXL_100 dbr:Eduardo_Reck_Miranda dbr:Amazon_Polly dbr:Evaluation_of_speech_synthesis dbr:Faith:_The_Unholy_Trinity dbr:Far_Side_Virtual dbr:FastTracker_2 dbr:FatKat_(investment_software) dbr:Fedmyster dbr:Festival_Speech_Synthesis_System dbr:File_viewer dbr:Foliate_(software) dbr:Forrest_S._Mozer dbr:No_Matter_What_You_Do dbr:Nuance_Communications dbr:Oswald_Labs dbr:PERQ dbr:PHP dbr:Parvati_Holcomb dbr:Chatbot dbr:Dict.cc dbr:Digital_cloning dbr:Diphone |
is dbp:fields of | dbr:Matti_Antero_Karjalainen dbr:Raimo_Olavi_Toivonen |
is dbp:genre of | dbr:FreeTTS dbr:ESpeak dbr:Amazon_Polly dbr:Software_Automatic_Mouth |
is dbp:knownFor of | dbr:Alan_W._Black |
is dbp:products of | dbr:Amebis dbr:TuVox dbr:SpeechFX |
is dbp:type of | dbr:15.ai |
is rdfs:seeAlso of | dbr:Speech-generating_device |
is foaf:primaryTopic of | wikipedia-en:Speech_synthesis |