Speech coding (original) (raw)
- La codificació de veu és el procés que permet transformar un senyal de veu analògic (combinació de múltiples ones sonores) en un conjunt de dígits binaris o senyal digital. El seu objectiu principal és aconseguir una bona qualitat final del senyal digital utilitzant el menor nombre de bits possibles per a representar-lo. Prèviament a la mateixa codificació, el senyal ha passat pels dos primers blocs bàsics de qualsevol cadena de conversió analògica-digital, que són el mostratge i la quantificació. El procés de codificació pot tenir diferents finalitats (transmissió, emmagatzematge, processat, etc.), i des de fa molt temps s'aplica en diferents camps de les telecomunicacions, com per exemple en telefonia (per cable, sense fils i mòbil), seguretat, criptografia, bústies de veu, contestadors, radiodifusió (DAB), televisió (HDTV), videoconferència, emmagatzematge (MD, DVD), entre d'altres. En l'actualitat existeix una gran varietat de codificadors de veu, que aprofiten les característiques intrínseques del senyal de veu analògic per poder reduir la informació a transmetre sense que el senyal digital obtingut presenti diferències apreciables per l'oïda humana. Les característiques fonamentals del senyal de veu són la redundància, l'ample marge dinàmic i la no estacionarietat, de manera que els codificadors analitzen el senyal d'entrada, n'intenten eliminar o minimitzar les redundàncies, i codifiquen eficientment la part no redundant de manera perceptualment acceptable. Com a valor afegit al procés, la codificació de veu permet incorporar algorismes de xifrat per establir comunicacions privades segures o realitzar gravacions indesxifrables per a terceres persones. (ca)
- تشفير المحادثة هو عبارة عن تطبيق ضغط البيانات الصادرة من إشارات الصوت الرقمي التي تتضمن كلام. (ar)
- La codificación de voz es una aplicación de compresión de datos de señales de audio digital que contiene voz. La codificación de voz utiliza la estimación de parámetros específicos de voz utilizando técnicas de procesamiento de señal de audio para modelar la señal de voz, combinada con algoritmos de compresión de datos genéricos para representar los parámetros modelados resultantes en un flujo de bits compacto. Algunas aplicaciones de codificación de voz son telefonía móvil y voz sobre IP (VoIP). La técnica de codificación de voz más utilizada en telefonía móvil es la codificación predictiva lineal (LPC), mientras que la más utilizada en las aplicaciones de VoIP son las técnicas de LPC y la transformación de coseno discreto modificado (MDCT). [cita requerida] Las técnicas empleadas en la codificación del habla son similares a las utilizadas en la compresión de datos de audio y la codificación de audio, donde el conocimiento en psicoacústica se utiliza para transmitir solo datos que son relevantes para el sistema auditivo humano. Por ejemplo, en la codificación de voz en frecuencia de voz, solo información en la banda de frecuencia 400 Hz a 3500 Hz se transmite pero la señal reconstruida sigue siendo adecuada para la . La codificación de voz difiere de otras formas de codificación de audio en que el habla es una señal más simple que la mayoría de las otras señales de audio, y hay mucha más información estadística disponible sobre las propiedades del habla. Como resultado, cierta información auditiva que es relevante en la codificación de audio puede ser innecesaria en el contexto de codificación de voz. En la codificación del habla, el criterio más importante es la preservación de la inteligibilidad y la "simpatía" del habla, con una cantidad limitada de datos transmitidos. Además, la mayoría de las aplicaciones de voz requieren un bajo retraso de codificación, ya que los largos retrasos de codificación interfieren con la interacción de voz. (es)
- Speech coding is an application of data compression of digital audio signals containing speech. Speech coding uses speech-specific parameter estimation using audio signal processing techniques to model the speech signal, combined with generic data compression algorithms to represent the resulting modeled parameters in a compact bitstream. Some applications of speech coding are mobile telephony and voice over IP (VoIP). The most widely used speech coding technique in mobile telephony is linear predictive coding (LPC), while the most widely used in VoIP applications are the LPC and modified discrete cosine transform (MDCT) techniques. The techniques employed in speech coding are similar to those used in audio data compression and audio coding where knowledge in psychoacoustics is used to transmit only data that is relevant to the human auditory system. For example, in voiceband speech coding, only information in the frequency band 400 to 3500 Hz is transmitted but the reconstructed signal is still adequate for intelligibility. Speech coding differs from other forms of audio coding in that speech is a simpler signal than most other audio signals, and a lot more statistical information is available about the properties of speech. As a result, some auditory information that is relevant in audio coding can be unnecessary in the speech coding context. In speech coding, the most important criterion is preservation of intelligibility and pleasantness of speech, with a constrained amount of transmitted data. In addition, most speech applications require low coding delay, as long coding delays interfere with speech interaction. (en)
- 音声符号化(おんせいふごうか、英: speech coding)は、アナログの音声信号をデジタル符号化するための技術で、音声の性質を使ってデータ圧縮を行うことに特徴がある。音楽などの一般的なオーディオ信号を対象とするMP3などのオーディオ圧縮技術は、人間の聴覚心理学上の特性やデータの冗長性を利用して不要なデータの除去を行うが、音声符号化ではそれに加えて音声固有のモデル化を行うことができるため、さらにビットレートを下げることが可能である。 音声符号化の技術は異なった多くの分野で使われている。代表的なのは、携帯電話、衛星電話、VoIPなど通信の分野だが、暗号化、放送、記録(Blu-ray Discなど)の分野や音声応答システムなどの音声処理の分野などで使用されている。 (ja)
- ( 비슷한 이름의 오디오 코덱에 관해서는 해당 문서를 참조하십시오.) 음성 부호화(Speech Coding)는 음성을 포함하는 디지털 오디오의 데이터 압축 소프트웨어다. (ko)
- Kodowanie mowy – polega na konwersji sygnału fonicznego mowy z postaci analogowej do postaci cyfrowej, tak aby możliwe było jego przesyłanie przez łącze telekomunikacyjne lub sieć komputerową. Proces zmiany sygnału analogowego na strumień zakodowanych danych składa się z trzech etapów: * próbkowania – polega na pobieraniu chwilowych wartości sygnału z określoną częstotliwością – w telefonii wystarczy, że wynosi ona 8 kHz, * kwantyzacji – proces zmiany wartości pobranych próbek na skończoną liczbę nieciągłych wartości, * kompresji stratnej (pl)
- 語音編碼(Speech coding),是一種包含說話的數位音訊信號資料壓縮應用。語音是人類交流資訊最自然、最有效、最方便的手段,因此大多數通信系統都要包含語音傳輸的功能。隨著科技的發展,雖然影像、數據等非語音信息在資訊傳遞中所占的比例越來越大,但是有效地傳遞語音信號仍是眾多通信系統必備的功能之一。 語音通信最早可以追溯到1876年貝爾發明的電話機,該裝置首次利用聲電、電聲轉換技術實現了遠距離的語音訊號傳輸。早期的語音通訊裝置採用的是模擬語音通訊,但它在可靠性、抗干擾能力、快速交換等方面存在很多問題。自從1960年代積體電路出現以後,通訊通道和通訊終端開始從模擬系統演變為全數位系統。與模擬通訊相比,數位通訊在可靠性和抗干擾能力等方面具有很大優勢,但不足之處是占用的頻帶較寬。為了節省數位語音信號傳輸所需要的頻寬,語音編碼技術開始得到深入研究。 語音編碼屬於信源編碼範疇,自從1930年代末提出脈衝編碼調變(PCM)原理以及聲碼器(Vocoder)概念後,語音編碼一直沿著這兩個方向發展,它們也可以稱為語音訊號的波形編碼與聲碼化編碼或稱為非參數編碼與參數編碼,參數編碼有時也稱為模型編碼。 隨著電腦的發展以及大規模、超大規模積體電路的出現,語音編碼技術取得了很多突破性的進展,研究出了很多實用的語音編碼方案,應用在不同的語音通訊系統中,並在不斷地研究、改進中得以完善,逐漸形成國際性或者地區性的語音編碼標準。 (zh)
- تشفير المحادثة هو عبارة عن تطبيق ضغط البيانات الصادرة من إشارات الصوت الرقمي التي تتضمن كلام. (ar)
- 音声符号化(おんせいふごうか、英: speech coding)は、アナログの音声信号をデジタル符号化するための技術で、音声の性質を使ってデータ圧縮を行うことに特徴がある。音楽などの一般的なオーディオ信号を対象とするMP3などのオーディオ圧縮技術は、人間の聴覚心理学上の特性やデータの冗長性を利用して不要なデータの除去を行うが、音声符号化ではそれに加えて音声固有のモデル化を行うことができるため、さらにビットレートを下げることが可能である。 音声符号化の技術は異なった多くの分野で使われている。代表的なのは、携帯電話、衛星電話、VoIPなど通信の分野だが、暗号化、放送、記録(Blu-ray Discなど)の分野や音声応答システムなどの音声処理の分野などで使用されている。 (ja)
- ( 비슷한 이름의 오디오 코덱에 관해서는 해당 문서를 참조하십시오.) 음성 부호화(Speech Coding)는 음성을 포함하는 디지털 오디오의 데이터 압축 소프트웨어다. (ko)
- Kodowanie mowy – polega na konwersji sygnału fonicznego mowy z postaci analogowej do postaci cyfrowej, tak aby możliwe było jego przesyłanie przez łącze telekomunikacyjne lub sieć komputerową. Proces zmiany sygnału analogowego na strumień zakodowanych danych składa się z trzech etapów: * próbkowania – polega na pobieraniu chwilowych wartości sygnału z określoną częstotliwością – w telefonii wystarczy, że wynosi ona 8 kHz, * kwantyzacji – proces zmiany wartości pobranych próbek na skończoną liczbę nieciągłych wartości, * kompresji stratnej (pl)
- La codificació de veu és el procés que permet transformar un senyal de veu analògic (combinació de múltiples ones sonores) en un conjunt de dígits binaris o senyal digital. El seu objectiu principal és aconseguir una bona qualitat final del senyal digital utilitzant el menor nombre de bits possibles per a representar-lo. Prèviament a la mateixa codificació, el senyal ha passat pels dos primers blocs bàsics de qualsevol cadena de conversió analògica-digital, que són el mostratge i la quantificació. (ca)
- La codificación de voz es una aplicación de compresión de datos de señales de audio digital que contiene voz. La codificación de voz utiliza la estimación de parámetros específicos de voz utilizando técnicas de procesamiento de señal de audio para modelar la señal de voz, combinada con algoritmos de compresión de datos genéricos para representar los parámetros modelados resultantes en un flujo de bits compacto. Además, la mayoría de las aplicaciones de voz requieren un bajo retraso de codificación, ya que los largos retrasos de codificación interfieren con la interacción de voz. (es)
- Speech coding is an application of data compression of digital audio signals containing speech. Speech coding uses speech-specific parameter estimation using audio signal processing techniques to model the speech signal, combined with generic data compression algorithms to represent the resulting modeled parameters in a compact bitstream. (en)
- 語音編碼(Speech coding),是一種包含說話的數位音訊信號資料壓縮應用。語音是人類交流資訊最自然、最有效、最方便的手段,因此大多數通信系統都要包含語音傳輸的功能。隨著科技的發展,雖然影像、數據等非語音信息在資訊傳遞中所占的比例越來越大,但是有效地傳遞語音信號仍是眾多通信系統必備的功能之一。 語音通信最早可以追溯到1876年貝爾發明的電話機,該裝置首次利用聲電、電聲轉換技術實現了遠距離的語音訊號傳輸。早期的語音通訊裝置採用的是模擬語音通訊,但它在可靠性、抗干擾能力、快速交換等方面存在很多問題。自從1960年代積體電路出現以後,通訊通道和通訊終端開始從模擬系統演變為全數位系統。與模擬通訊相比,數位通訊在可靠性和抗干擾能力等方面具有很大優勢,但不足之處是占用的頻帶較寬。為了節省數位語音信號傳輸所需要的頻寬,語音編碼技術開始得到深入研究。 語音編碼屬於信源編碼範疇,自從1930年代末提出脈衝編碼調變(PCM)原理以及聲碼器(Vocoder)概念後,語音編碼一直沿著這兩個方向發展,它們也可以稱為語音訊號的波形編碼與聲碼化編碼或稱為非參數編碼與參數編碼,參數編碼有時也稱為模型編碼。 (zh)
- freebase:Speech coding
- wikidata:Speech coding
- dbpedia-ar:Speech coding
- dbpedia-ca:Speech coding
- dbpedia-es:Speech coding
- dbpedia-fi:Speech coding
- dbpedia-ja:Speech coding
- dbpedia-ko:Speech coding
- http://lv.dbpedia.org/resource/Runas_kodēšana
- dbpedia-ms:Speech coding
- dbpedia-pl:Speech coding
- dbpedia-zh:Speech coding
- https://global.dbpedia.org/id/32MBP
is dbo:wikiPageWikiLink of
- dbr:Ronald_W._Schafer
- dbr:Enhanced_Voice_Services
- dbr:M17_(amateur_radio)
- dbr:MPEG-4_Part_3
- dbr:Bishnu_S._Atal
- dbr:Algebraic_code-excited_linear_prediction
- dbr:Allen_Gersho
- dbr:Vector_quantization
- dbr:Telephony
- dbr:Timeline_of_electrical_and_electronic_engineering
- dbr:Comparison_of_video_container_formats
- dbr:Secure_voice
- dbr:Timeline_of_information_theory
- dbr:Multi-Band_Excitation
- dbr:Continuously_variable_slope_delta_modulation
- dbr:Analysis_by_synthesis
- dbr:Loquendo
- dbr:MOSFET_applications
- dbr:MP3
- dbr:MPEG-1
- dbr:Full_Rate
- dbr:Fumitada_Itakura
- dbr:Half_Rate
- dbr:Harmonic_Vector_Excitation_Coding
- dbr:John_Makhoul
- dbr:José
- dbr:José_Tribolet
- dbr:Pitch_detection_algorithm
- dbr:Speech_synthesis
- dbr:Markov_model
- dbr:Adaptive_Multi-Rate_Wideband
- dbr:Adaptive_differential_pulse-code_modulation
- dbr:Data_compression
- dbr:G.728
- dbr:G.729
- dbr:Line_spectral_pairs
- dbr:Linear_prediction
- dbr:Linear_predictive_coding
- dbr:NXDN
- dbr:Vocoder
- dbr:Speech_processing
- dbr:Adaptive_Multi-Rate_audio_codec
- dbr:Digital_audio
- dbr:Digital_circuit_multiplication_equipment
- dbr:History_of_information_theory
- dbr:Speech_enhancement
- dbr:Residual-excited_linear_prediction
- dbr:Speaker_recognition
- dbr:Speech_recognition
- dbr:International_Speech_Communication_Association
- dbr:Covering_code
- dbr:Audio_signal_processing
- dbr:Biing-Hwang_(Fred)_Juang
- dbr:Code-excited_linear_prediction
- dbr:Codec_2
- dbr:Mixed-excitation_linear_prediction
- dbr:Modified_discrete_cosine_transform
- dbr:Digital_signal_processing
- dbr:Discrete_cosine_transform
- dbr:Audio_coding_format
- dbr:Spectral_modeling_synthesis
- dbr:Speech_Coding
- dbr:Integrated_Performance_Primitives
- dbr:Opus_(audio_format)
- dbr:Lyra_(codec)
- dbr:MLT
- dbr:Mobile_station
- dbr:Selectable_Mode_Vocoder
- dbr:Speech_verification
- dbr:Voice_activity_detection
- dbr:SIGSALY
- dbr:Satin_(codec)
- dbr:IS-641
- dbr:List_of_sound_chips
- dbr:Voice_over_IP
- dbr:Wideband_audio
- dbr:Vector_sum_excited_linear_prediction
- dbr:Voice_engine
- dbr:Analysis-by-Synthesis
- dbr:Analysis_by_Synthesis
- dbr:Voice_codec
- dbr:Voice_encoding
- dbr:Speech_codec
- dbr:Speech_coder
- dbr:Speech_data_compression
- dbr:Speech_encoding