Statistical machine translation (original) (raw)

About DBpedia

통계적 기계 번역(Statistical machine translation, SMT)은 기계 번역 패러다임의 하나로서, 파라미터들이 2개 언어 말뭉치의 분석에서 비롯된 에 기초하여 번역이 생성된다. 이러한 통계적 접근은 이라든지 과는 대조된다. 통계적 기계 번역의 최초 개념은 1949년 에 의해 도입되었으며 여기에는 클로드 섀넌의 정보이론을 적용하는 개념이 포함되어 있다. 통계적 기계 번역은 IBM의 토머스 J. 왓슨 연구소에 의해 1980년대 말과 1990년대 초에 다시 도입되었으며근래 수년에 걸쳐 기계 번역이 다시 유행하게 하는 데 일조하였다. 신경망 기계 번역이 도입되기 전 이 개념은 이제까지 가장 널리 연구된 기계 번역 방식이었다.

Property Value
dbo:abstract Statistický strojový překlad (anglicky: statistical machine translation, SMT) je paradigma strojového překladu, kde jsou překlady generovány na základě statistických modelů, jejichž parametry jsou odvozeny z analýzy dvojjazyčných textových korpusů. Statistický přístup se liší od pravidlových i příkladových přístupů k strojovému překladu. První myšlenky o statistickém strojovém překladu byly představeny Warrenem Weaverem v roce 1949, včetně možností aplikace Claude Shannonovy informační teorie. Statistický strojový překlad byl znovu představen koncem 80. a začátkem 90. let vědci ve výzkumném středisku Thomase J. Watsona IBM a v posledních letech přispěl k významnému obnovení zájmu o něj. (cs) Statistika maŝintradukado (somoto) estas tekniko de maŝintradukado kie tradukojn oni generas surbaze de statistikaj modeloj kies parametroj derivas el la analizo de antaŭe tradukita dulingva tekstaro. La statistika metodo kontrastas al la maŝintradukadaj metodoj bazitaj sur (robomoto) aŭ sur (ebomoto). Ekde frua en 1949 ĉe la de IBM ĝis lastaj jaroj, statistika maŝintradukado kontribuis al la signifa releviĝo de intereso en maŝintradukado, ekzemple sia uzo en la populara Google-Tradukilo, senpaga reta maŝintradukilo. Nuntempe ĝi estas je multo la metodo de maŝintradukado plej vaste studata. (eo) Estatistiketan Oinarritutako Itzulpen Automatikoa (EOIA edo SMT, Statistical Machine Translation), itzulpen automatikoko paradigma bat da, zeinetan itzulpenak corpus eleanitzetatik erauzitako eredu estatistikoetan oinarrituta sortzen baitiren. Estatistiketan oinarritutako estrategia adibideetan oinarritutako edo erregeletan oinarritutako metodoez bestelakoa da. Azken urteotako ikerketa-lerroak ildo honetan zuzendu dira eta optimismorako bideak ireki dituela esan daiteke lortutako emaitzen kalitatea dela medio. Hizkuntzatik independentea da metodo hau eta RBMT baino merkeagoa neurri batean, beharrezko baliabide nagusia corpus handiak baitira. Halere, corpus handiak ez daude hizkuntza ez eta erakunde guztien esku-eskura, beraz murriztapen handi hau gogoan izan behar da. (eu) La traducción automática estadística, designada a veces por las expresiones Stat MT o SMT (del inglés Statistical Machine Translation), es un paradigma de traducción automática donde se generan traducciones basadas en modelos estadísticos y de teoría de la información cuyos parámetros se obtienen del análisis de corpus de textos bilingües. El enfoque estadístico contrasta con los enfoques tradicionales como la traducción automática basada en reglas y la basada en ejemplos. Las primeras ideas de la traducción automática estadística fueron introducidas por Warren Weaver en 1949 Tejedor,​ incluyendo las ideas de la aplicación de la teoría de la información de Claude Shannon. La traducción automática estadística fue reintroducida en 1991 por investigadores de la de IBM​ y ha contribuido al resurgimiento significativo del interés por la traducción automática en los últimos años. Hasta 2016 fue, con mucho, el método de traducción automática más estudiado, siendo substituido por la aplicación de redes neuronales de traducción automática. (es) Statistical machine translation (SMT) is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora. The statistical approach contrasts with the rule-based approaches to machine translation as well as with example-based machine translation, and has more recently been superseded by neural machine translation in many applications (see this article's final section). The first ideas of statistical machine translation were introduced by Warren Weaver in 1949, including the ideas of applying Claude Shannon's information theory. Statistical machine translation was re-introduced in the late 1980s and early 1990s by researchers at IBM's Thomas J. Watson Research Center and has contributed to the significant resurgence in interest in machine translation in recent years. Before the introduction of neural machine translation, it was by far the most widely studied machine translation method. (en) 통계적 기계 번역(Statistical machine translation, SMT)은 기계 번역 패러다임의 하나로서, 파라미터들이 2개 언어 말뭉치의 분석에서 비롯된 에 기초하여 번역이 생성된다. 이러한 통계적 접근은 이라든지 과는 대조된다. 통계적 기계 번역의 최초 개념은 1949년 에 의해 도입되었으며 여기에는 클로드 섀넌의 정보이론을 적용하는 개념이 포함되어 있다. 통계적 기계 번역은 IBM의 토머스 J. 왓슨 연구소에 의해 1980년대 말과 1990년대 초에 다시 도입되었으며근래 수년에 걸쳐 기계 번역이 다시 유행하게 하는 데 일조하였다. 신경망 기계 번역이 도입되기 전 이 개념은 이제까지 가장 널리 연구된 기계 번역 방식이었다. (ko) Statystyczne tłumaczenie maszynowe – metoda tłumaczenia automatycznego, w której przekład tworzony jest w oparciu o modele statystyczne, których parametry pozyskiwane są poprzez analizę korpusu równoległego danej pary języków. Ten sposób tłumaczenia stanowi alternatywę dla metod opartych na regułach transferu, jak i dla systemów opierających się na przykładach. Pierwsze koncepcje tłumaczenia statystycznego zostały wprowadzone w roku 1949 przez Warrena Weavera, który zaproponował użycie do tego celu teorii informacji Claude’a Shannona. Pomysł ten odrodził się i został rozpropagowany w roku 1991, dzięki grupie badawczej z centrum badawczego, Thomas J. Watson Research Center. Duży wpływ na ponowne przyjrzenia się zastosowaniom statystyki do tłumaczenia automatycznego miały sukcesy metod stochastycznych w dziedzinie rozpoznawania mowy. (pl) Статистический машинный перевод (англ. Statistical machine translation — SMT) — разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora). Статистический машинный перевод противопоставляют системам машинного перевода, основанным на правилах Rule-Based Machine Translation (RBMT) и на примерах Example-Based MT (EBMT). Первые идеи статистического машинного перевода были опубликованы Уорреном Уивером (Warren Weaver), в 1949 году. «Вторая волна» — начало 1990-х, IBM. «Третья волна» — Google, Microsoft, Language Weaver, Яндекс … Разработчики систем машинного перевода для улучшения качества вводят некоторые «сквозные» правила, тем самым превращая чисто статистические системы в Гибридный машинный перевод. Добавление некоторых правил, то есть создание гибридных систем, несколько улучшает качество переводов, особенно при недостаточном объёме входных данных, используемых при построении индекса машинного переводчика. (ru) 统计机器翻译(英語:Statistical Machine Translation,简写为SMT)是机器翻译的一种,也是目前非限定领域机器翻译中性能较佳的一种方法。统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。从早期基于词的机器翻译已经过渡到基于短语的翻译,并正在融合句法信息,以进一步提高翻译的精确性。 2016年前Google翻译的大部分语言对采用的都是统计机器翻译的方法。而Google亦在此本领域保持领先地位,在美国国家标准局组织的机器翻译评测中遥遥领先。但Google翻译在2016年11月开始使用神經機器翻譯作为主要翻译系统,并开发了Google神經機器翻譯系統。此外,常用的基于统计法机器翻译的系统还包括Bing翻译和百度翻译等。 统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型,并在此统计模型基础上,定义要估计的模型参数,并设计参数估计算法。早期的基于词的统计机器翻译采用的是,采用最大似然准则进行无监督训练,而近年来常用的基于短语的统计机器翻译则采用方法,一般来说需要参考语料进行有监督训练。 (zh)
dbo:wikiPageExternalLink http://www.statmt.org/moses/ http://www.statmt.org/ http://www.garuda.dikti.go.id/jurnal/detil/id/0:168667/q/pengarang:Tanuwijaya%20hansel/offset/0/limit/15 https://turkceingilizce.gen.tr/ http://www-nlp.stanford.edu/links/statnlp.html
dbo:wikiPageID 4558491 (xsd:integer)
dbo:wikiPageLength 23670 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1114649667 (xsd:integer)
dbo:wikiPageWikiLink dbr:Beam_search dbr:Probability_distribution dbr:N-gram dbr:Neural_machine_translation dbr:Statistical_parsing dbr:Apptek dbr:Gale-Church_alignment_algorithm dbr:SYSTRAN dbr:Claude_Shannon dbr:GPL dbr:Google_Translate dbr:Moses_(machine_translation) dbr:Apple_Inc. dbr:Cache_language_model dbr:Skype dbr:Smartphone dbr:Statistical_model dbr:Paradigm dbr:Phrase dbr:Speech_synthesis dbc:Statistical_natural_language_processing dbr:Data-oriented_parsing dbr:Warren_Weaver dbr:Language_model dbr:Duolingo dbr:Text_messaging dbr:Synchronous_context-free_grammar dbr:Speech_recognition dbr:Hybrid_machine_translation dbc:Machine_translation dbr:Language_Weaver dbr:Syntax dbr:Tablet_computer dbr:Hidden_Markov_model dbr:Parse_tree dbr:Word dbr:Mobile_broadband dbr:Europarl_corpus dbr:IBM dbr:IOS_8 dbr:Information_theory dbr:Microsoft_Translator dbr:Yandex.Translate dbr:Machine_translation dbr:Thomas_J._Watson_Research_Center dbr:Expectation–maximization_algorithm dbr:IBM_alignment_models dbr:Word_order dbr:Example-based_machine_translation dbr:Phraseme dbr:Rule-based_machine_translation dbr:Speech_translation dbr:Stochastic_parsing dbr:Word_alignment_(linguistics) dbr:Text_corpora dbr:Syntax_(linguistics) dbr:Bayes_Theorem dbr:Parallel_corpora dbr:Syntactic_categories dbr:GIZA++
dbp:wikiPageUsesTemplate dbt:Natural_language_processing dbt:Citation_needed dbt:Div_col dbt:Div_col_end dbt:Expand_section dbt:Reflist dbt:Short_description dbt:Approaches_to_machine_translation
dct:subject dbc:Statistical_natural_language_processing dbc:Machine_translation
gold:hypernym dbr:Paradigm
rdf:type dbo:ProgrammingLanguage
rdfs:comment 통계적 기계 번역(Statistical machine translation, SMT)은 기계 번역 패러다임의 하나로서, 파라미터들이 2개 언어 말뭉치의 분석에서 비롯된 에 기초하여 번역이 생성된다. 이러한 통계적 접근은 이라든지 과는 대조된다. 통계적 기계 번역의 최초 개념은 1949년 에 의해 도입되었으며 여기에는 클로드 섀넌의 정보이론을 적용하는 개념이 포함되어 있다. 통계적 기계 번역은 IBM의 토머스 J. 왓슨 연구소에 의해 1980년대 말과 1990년대 초에 다시 도입되었으며근래 수년에 걸쳐 기계 번역이 다시 유행하게 하는 데 일조하였다. 신경망 기계 번역이 도입되기 전 이 개념은 이제까지 가장 널리 연구된 기계 번역 방식이었다. (ko) 统计机器翻译(英語:Statistical Machine Translation,简写为SMT)是机器翻译的一种,也是目前非限定领域机器翻译中性能较佳的一种方法。统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。从早期基于词的机器翻译已经过渡到基于短语的翻译,并正在融合句法信息,以进一步提高翻译的精确性。 2016年前Google翻译的大部分语言对采用的都是统计机器翻译的方法。而Google亦在此本领域保持领先地位,在美国国家标准局组织的机器翻译评测中遥遥领先。但Google翻译在2016年11月开始使用神經機器翻譯作为主要翻译系统,并开发了Google神經機器翻譯系統。此外,常用的基于统计法机器翻译的系统还包括Bing翻译和百度翻译等。 统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型,并在此统计模型基础上,定义要估计的模型参数,并设计参数估计算法。早期的基于词的统计机器翻译采用的是,采用最大似然准则进行无监督训练,而近年来常用的基于短语的统计机器翻译则采用方法,一般来说需要参考语料进行有监督训练。 (zh) Statistický strojový překlad (anglicky: statistical machine translation, SMT) je paradigma strojového překladu, kde jsou překlady generovány na základě statistických modelů, jejichž parametry jsou odvozeny z analýzy dvojjazyčných textových korpusů. Statistický přístup se liší od pravidlových i příkladových přístupů k strojovému překladu. (cs) Statistika maŝintradukado (somoto) estas tekniko de maŝintradukado kie tradukojn oni generas surbaze de statistikaj modeloj kies parametroj derivas el la analizo de antaŭe tradukita dulingva tekstaro. La statistika metodo kontrastas al la maŝintradukadaj metodoj bazitaj sur (robomoto) aŭ sur (ebomoto). (eo) La traducción automática estadística, designada a veces por las expresiones Stat MT o SMT (del inglés Statistical Machine Translation), es un paradigma de traducción automática donde se generan traducciones basadas en modelos estadísticos y de teoría de la información cuyos parámetros se obtienen del análisis de corpus de textos bilingües. El enfoque estadístico contrasta con los enfoques tradicionales como la traducción automática basada en reglas y la basada en ejemplos. (es) Estatistiketan Oinarritutako Itzulpen Automatikoa (EOIA edo SMT, Statistical Machine Translation), itzulpen automatikoko paradigma bat da, zeinetan itzulpenak corpus eleanitzetatik erauzitako eredu estatistikoetan oinarrituta sortzen baitiren. Estatistiketan oinarritutako estrategia adibideetan oinarritutako edo erregeletan oinarritutako metodoez bestelakoa da. (eu) Statistical machine translation (SMT) is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora. The statistical approach contrasts with the rule-based approaches to machine translation as well as with example-based machine translation, and has more recently been superseded by neural machine translation in many applications (see this article's final section). (en) Statystyczne tłumaczenie maszynowe – metoda tłumaczenia automatycznego, w której przekład tworzony jest w oparciu o modele statystyczne, których parametry pozyskiwane są poprzez analizę korpusu równoległego danej pary języków. Ten sposób tłumaczenia stanowi alternatywę dla metod opartych na regułach transferu, jak i dla systemów opierających się na przykładach. (pl) Статистический машинный перевод (англ. Statistical machine translation — SMT) — разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora). Статистический машинный перевод противопоставляют системам машинного перевода, основанным на правилах Rule-Based Machine Translation (RBMT) и на примерах Example-Based MT (EBMT). (ru)
rdfs:label Statistický strojový překlad (cs) Statistika maŝintradukado (eo) Estatistiketan oinarritutako itzulpen automatikoa (eu) Traducción automática estadística (es) 통계적 기계 번역 (ko) Tłumaczenie statystyczne (pl) Statistical machine translation (en) Статистический машинный перевод (ru) 统计机器翻译 (zh)
owl:sameAs freebase:Statistical machine translation wikidata:Statistical machine translation dbpedia-az:Statistical machine translation dbpedia-cs:Statistical machine translation dbpedia-eo:Statistical machine translation dbpedia-es:Statistical machine translation dbpedia-et:Statistical machine translation dbpedia-eu:Statistical machine translation dbpedia-fa:Statistical machine translation http://hi.dbpedia.org/resource/सांख्यिकीय_मशीनी_अनुवाद http://ia.dbpedia.org/resource/Traduction_automatic_statistic dbpedia-ko:Statistical machine translation dbpedia-pl:Statistical machine translation dbpedia-ru:Statistical machine translation dbpedia-sl:Statistical machine translation dbpedia-tr:Statistical machine translation dbpedia-vi:Statistical machine translation dbpedia-zh:Statistical machine translation https://global.dbpedia.org/id/2yxF7
prov:wasDerivedFrom wikipedia-en:Statistical_machine_translation?oldid=1114649667&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Statistical_machine_translation
is dbo:wikiPageDisambiguates of dbr:SMT
is dbo:wikiPageRedirects of dbr:Statistical_translation dbr:Statistically-based_translation dbr:Statistically_based_translation
is dbo:wikiPageWikiLink of dbr:Robert_Mercer dbr:Natural_language_processing dbr:Neural_machine_translation dbr:Transfer-based_machine_translation dbr:Statistical_parsing dbr:Culturomics dbr:Interactive_machine_translation dbr:SYSTRAN dbr:OOV dbr:Google_Translate dbr:Moses_(machine_translation) dbr:Cache_language_model dbr:Caitra dbr:Suffix_array dbr:Comparison_of_different_machine_translation_approaches dbr:Comparison_of_machine_translation_applications dbr:Pivot_language dbr:Machine_translation_software_usability dbr:MapReduce dbr:Microsoft_engineering_groups dbr:John_D._Lafferty dbr:Language_acquisition dbr:NiuTrans dbr:European_Parliament dbr:PROMT dbr:Dictionary-based_machine_translation dbr:Google_Neural_Machine_Translation dbr:History_of_machine_translation dbr:History_of_natural_language_processing dbr:Speech_recognition dbr:Jaime_Carbonell dbr:Jeff_Dean dbr:BabelNet dbr:Hybrid_machine_translation dbr:Language_Weaver dbr:Bitext_word_alignment dbr:Transformer_(machine_learning_model) dbr:Translation dbr:Mobile_translation dbr:Audio_mining dbr:Bonnie_Dorr dbr:Philipp_Koehn dbr:Microsoft_Bing dbr:Yandex_Translate dbr:Machine_translation dbr:SMT dbr:EuroMatrixPlus dbr:Euromatrix dbr:Europarl_Corpus dbr:IBM_alignment_models dbr:Example-based_machine_translation dbr:Moses_for_Mere_Mortals dbr:Outline_of_machine_learning dbr:Parallel_text dbr:Paraphrasing_(computational_linguistics) dbr:Statistical_translation dbr:Statistically-based_translation dbr:Statistically_based_translation
is foaf:primaryTopic of wikipedia-en:Statistical_machine_translation