Language identification (original) (raw)

Rozpoznávání jazyka textového dokumentu je založené na statistickém N-gramovém modelu. N-gramové modely pracují se slovy (např. rozpoznání řeči) nebo se znaky (např. rozpoznání jazyka). Nejdříve se natrénuje N-gramový model pro jednotlivé jazyky, které se mají rozpoznávat, poté se určí skóre rozpoznávaného textu pro všechny modely a model s nejvyšším skórem je určen za rozpoznaný jazyk.

Property	Value
dbo:abstract	Rozpoznávání jazyka textového dokumentu je založené na statistickém N-gramovém modelu. N-gramové modely pracují se slovy (např. rozpoznání řeči) nebo se znaky (např. rozpoznání jazyka). Nejdříve se natrénuje N-gramový model pro jednotlivé jazyky, které se mají rozpoznávat, poté se určí skóre rozpoznávaného textu pro všechny modely a model s nejvyšším skórem je určen za rozpoznaný jazyk. (cs) Hizkuntzaren identifikazioa emandako eduki bati dagokion lengoaia naturala antzematean datza. Tradizionalki, hizkuntzaren identifikazioa lengoaietan ohikoak eta errepikakorrak diren hitz eta letrak aurkitzean oinarritu izan da. Azkenaldian, ordea, hurbilketa konputazionalak erabili dira arazoa ebazteko, hizkuntzaren identifikazioa bezala kontsideratuz, zeina metodo estatistikoetan oinarritzen den. (eu) In natural language processing, language identification or language guessing is the problem of determining which natural language given content is in. Computational approaches to this problem view it as a special case of text categorization, solved with various statistical methods. (en) 언어 인식(Language Recognition (speech))이란 사람이 말하는 음성이 어떤 언어에 해당하는 음성인지를 판별하는 프로세스를 의미한다. 주로, 으로 인식된 사람의 목소리를 각 언어별 음성 인식 시스템이 넣기 전에 어떤 언어로 되어있는지 파악하기 위해 사용된다. (ko) Идентификация языка (англ. language identification), в методике обработки естественного языка — определение языка. Проблема идентификации языка является особым случаем категоризации текста и решается с использованием статистических методов. (ru) Ідентифікація мови (англ. language identification), в методиці обробки природної мови — визначення мови. Проблема ідентифікації мови є особливим випадком категоризації тексту і вирішується з використанням статистичних методів. (uk)
dbo:wikiPageExternalLink	https://link.springer.com/chapter/10.1007%2F978-3-642-00382-0_29 http://www.aclweb.org/anthology/W/W14/W14-5307.pdf http://www.aclweb.org/anthology/W/W14/W14-5316.pdf http://homepages.cwi.nl/~paulv/papers/cluster.pdf http://hmi.ewi.utwente.nl/Conferences/clin2001.html http://www.ccs.neu.edu/home/jaa/CSG399.05F/Topics/Papers/BenedettoCaLo.pdf http://research.microsoft.com/~joshuago/physicslongcomment.ps https://web.archive.org/web/20120309105130/http:/samarcanda.phys.uniroma1.it/vittorioloreto/research-topics/complexity-theory/ https://web.archive.org/web/20150202032516/http:/www.uni-koeln.de/~mzampier/papers/bucc2014.pdf http://citeseerx.ist.psu.edu/viewdoc/summary%3Fdoi=10.1.1.53.9367 http://www.economist.com/science/displayStory.cfm%3Fstory_id=975770
dbo:wikiPageID	8642422 (xsd:integer)
dbo:wikiPageLength	8099 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1121159264 (xsd:integer)
dbo:wikiPageWikiLink	dbr:N-gram dbr:Natural_language_processing dbr:Algorithmic_information_theory dbc:Translation dbr:Intuition dbc:Applications_of_artificial_intelligence dbc:Tasks_of_natural_language_processing dbr:Function_word dbr:Apache_OpenNLP dbr:Apache_Tika dbr:Macedonian_language dbr:Malay_language dbr:Bulgarian_language dbr:Charset_detection dbr:Kolmogorov_complexity dbr:Statistical dbr:Artificial_grammar_learning dbc:Computational_linguistics dbc:Machine_translation dbc:Natural_language_processing dbr:Translation dbr:Diacritic dbr:Indonesian_language dbr:Machine_translation dbr:Language_Analysis_for_the_Determination_of_Origin dbr:Natural_language dbr:Native_Language_Identification dbr:Text_categorization dbr:Family_name_affixes dbr:Wikipedia:Language_recognition_chart
dbp:wikiPageUsesTemplate	dbt:Cn dbt:For dbt:Reflist dbt:Short_description dbt:Self_reference
dcterms:subject	dbc:Translation dbc:Applications_of_artificial_intelligence dbc:Tasks_of_natural_language_processing dbc:Computational_linguistics dbc:Machine_translation dbc:Natural_language_processing
gold:hypernym	dbr:Problem
rdf:type	yago:WikicatArtificialIntelligenceApplications yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Application106570110 yago:Code106355894 yago:CodingSystem106353757 yago:Communication100033020 yago:Event100029378 yago:Program106568978 yago:PsychologicalFeature100023100 yago:Work100575741 yago:Writing106359877 yago:WrittenCommunication106349220 yago:YagoPermanentlyLocatedEntity dbo:Disease yago:Software106566077 yago:Undertaking100795720 yago:WikicatTasksOfNaturalLanguageProcessing
rdfs:comment	Rozpoznávání jazyka textového dokumentu je založené na statistickém N-gramovém modelu. N-gramové modely pracují se slovy (např. rozpoznání řeči) nebo se znaky (např. rozpoznání jazyka). Nejdříve se natrénuje N-gramový model pro jednotlivé jazyky, které se mají rozpoznávat, poté se určí skóre rozpoznávaného textu pro všechny modely a model s nejvyšším skórem je určen za rozpoznaný jazyk. (cs) Hizkuntzaren identifikazioa emandako eduki bati dagokion lengoaia naturala antzematean datza. Tradizionalki, hizkuntzaren identifikazioa lengoaietan ohikoak eta errepikakorrak diren hitz eta letrak aurkitzean oinarritu izan da. Azkenaldian, ordea, hurbilketa konputazionalak erabili dira arazoa ebazteko, hizkuntzaren identifikazioa bezala kontsideratuz, zeina metodo estatistikoetan oinarritzen den. (eu) In natural language processing, language identification or language guessing is the problem of determining which natural language given content is in. Computational approaches to this problem view it as a special case of text categorization, solved with various statistical methods. (en) 언어 인식(Language Recognition (speech))이란 사람이 말하는 음성이 어떤 언어에 해당하는 음성인지를 판별하는 프로세스를 의미한다. 주로, 으로 인식된 사람의 목소리를 각 언어별 음성 인식 시스템이 넣기 전에 어떤 언어로 되어있는지 파악하기 위해 사용된다. (ko) Идентификация языка (англ. language identification), в методике обработки естественного языка — определение языка. Проблема идентификации языка является особым случаем категоризации текста и решается с использованием статистических методов. (ru) Ідентифікація мови (англ. language identification), в методиці обробки природної мови — визначення мови. Проблема ідентифікації мови є особливим випадком категоризації тексту і вирішується з використанням статистичних методів. (uk)
rdfs:label	Rozpoznávání jazyka (cs) Hizkuntzaren identifikazioa (eu) Language identification (en) 언어 인식 (ko) Идентификация языка (ru) Визначення мови (uk)
owl:sameAs	freebase:Language identification yago-res:Language identification wikidata:Language identification dbpedia-cs:Language identification dbpedia-eu:Language identification dbpedia-fi:Language identification dbpedia-ko:Language identification dbpedia-ru:Language identification dbpedia-sl:Language identification dbpedia-uk:Language identification https://global.dbpedia.org/id/8dpQ
prov:wasDerivedFrom	wikipedia-en:Language_identification?oldid=1121159264&ns=0
foaf:isPrimaryTopicOf	wikipedia-en:Language_identification
is dbo:wikiPageDisambiguates of	dbr:Identification
is dbo:wikiPageRedirects of	dbr:Automatic_language_detection dbr:Automatic_language_identification dbr:Language_detection dbr:Language_guessing dbr:Language_identifying
is dbo:wikiPageWikiLink of	dbr:N-gram dbr:Algorithmic_learning_theory dbr:Virtaal dbr:Letter_frequency dbr:Google_Translate dbr:LRE_Map dbr:Apache_OpenNLP dbr:Basis_Technology dbr:Semantic_audio dbr:Document_classification dbr:LanguageWare dbr:Charset_detection dbr:Knowledge_extraction dbr:List_of_family_name_affixes dbr:Recognition dbr:Sogou dbr:Spark_NLP dbr:Identification dbr:Search_engine_indexing dbr:Outline_of_artificial_intelligence dbr:Tatoeba dbr:Language_recognition dbr:Automatic_language_detection dbr:Automatic_language_identification dbr:Language_detection dbr:Language_guessing dbr:Language_identifying
is foaf:primaryTopic of	wikipedia-en:Language_identification