Word-sense disambiguation (original) (raw)
Disambiguierung (von lateinisch dis- „zer-, un-, auseinander“, und ambiguus „doppeldeutig, uneindeutig“) oder Begriffsklärung bezeichnet in der Sprachwissenschaft die Auflösung sprachlicher Mehrdeutigkeit (Ambiguität). Dabei wird für ein Wort oder einen Ausdruck in seinem Kontext eine eindeutige Bedeutung durch syntaktische oder semantische Zuordnung hergestellt (im Unterschied zu einer Begriffserklärung). Je nach Arbeitsfeld oder Theorie in Semiotik und Sprachwissenschaft finden sich weitere vergleichbare Bezeichnungen wie Monosemierung (Eindeutigmachung) oder Entambiguisierung (Vereindeutigung).
Property | Value |
---|---|
dbo:abstract | فك اللبس الدلالي (Word Sense Disambiguation) هو عملية اختيار المعنى المناسب لكل كلمة من كلمات الجملة على أساس السياق (Context). فمثلاً كلمة «مصرف» قد تأتي بمعنى «مكان آمن لحفظ الأموال» وقد تأتي بمعنى آخر «مجرى لصرف المياه» ويتمكن القارئ «البشري» من تحديد المعنى المراد عند قراءة الكلمة وفقًا للسياق الذي وردت فيه وذلك باستعانته بذكائه البشري وقدرته اللغوية ومعلوماته المعرفية. أما الحاسوب فعليه القيام بالعديد من العمليات الحاسوبية حتى يتمكن من فهم الجملة آليًّا وبالتالي تحديد المعنى المناسب وفقًا لفهمه. وتعتبر دقة التعرف على المعنى المناسب في غاية الأهمية أثناء المعالجة الآلية للغة وخاصة في مجال الترجمة الآلية فمثلاً كلمة «مصرف» ستؤدي إلى ترجمة مختلفة (Bank) أو (Drain) وفقًا للاختيار الذي توصل إليه نظام الترجمة الآلية. ومن خلال تحديد وترتيب المواضيع (Themes) المحتملة التي تدور حولها جملة ما بطريقة آلية، يتم فك اللبس الدلالي للكلمات الموضوعية. ويتم تحديد مجموعة المجالات المختلفة للجملة من خلال معلومات موضوعية (Thematic Information) مرتبطة بمعاني الكلمات بالإضافة إلى قواعد معرفية (Knowledge Base). فمثلاً ورود اسم «شارلي شابلن» في جملة ما يدل على أن المجال هو الفن وورود اسم «روبرتو كارلوس» في سياق ما يدل على أن الموضوع رياضي... وهكذا. ويتم فك اللبس الدلالي هذا بطريقة دقيقة من خلال إما تصفية المعاني بعيدة الاحتمال أو اختيار المعاني عالية الاحتمال. والقدرة الفائقة في تحديد مجال الجملة وفك اللبس الدلالي الموضوعي والمبني على مجال السياق، تمكن نظام المعالجة الآلية للغة العربية من فك لبس مبدئي للنص العربي بسرعة هائلة ودقة عالية قبل الانخراط في المراحل التحليلية التقدليدية التالية وبخاصة التحليل الصرفي والدلالي والتركيبي. وهذا التقليص من حجم اللبس الدلالي الموجه لمحركات المعالجة اللغوية التالية يؤدي إلى: 1-زيادة دقة التحليل الآلي وبالتالي دقة الفهم الآلي للنص العربي مما يؤدي إلى زيادة دقة التطبيقات المبنية عليه.2-تقليل الموارد الحاسوبية (Computational Resources) المطلوبة من حيث الذاكرة (Memory) والمعالج (CPU).3-تسريع عملية التحليل الآلي. ويتم استخدام هذه الطريقة المبتكرة في العديد من أنظمة المعالجة الآلية للغة العربية وعلى رأسها الترجمة الآلية (ar) Disambiguierung (von lateinisch dis- „zer-, un-, auseinander“, und ambiguus „doppeldeutig, uneindeutig“) oder Begriffsklärung bezeichnet in der Sprachwissenschaft die Auflösung sprachlicher Mehrdeutigkeit (Ambiguität). Dabei wird für ein Wort oder einen Ausdruck in seinem Kontext eine eindeutige Bedeutung durch syntaktische oder semantische Zuordnung hergestellt (im Unterschied zu einer Begriffserklärung). Je nach Arbeitsfeld oder Theorie in Semiotik und Sprachwissenschaft finden sich weitere vergleichbare Bezeichnungen wie Monosemierung (Eindeutigmachung) oder Entambiguisierung (Vereindeutigung). (de) Hizkuntzalaritza konputazionalean, hitzen adiera-desanbiguazioa (ingelesez Word sense disambiguation edo WSD) perpaus jakin batean hitz polisemiko batek duen adiera antzematean datzan prozesua da. Esate baterako, hori hitzak adiera ezberdinak izan ditzake testu-inguruaren arabera, hauek tartean: 1. * erak. Entzuten ari denaren inguruko pertsonei eta gauzei ezartzen zaien erakuslea (izenordain gisa ere erabil daiteke). (Harluxet) 2. * iz. Argi zuriaren espektroko hirugarren kolorea, laranjaren eta berdearen artekoa. (Harluxet) Eta adibide bezala honako perpaus hauek eman daitezke: 1. * Giltza honek horko ate hori irekitzen du. 2. * Galtza hori batzuk erosi ditut. Hizkuntza ezagutzen duen gizaki batentzako erraza da lehen esaldiko hori hitza 1. adierari, eta bigarren esaldikoa 2.ari dagokiola antzematea. Era automatikoan funtzinatuko duen algoritmo baten bitartez egitea, ordea, lan zaila da. (eu) En el ámbito de la lingüística computacional, la desambiguación del significado de las palabras es un problema abierto de procesamiento del lenguaje natural, que incluye el proceso de identificar con qué sentido se usa una palabra en los términos de una oración, o cuando la palabra en cuestión tiene polisemia, es decir, una pluralidad de significados. La solución de este problema afecta a otras tareas de la lingüística computacional, tales como el discurso, la mejora de la relevancia en los motores de búsqueda, la resolución de referencia, la coherencia textual (lingüística), la inferencia, y otros. (es) La désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc. Le cerveau humain est très habile pour désambiguïser les sens des mots. Le fait que les langues naturelles demandent souvent l'emploi de cette faculté est un reflet de l'habilité du cerveau dans ce domaine. Autrement dit, la mode de développement des langues humaines reflète (et a contribué à former) la capacité innée des réseaux de neurones du cerveau. Par contre, depuis longtemps, le traitement des langues naturelles et l'apprentissage automatique ont posé un défi à l'informatique. (fr) Dalam linguistik komputasi, disambiguasi makna atau pengawataksaan makna (bahasa Inggris: word sense disambiguation (WSD)) adalah masalah terbuka pemrosesan bahasa alami berupa proses identifikasi makna kata polisemi yang digunakan pada suatu kalimat. Penyelesaian masalah ini antara lain berdampak terhadap relevansi mesin pencari, pemecahan anafora, koherensi atau kepaduan, serta atau penyimpulan. Teknik-teknik yang dapat diterapkan antara lain adalah: * metode berbasis kamus yang menggunakan rujukan dari sumber leksikal * metode pembelajaran mesin terbimbing yang mengajarkan suatu penggolong untuk setiap kata pada contoh korpus yang dimaknai secara manual * metode tanpa bimbingan yang menggolongkan berdasarkan kemunculan kata. Dari berbagai metode ini, metode adalah algoritme yang paling berhasil sampai saat ini. Penelitian disambiguasi makna kata bahasa Inggris telah mencapai tingkat ketepatan (akurasi) yang cukup tinggi pada berbagai kelas kata dan sintaksis. Ketepatan di tingkat kasar (homograf) telah berhasil melewati 90%, sedangkan ketepatan di tingkat yang lebih halus berkisar antara 59%–69%. (in) 語義の曖昧性解消(ごぎのあいまいせいかいしょう、英語: Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。 自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する: * 彼はその仕事をやった。(ある動作をする) * その日はジャズをやった。(演奏/上映する) * プレゼントとして時計をやった。(譲渡する) * 机の上の本を向こうへやった。(どかす) * 心配なので人をやった。(遣いを出す) * 目を向こうへやった。(視線を投げる) 語義の曖昧性解消は機械翻訳などのアプリケーションで非常に重要である。たとえば日本語の「やる」という動詞のもつそれぞれの語義は、ほかの言語では別々の動詞(英語では play, give, remove など)によって表されているためである。現在の自然言語処理では、語義の曖昧性解消には単語のを使う手法が一般的である。 (ja) Word-sense disambiguation (WSD) is the process of identifying which sense of a word is meant in a sentence or other segment of context. In human language processing and cognition, it is usually subconscious/automatic but can often come to conscious attention when ambiguity impairs clarity of communication, given the pervasive polysemy in natural language. In computational linguistics, it is an open problem that affects other computer-related writing, such as discourse, improving relevance of search engines, anaphora resolution, coherence, and inference. Given that natural language requires reflection of neurological reality, as shaped by the abilities provided by the brain's neural networks, computer science has had a long-term challenge in developing the ability in computers to do natural language processing and machine learning. Many techniques have been researched, including dictionary-based methods that use the knowledge encoded in lexical resources, supervised machine learning methods in which a classifier is trained for each distinct word on a corpus of manually sense-annotated examples, and completely unsupervised methods that cluster occurrences of words, thereby inducing word senses. Among these, supervised learning approaches have been the most successful algorithms to date. Accuracy of current algorithms is difficult to state without a host of caveats. In English, accuracy at the coarse-grained (homograph) level is routinely above 90% (as of 2009), with some methods on particular homographs achieving over 96%. On finer-grained sense distinctions, top accuracies from 59.1% to 69.0% have been reported in evaluation exercises (SemEval-2007, Senseval-2), where the baseline accuracy of the simplest possible algorithm of always choosing the most frequent sense was 51.4% and 57%, respectively. (en) La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è il processo con il quale si precisa il significato di una parola o di un insieme di parole (frase), che denota significati diversi a seconda dei contesti, per evitare che sia ambigua. Il problema della disambiguazione, mediante appositi algoritmi, riveste particolare importanza nelle ricerche sull'intelligenza artificiale e, in particolare, sull'elaborazione del linguaggio naturale. Specificamente, si prevedono benefici della disambiguazione in programmi di traduzione automatica, recupero dell'informazione, estrazione automatica di informazioni, ecc. I due esempi seguenti riguardano significati distinti della parola rombo: 1. * Ho acquistato un rombo fresco al mercato 2. * Il rombo ha quattro lati della stessa lunghezza Sebbene per un essere umano sia ovvio che la prima frase si riferisce al significato di pesce e la seconda a quello di figura geometrica, sviluppare algoritmi per replicare questa capacità umana è tipicamente difficile. (it) Na linguística, desambiguação se refere ao processo de explicação à mensagem que possui mais de um sentido. Um termo ambíguo é, então, aquele que traz uma mensagem ou instrução confusa e que pode ser interpretado de mais de uma maneira. A desambiguação é utilizada tanto na escrita quanto na fala, na língua de sinais, e até em sistemas informatizados — quando dois objetos (ou ações, ou adjetivos, incluindo termos concretos e abstratos) possuem o mesmo nome. Na Wikipédia, as páginas de desambiguação referem-se a um mesmo termo que pode gerar mais que uma interpretação possível (conceitos distintos) a depender dos contextos. (pt) Разрешение лексической многозначности (англ. word sense disambiguation, WSD) — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения (или смысла) многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентности текста, при анализе умозаключений. Научные исследования по разрешению лексической многозначности находятся в поле зрения прикладной и компьютерной лингвистики достаточно давно и имеют многолетнюю историю. С течением лет количество предложенных решений и их эффективность неуклонно росли до тех пор, пока эффективность не достигла определённого уровня сравнительно-эффективных показателей точности для определённого спектра слов и типов многозначностей. Полного решения задача пока не получила, поскольку на пути успешного решения стоит много проблем, напрямую связанных с языковыми особенностями человеческой речи. Было исследовано большое количество методов: от методов, основанных на знаниях, правилах, лексикографических источников, обучения с учителем на корпусе текстов, до методов обучения без учителя, кластеризующие слова на основе смысла. Среди перечисленных, на сегодняшний день, методы обучения с учителем показали наилучшую эффективность. Однако, объективное сравнение и оценка методов является сложным процессом, зависящим от многих факторов. Для обобщённых систем словарных знаний (для английского языка) эффективность регулярно превышает планку в 90 %, иногда достигая даже 96 %. Для более дифференцированных словарных систем эффективность находятся в пределе 59 %-69 %. (ru) 计算机语言学中,词义消歧是一个 自然语言处理和本体论的开放问题。歧义与消歧是自然语言理解中最核心的问题,在词义、句义、篇章含义层次都会出现语言根据上下文语义不同的现象,消歧即指根据上下文确定对象语义的过程。词义消歧即在词语层次上的语义消歧。语义消歧/词义消歧 是自然语言处理任务的一个核心与难点,影响了几乎所有任务的性能,比如搜索引擎、意见挖掘、文本理解与产生、推理等。 在语言学长期发展的过程中,语言本身积累了许多一词多义的用法。语言的产生是多方面共同作用的结果。语言的使用是不断变化的,一个词在发展中有许多具体的意思,现在通用的还有一些意思。不同地区可能对一个词有不同 的用法,不同的行业对一个词也会不同,甚至不同群体、不同个人、不同语气都会有自己的特殊的解读意思。语义消歧是一种语言理解的方式,一方面我们要理解通用词语一词多义的含义及应用,另一方面,还要考虑到具体场景,运用相关知识库、语料训练来增加一词多义的性能。 迄今为止,丰富多样的技术已经被研究,以词典为基础的方法,使用知识库与知识图谱技术的,监督学习的,无监督的,半监督的,基于词或者词向量的。基于各种资源的、半监督的、同时基于词与词向量的应该是发展的方向。 (zh) |
dbo:wikiPageExternalLink | http://www.dsi.uniroma1.it/~navigli/pubs/ACM_Survey_2009_Navigli.pdf http://www.itri.brighton.ac.uk/events/senseval/ARCHIVE/index.html http://www.dsi.uniroma1.it/~navigli/pubs/PAMI_2010_Navigli_Lapata.pdf http://www.senseval.org/senseval3 http://lit.csci.unt.edu/~rada/downloads/semcor/semcor3.0.tar.gz https://books.google.com/books%3Fid=GLck75U20pAC&printsec=frontcover%23v=onepage&q&f=false https://web.archive.org/web/20051028182727/http:/www.up.univ-mrs.fr/~veronis/pdf/1998wsd.pdf https://web.archive.org/web/20080724205315/http:/www.cs.unt.edu/~rada/papers/mihalcea.naacl07.pdf https://web.archive.org/web/20100611071609/http:/nlp.cs.swarthmore.edu/semeval/ https://web.archive.org/web/20100704094713/http:/www.aclweb.org/anthology-new/J/J98/ https://web.archive.org/web/20100705121033/http:/193.133.140.102/senseval2/ https://web.archive.org/web/20110629100707/http:/acl.ldc.upenn.edu/P/P06/P06-1014.pdf https://web.archive.org/web/20110629121208/http:/acl.ldc.upenn.edu/acl2004/senseval/ps/snyder.ps https://web.archive.org/web/20110930012121/http:/aclweb.org/anthology-new/P/P10/P10-1154.pdf https://web.archive.org/web/20130727145846/http:/www.youtube.com/watch%3Fv=KSrUHGaUE_c http://www.hutchinsweb.me.uk/MTNI-22-1999.pdf http://www.kilgarriff.co.uk/Publications/1997-K-CHum-believe.pdf http://acl.ldc.upenn.edu/E/E06/E06-1016.pdf http://acl.ldc.upenn.edu/W/W02/W02-0808.pdf http://nlp.stanford.edu/fsnlp/ http://www.cs.jhu.edu/~yarowsky/acl95.ps http://www.cs.jhu.edu/~yarowsky/pubs/coling92.ps http://www.cs.jhu.edu/~yarowsky/pubs/nle00.ps http://www.cse.ohio-state.edu/~cbrew/732/labs/p24-lesk.pdf http://www.itri.brighton.ac.uk/events/senseval/SENSEVAL2/task-design.ps http://www.dsi.uniroma1.it/~navigli/pubs/EMNLP_2010_Navigli_Crisafulli.pdf http://www.dsi.uniroma1.it/~navigli/pubs/LRE_2009_McCarthy_Navigli.pdf http://www.dsi.uniroma1.it/~navigli/pubs/PAMI_2005_Navigli_Velardi.pdf http://www.ijcai.org/papers09/Papers/IJCAI09-251.pdf http://trimc-nlp.blogspot.com/2013/05/word-sense-disambiguation-wsd.html http://www.cfilt.iitb.ac.in/wordnet/webhwn/ http://www.senseval.org http://www.wsdbook.org http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00148 https://ghostarchive.org/varchive/youtube/20211211/KSrUHGaUE_c https://www.youtube.com/watch%3Fv=KSrUHGaUE_c%7Ctitle=Computers http://www.stanford.edu/~jurafsky/wordsenses_emnlp07.pdf http://www.scholarpedia.org/article/Word_sense_disambiguation http://homepages.inf.ed.ac.uk/keller/papers/naacl07.pdf http://www.aclweb.org/anthology-new/J/J98/J98-1001.pdf http://www.aclweb.org/anthology/J/J07/J07-4005.pdf http://www.aclweb.org/anthology/J/J98/J98-1004.pdf http://www.aclweb.org/anthology/J03-3001.pdf http://www.aclweb.org/anthology/S/S07/S07-1006.pdf http://www.aclweb.org/anthology/S/S07/S07-1016.pdf http://www.aclweb.org/anthology/W/W04/W04-3249.pdf http://www.d.umn.edu/~tpederse/WSDTutorial.html http://aclweb.org/anthology/W/W04/W04-2807.pdf |
dbo:wikiPageID | 67065 (xsd:integer) |
dbo:wikiPageLength | 52693 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1122561785 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Roget's_Thesaurus dbr:Ensemble_learning dbr:Entity_linking dbr:Naive_Bayes_classifier dbr:Natural_language_processing dbr:Kernel_methods dbr:Bilingual dbr:Algorithm dbr:Upper_bound dbr:Variance dbr:Decision_tree dbr:Degree_(graph_theory) dbr:Douglas_Lenat dbr:Inference dbr:Information_retrieval dbr:Inter-rater_reliability dbr:John_Ball_(cognitive_scientist) dbr:Lexical_resource dbr:Lexical_substitution dbr:Lexicography dbr:Lexicon dbr:Yarowsky_algorithm dbr:Common_sense dbr:Computational_science dbr:Connectivity_(graph_theory) dbr:Open_Mind_Common_Sense dbr:Graph_(discrete_mathematics) dbr:Consciousness dbr:Context_(language_use) dbr:Controlled_natural_language dbr:Corpus_linguistics dbr:Machine_learning dbr:Cluster_analysis dbr:Collocation dbr:Computational_linguistics dbr:Feature_selection dbr:Lesk_algorithm dbr:Synonym dbc:Semantics dbr:Training_set dbr:Data_set dbr:Warren_Weaver dbr:Web_search_engine dbr:Wikipedia dbr:Domain_adaptation dbr:Classic_monolingual_WSD dbr:Open_problem dbr:Spreading_activation dbr:AI dbr:Anaphora_(linguistics) dbr:Ambiguity dbr:Biological_neural_network dbr:Discourse dbr:Gloss_(annotation) dbr:Judicial_interpretation dbr:Knowledge_acquisition dbr:Knowledge_base dbr:Text_corpus dbr:Sentence_boundary_disambiguation dbr:Search_engine dbr:Part-of-speech_tagging dbr:Hindi dbr:BabelNet dbc:Lexical_semantics dbc:Computational_linguistics dbc:Natural_language_processing dbc:Ambiguity dbr:Advanced_learner's_dictionary dbr:Language dbr:Language_processing_in_the_brain dbr:Support_vector_machine dbr:Co-occurrence dbr:Cognition dbr:Coherence_(linguistics) dbr:Homograph dbr:Thesaurus dbr:Translation dbr:Word dbr:Dictionary dbr:Automatic_acquisition_of_sense-tagged_corpora dbc:Word-sense_disambiguation dbr:Margaret_Masterman dbr:Bootstrapping dbr:Constraint-based_grammar dbr:Knowledge dbr:Ontologies dbr:Cataphora dbr:Reasoning dbr:WordNet dbr:Yehoshua_Bar-Hillel dbr:Yorick_Wilks dbr:YouTube dbr:Machine-readable_dictionary dbr:Map_(mathematics) dbr:Semantic_role_labeling dbr:Semi-supervised_learning dbr:Semantic_similarity dbr:Sentence_(linguistics) dbr:Similarity_measure dbr:Word_sense dbr:Semantic_unification dbr:World_Wide_Web dbr:Type_inference dbr:Syntactic_ambiguity dbr:Natural_language dbr:Unsupervised_learning dbr:Test_set dbr:Polysemy dbr:Pragmatics dbr:SemEval dbr:Word_embedding dbr:Semantic_network dbr:Supervised_learning dbr:Thesauri dbr:Word_Sense_Induction dbr:Support_Vector_Machines dbr:Word_Sense_Induction_and_Disambiguation_task dbr:Word_frequency_list dbr:Word_sense_discrimination dbr:Word_sense_induction dbr:Semeval dbr:Parallel_corpora dbr:Anaphora_resolution dbr:Fine-grained dbr:Synsets dbr:Classifier_(mathematics) dbr:Relatedness dbr:Supervised_machine_learning dbr:Princeton_WordNet dbr:Coarse-grained dbr:Common_sense_ontology dbr:Commonsense_knowledge_bases dbr:Semantic_relation dbr:Senseval dbr:Memory-based_learning dbr:Multilingual_and_Crosslingual_WSD dbr:Stoplist |
dbp:wikiPageUsesTemplate | dbt:Authority_control dbt:Cbignore dbt:Citation_needed dbt:Cite_book dbt:Cite_web dbt:Main dbt:Portal dbt:Redirect dbt:Reflist dbt:Sfn dbt:Short_description dbt:When dbt:Wiktionary dbt:Natural_Language_Processing |
dcterms:subject | dbc:Semantics dbc:Lexical_semantics dbc:Computational_linguistics dbc:Natural_language_processing dbc:Ambiguity dbc:Word-sense_disambiguation |
gold:hypernym | dbr:Problem |
rdf:type | owl:Thing dbo:Disease |
rdfs:comment | Disambiguierung (von lateinisch dis- „zer-, un-, auseinander“, und ambiguus „doppeldeutig, uneindeutig“) oder Begriffsklärung bezeichnet in der Sprachwissenschaft die Auflösung sprachlicher Mehrdeutigkeit (Ambiguität). Dabei wird für ein Wort oder einen Ausdruck in seinem Kontext eine eindeutige Bedeutung durch syntaktische oder semantische Zuordnung hergestellt (im Unterschied zu einer Begriffserklärung). Je nach Arbeitsfeld oder Theorie in Semiotik und Sprachwissenschaft finden sich weitere vergleichbare Bezeichnungen wie Monosemierung (Eindeutigmachung) oder Entambiguisierung (Vereindeutigung). (de) 語義の曖昧性解消(ごぎのあいまいせいかいしょう、英語: Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。 自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する: * 彼はその仕事をやった。(ある動作をする) * その日はジャズをやった。(演奏/上映する) * プレゼントとして時計をやった。(譲渡する) * 机の上の本を向こうへやった。(どかす) * 心配なので人をやった。(遣いを出す) * 目を向こうへやった。(視線を投げる) 語義の曖昧性解消は機械翻訳などのアプリケーションで非常に重要である。たとえば日本語の「やる」という動詞のもつそれぞれの語義は、ほかの言語では別々の動詞(英語では play, give, remove など)によって表されているためである。現在の自然言語処理では、語義の曖昧性解消には単語のを使う手法が一般的である。 (ja) 计算机语言学中,词义消歧是一个 自然语言处理和本体论的开放问题。歧义与消歧是自然语言理解中最核心的问题,在词义、句义、篇章含义层次都会出现语言根据上下文语义不同的现象,消歧即指根据上下文确定对象语义的过程。词义消歧即在词语层次上的语义消歧。语义消歧/词义消歧 是自然语言处理任务的一个核心与难点,影响了几乎所有任务的性能,比如搜索引擎、意见挖掘、文本理解与产生、推理等。 在语言学长期发展的过程中,语言本身积累了许多一词多义的用法。语言的产生是多方面共同作用的结果。语言的使用是不断变化的,一个词在发展中有许多具体的意思,现在通用的还有一些意思。不同地区可能对一个词有不同 的用法,不同的行业对一个词也会不同,甚至不同群体、不同个人、不同语气都会有自己的特殊的解读意思。语义消歧是一种语言理解的方式,一方面我们要理解通用词语一词多义的含义及应用,另一方面,还要考虑到具体场景,运用相关知识库、语料训练来增加一词多义的性能。 迄今为止,丰富多样的技术已经被研究,以词典为基础的方法,使用知识库与知识图谱技术的,监督学习的,无监督的,半监督的,基于词或者词向量的。基于各种资源的、半监督的、同时基于词与词向量的应该是发展的方向。 (zh) فك اللبس الدلالي (Word Sense Disambiguation) هو عملية اختيار المعنى المناسب لكل كلمة من كلمات الجملة على أساس السياق (Context). فمثلاً كلمة «مصرف» قد تأتي بمعنى «مكان آمن لحفظ الأموال» وقد تأتي بمعنى آخر «مجرى لصرف المياه» ويتمكن القارئ «البشري» من تحديد المعنى المراد عند قراءة الكلمة وفقًا للسياق الذي وردت فيه وذلك باستعانته بذكائه البشري وقدرته اللغوية ومعلوماته المعرفية. أما الحاسوب فعليه القيام بالعديد من العمليات الحاسوبية حتى يتمكن من فهم الجملة آليًّا وبالتالي تحديد المعنى المناسب وفقًا لفهمه. وهذا التقليص من حجم اللبس الدلالي الموجه لمحركات المعالجة اللغوية التالية يؤدي إلى: (ar) En el ámbito de la lingüística computacional, la desambiguación del significado de las palabras es un problema abierto de procesamiento del lenguaje natural, que incluye el proceso de identificar con qué sentido se usa una palabra en los términos de una oración, o cuando la palabra en cuestión tiene polisemia, es decir, una pluralidad de significados. (es) Hizkuntzalaritza konputazionalean, hitzen adiera-desanbiguazioa (ingelesez Word sense disambiguation edo WSD) perpaus jakin batean hitz polisemiko batek duen adiera antzematean datzan prozesua da. Esate baterako, hori hitzak adiera ezberdinak izan ditzake testu-inguruaren arabera, hauek tartean: 1. * erak. Entzuten ari denaren inguruko pertsonei eta gauzei ezartzen zaien erakuslea (izenordain gisa ere erabil daiteke). (Harluxet) 2. * iz. Argi zuriaren espektroko hirugarren kolorea, laranjaren eta berdearen artekoa. (Harluxet) Eta adibide bezala honako perpaus hauek eman daitezke: (eu) Dalam linguistik komputasi, disambiguasi makna atau pengawataksaan makna (bahasa Inggris: word sense disambiguation (WSD)) adalah masalah terbuka pemrosesan bahasa alami berupa proses identifikasi makna kata polisemi yang digunakan pada suatu kalimat. Penyelesaian masalah ini antara lain berdampak terhadap relevansi mesin pencari, pemecahan anafora, koherensi atau kepaduan, serta atau penyimpulan. Teknik-teknik yang dapat diterapkan antara lain adalah: Dari berbagai metode ini, metode adalah algoritme yang paling berhasil sampai saat ini. (in) Word-sense disambiguation (WSD) is the process of identifying which sense of a word is meant in a sentence or other segment of context. In human language processing and cognition, it is usually subconscious/automatic but can often come to conscious attention when ambiguity impairs clarity of communication, given the pervasive polysemy in natural language. In computational linguistics, it is an open problem that affects other computer-related writing, such as discourse, improving relevance of search engines, anaphora resolution, coherence, and inference. (en) La désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc. (fr) La disambiguazione (in inglese Word Sense Disambiguation o, abbreviato, WSD) è il processo con il quale si precisa il significato di una parola o di un insieme di parole (frase), che denota significati diversi a seconda dei contesti, per evitare che sia ambigua. I due esempi seguenti riguardano significati distinti della parola rombo: 1. * Ho acquistato un rombo fresco al mercato 2. * Il rombo ha quattro lati della stessa lunghezza (it) Разрешение лексической многозначности (англ. word sense disambiguation, WSD) — это неразрешенная проблема обработки естественного языка, которая заключается в задаче выбора значения (или смысла) многозначного слова или словосочетания в зависимости от контекста, в котором оно находится. Данная задача возникает в дискурсивном анализе, при оптимизации релевантности результатов поисковыми системами, при разрешении анафорических отсылок, в исследовании лингвистической когерентности текста, при анализе умозаключений. (ru) Na linguística, desambiguação se refere ao processo de explicação à mensagem que possui mais de um sentido. Um termo ambíguo é, então, aquele que traz uma mensagem ou instrução confusa e que pode ser interpretado de mais de uma maneira. A desambiguação é utilizada tanto na escrita quanto na fala, na língua de sinais, e até em sistemas informatizados — quando dois objetos (ou ações, ou adjetivos, incluindo termos concretos e abstratos) possuem o mesmo nome. (pt) |
rdfs:label | Word-sense disambiguation (en) فك التباس دلالة الكلمة (ar) Disambiguierung (de) Desambiguación lingüística (es) Hitzen adiera-desanbiguazioa (eu) Disambiguasi makna (in) Disambiguazione (it) Désambiguïsation lexicale (fr) 語義の曖昧性解消 (ja) Desambiguação (pt) Разрешение лексической многозначности (ru) 词义消歧 (zh) |
owl:sameAs | freebase:Word-sense disambiguation http://d-nb.info/gnd/4233548-6 wikidata:Word-sense disambiguation dbpedia-ar:Word-sense disambiguation http://bn.dbpedia.org/resource/শব্দার্থে_দ্ব্যর্থতা_নিরসন dbpedia-de:Word-sense disambiguation dbpedia-es:Word-sense disambiguation dbpedia-eu:Word-sense disambiguation dbpedia-fi:Word-sense disambiguation dbpedia-fr:Word-sense disambiguation http://hi.dbpedia.org/resource/विसंदिग्धार्थीकरण dbpedia-id:Word-sense disambiguation dbpedia-it:Word-sense disambiguation dbpedia-ja:Word-sense disambiguation http://min.dbpedia.org/resource/Disambiguasi_makna dbpedia-ms:Word-sense disambiguation http://my.dbpedia.org/resource/သံတူကြောင်းကွဲ dbpedia-pt:Word-sense disambiguation dbpedia-ru:Word-sense disambiguation dbpedia-sh:Word-sense disambiguation dbpedia-sl:Word-sense disambiguation dbpedia-vi:Word-sense disambiguation http://wa.dbpedia.org/resource/Discramiaedje_des_sinses_d'_on_mot dbpedia-zh:Word-sense disambiguation https://global.dbpedia.org/id/4Vbdp |
prov:wasDerivedFrom | wikipedia-en:Word-sense_disambiguation?oldid=1122561785&ns=0 |
foaf:isPrimaryTopicOf | wikipedia-en:Word-sense_disambiguation |
is dbo:knownFor of | dbr:Pushpak_Bhattacharyya |
is dbo:wikiPageDisambiguates of | dbr:WSD |
is dbo:wikiPageRedirects of | dbr:List_of_software_for_word-sense_disambiguation dbr:Unsupervised_methods_for_word-sense_disambiguation dbr:Unsupervised_word-sense_disambiguation dbr:Dictionary-based_methods_for_word-sense_disambiguation dbr:Disamb dbr:Disambiguation dbr:Disambiguator dbr:Term_disambiguation dbr:Knowledge-based_methods_for_word-sense_disambiguation dbr:Semi-supervised_methods_for_word-sense_disambiguation dbr:Word_Sense_Disambiguation dbr:Word_sense_disambiguation dbr:Word–sense_disambiguation dbr:Disambigation dbr:Disambiguate dbr:Disambiguations dbr:Disambigution dbr:Disamgibuation dbr:Word_disambiguity dbr:Lexical_disambiguation dbr:Disambig |
is dbo:wikiPageWikiLink of | dbr:Pushpak_Bhattacharyya dbr:Natural_language_processing dbr:Progress_in_artificial_intelligence dbr:List_of_software_for_word-sense_disambiguation dbr:Unsupervised_methods_for_word-sense_disambiguation dbr:Unsupervised_word-sense_disambiguation dbr:Double_negative dbr:Index_of_linguistics_articles dbr:Lexical_chain dbr:Lexical_semantics dbr:Word-sense_induction dbr:Swiftype dbr:Geographic_information_retrieval dbr:Context_(language_use) dbr:Controlled_natural_language dbr:Arabic_Ontology dbr:Simpli dbr:Componential_analysis dbr:Computational_semantics dbr:Lesk_algorithm dbr:Synonym dbr:Tropes_Zoom dbr:Wikipedia dbr:Document-term_matrix dbr:Ambiguity dbr:Erzgebirgisch dbr:Evi_(software) dbr:Ambiguity_(disambiguation) dbr:British_National_Corpus dbr:Paola_Velardi dbr:DisCoCat dbr:List_of_HTTP_status_codes dbr:Semantic_decomposition_(natural_language_processing) dbr:Refer dbr:AI-complete dbr:AI_winter dbr:TenTen_Corpus_Family dbr:Thesaurus dbr:Dictionary-based_methods_for_word-sense_disambiguation dbr:Dinosaur'us dbr:Disamb dbr:Disambiguation dbr:Disambiguator dbr:Authority_control dbr:Marti_Hearst dbr:UBY dbr:Term_disambiguation dbr:Knowledge-based_methods_for_word-sense_disambiguation dbr:Search_engine_technology dbr:Semi-supervised_methods_for_word-sense_disambiguation dbr:WordNet dbr:Word_Sense_Disambiguation dbr:Word_sense_disambiguation dbr:Word–sense_disambiguation dbr:Machine_translation dbr:Word_sense dbr:WSD dbr:Europarl_Corpus dbr:Disambigation dbr:Disambiguate dbr:Disambiguations dbr:Disambigution dbr:Disamgibuation dbr:List_of_unsolved_problems_in_linguistics dbr:PlWordNet dbr:Sliding_window_based_part-of-speech_tagging dbr:SemEval dbr:Outline_of_natural_language_processing dbr:Semantic_network dbr:Word_disambiguity dbr:Lexical_disambiguation dbr:Disambig |
is foaf:primaryTopic of | wikipedia-en:Word-sense_disambiguation |