dbo:abstract |
Document clustering (or text clustering) is the application of cluster analysis to textual documents. It has applications in automatic document organization, topic extraction and fast information retrieval or filtering. (en) Кластериза́ция докуме́нтов — одна из задач информационного поиска.Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее. (ru) Кластериза́ція докуме́нтів — одне із завдань інформаційного пошуку.Метою кластеризації документів є автоматичне виявлення груп семантично схожих документів серед заданої фіксованої множини документів. Слід зазначити, що групи формуються тільки на основі попарної схожості описів документів, і ніякі характеристики цих груп не задаються заздалегідь, на відміну від класифікації документів, де категорії задаються заздалегідь. (uk) |
dbo:wikiPageExternalLink |
http://eprints.cs.vt.edu/archive/00001000/01/docclust.pdf https://link.springer.com/article/10.1007/s11063-017-9597-3 |
dbo:wikiPageID |
14663145 (xsd:integer) |
dbo:wikiPageLength |
6815 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID |
1118774715 (xsd:integer) |
dbo:wikiPageWikiLink |
dbr:Punctuation dbr:Information_retrieval dbc:Information_retrieval_techniques dbr:Cluster_Analysis dbr:Stop_words dbr:Cluster_analysis dbr:Cluster_labeling dbr:Cluster_(disambiguation) dbr:Stemming dbr:Tokenization_(lexical_analysis) dbr:Topic_(linguistics) dbr:Web_search_engine dbr:Fuzzy_clustering dbr:Dimensionality_reduction dbr:Bag-of-words_model dbr:Ontology_(information_science) dbr:Multidimensional_scaling dbr:Latent_semantic_indexing dbr:Tf-idf dbr:N-gram_model dbr:Topic_model dbr:Supervised_learning dbr:Lemmatization dbr:K-means_algorithm dbr:Truncated_singular_value_decomposition |
dbp:wikiPageUsesTemplate |
dbt:Natural_language_processing dbt:Disputed dbt:ISSN dbt:More_footnotes_needed dbt:Multiple_issues dbt:Reflist dbt:Rp |
dct:subject |
dbc:Information_retrieval_techniques |
gold:hypernym |
dbr:Application |
rdf:type |
dbo:Software |
rdfs:comment |
Document clustering (or text clustering) is the application of cluster analysis to textual documents. It has applications in automatic document organization, topic extraction and fast information retrieval or filtering. (en) Кластериза́ция докуме́нтов — одна из задач информационного поиска.Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее. (ru) Кластериза́ція докуме́нтів — одне із завдань інформаційного пошуку.Метою кластеризації документів є автоматичне виявлення груп семантично схожих документів серед заданої фіксованої множини документів. Слід зазначити, що групи формуються тільки на основі попарної схожості описів документів, і ніякі характеристики цих груп не задаються заздалегідь, на відміну від класифікації документів, де категорії задаються заздалегідь. (uk) |
rdfs:label |
Document clustering (en) Кластеризация документов (ru) Кластеризація документів (uk) |
owl:sameAs |
freebase:Document clustering yago-res:Document clustering wikidata:Document clustering dbpedia-ru:Document clustering dbpedia-uk:Document clustering https://global.dbpedia.org/id/3uoGo |
prov:wasDerivedFrom |
wikipedia-en:Document_clustering?oldid=1118774715&ns=0 |
foaf:isPrimaryTopicOf |
wikipedia-en:Document_clustering |
is dbo:wikiPageRedirects of |
dbr:Algorithms_for_document_clustering dbr:Text_clustering |
is dbo:wikiPageWikiLink of |
dbr:Non-negative_matrix_factorization dbr:Vivisimo dbr:Lexical_chain dbr:Random_indexing dbr:Cluster_labeling dbr:MapReduce dbr:MeaningCloud dbr:Distributional_semantics dbr:Document_classification dbr:Algorithms_for_document_clustering dbr:Dirichlet-multinomial_distribution dbr:Lemur_Project dbr:Biomedical_text_mining dbr:Citation_analysis dbr:MinHash dbr:Software_mining dbr:Text_clustering |
is foaf:primaryTopic of |
wikipedia-en:Document_clustering |