Document clustering (original) (raw)

Property Value
dbo:abstract Document clustering (or text clustering) is the application of cluster analysis to textual documents. It has applications in automatic document organization, topic extraction and fast information retrieval or filtering. (en) Кластериза́ция докуме́нтов — одна из задач информационного поиска.Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее. (ru) Кластериза́ція докуме́нтів — одне із завдань інформаційного пошуку.Метою кластеризації документів є автоматичне виявлення груп семантично схожих документів серед заданої фіксованої множини документів. Слід зазначити, що групи формуються тільки на основі попарної схожості описів документів, і ніякі характеристики цих груп не задаються заздалегідь, на відміну від класифікації документів, де категорії задаються заздалегідь. (uk)
dbo:wikiPageExternalLink http://eprints.cs.vt.edu/archive/00001000/01/docclust.pdf https://link.springer.com/article/10.1007/s11063-017-9597-3
dbo:wikiPageID 14663145 (xsd:integer)
dbo:wikiPageLength 6815 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1118774715 (xsd:integer)
dbo:wikiPageWikiLink dbr:Punctuation dbr:Information_retrieval dbc:Information_retrieval_techniques dbr:Cluster_Analysis dbr:Stop_words dbr:Cluster_analysis dbr:Cluster_labeling dbr:Cluster_(disambiguation) dbr:Stemming dbr:Tokenization_(lexical_analysis) dbr:Topic_(linguistics) dbr:Web_search_engine dbr:Fuzzy_clustering dbr:Dimensionality_reduction dbr:Bag-of-words_model dbr:Ontology_(information_science) dbr:Multidimensional_scaling dbr:Latent_semantic_indexing dbr:Tf-idf dbr:N-gram_model dbr:Topic_model dbr:Supervised_learning dbr:Lemmatization dbr:K-means_algorithm dbr:Truncated_singular_value_decomposition
dbp:wikiPageUsesTemplate dbt:Natural_language_processing dbt:Disputed dbt:ISSN dbt:More_footnotes_needed dbt:Multiple_issues dbt:Reflist dbt:Rp
dct:subject dbc:Information_retrieval_techniques
gold:hypernym dbr:Application
rdf:type dbo:Software
rdfs:comment Document clustering (or text clustering) is the application of cluster analysis to textual documents. It has applications in automatic document organization, topic extraction and fast information retrieval or filtering. (en) Кластериза́ция докуме́нтов — одна из задач информационного поиска.Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее. (ru) Кластериза́ція докуме́нтів — одне із завдань інформаційного пошуку.Метою кластеризації документів є автоматичне виявлення груп семантично схожих документів серед заданої фіксованої множини документів. Слід зазначити, що групи формуються тільки на основі попарної схожості описів документів, і ніякі характеристики цих груп не задаються заздалегідь, на відміну від класифікації документів, де категорії задаються заздалегідь. (uk)
rdfs:label Document clustering (en) Кластеризация документов (ru) Кластеризація документів (uk)
owl:sameAs freebase:Document clustering yago-res:Document clustering wikidata:Document clustering dbpedia-ru:Document clustering dbpedia-uk:Document clustering https://global.dbpedia.org/id/3uoGo
prov:wasDerivedFrom wikipedia-en:Document_clustering?oldid=1118774715&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Document_clustering
is dbo:wikiPageRedirects of dbr:Algorithms_for_document_clustering dbr:Text_clustering
is dbo:wikiPageWikiLink of dbr:Non-negative_matrix_factorization dbr:Vivisimo dbr:Lexical_chain dbr:Random_indexing dbr:Cluster_labeling dbr:MapReduce dbr:MeaningCloud dbr:Distributional_semantics dbr:Document_classification dbr:Algorithms_for_document_clustering dbr:Dirichlet-multinomial_distribution dbr:Lemur_Project dbr:Biomedical_text_mining dbr:Citation_analysis dbr:MinHash dbr:Software_mining dbr:Text_clustering
is foaf:primaryTopic of wikipedia-en:Document_clustering