MinHash (original) (raw)

About DBpedia

En komputoscienco, MinHaketo (aŭ la mininuma-sepdependa-permuta loko-zorga haketado) estas tekniko por rapide taksi la similecon de du aroj. La teknikon inventis , kaj oni unue uzis por la serĉilo por detekti kaj forigi kopiojn de retpaĝo el la serĉrezulto. Ĝi ankaŭ uziĝas por granda arigado, ekzemple arigi fajloj per simileco de iliaj enhavaj vortoj.

Property Value
dbo:abstract En komputoscienco, MinHaketo (aŭ la mininuma-sepdependa-permuta loko-zorga haketado) estas tekniko por rapide taksi la similecon de du aroj. La teknikon inventis , kaj oni unue uzis por la serĉilo por detekti kaj forigi kopiojn de retpaĝo el la serĉrezulto. Ĝi ankaŭ uziĝas por granda arigado, ekzemple arigi fajloj per simileco de iliaj enhavaj vortoj. (eo) En ciencia de la computacion, MinHash (o el esquema sensible a localidad que trata permutaciones independientes relativos al mínimo) es una técnica para estimar rápidamente cuan similares son dos conjuntos. El esquema fue inventado por Andrei Broder en 1997 ,​ e inicialmente usado en el motor de búsqueda AltaVista para detectar páginas web duplicadas y eliminarlas de los resultados de búsqueda.​También ha sido aplicado en problemas de , tales como por la similitud de las palabras que contienen.​ (es) In computer science and data mining, MinHash (or the min-wise independent permutations locality sensitive hashing scheme) is a technique for quickly estimating how similar two sets are. The scheme was invented by Andrei Broder, and initially used in the AltaVista search engine to detect duplicate web pages and eliminate them from search results. It has also been applied in large-scale clustering problems, such as clustering documents by the similarity of their sets of words. (en) 在计算机科学领域,最小哈希(或最小哈希式独立排列)方法是一种快速判断两个集合是否相似的技术。这种方法是由 (),发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。 它同样也应用于大规模聚类问题,比如通过文档间包含的词语相似性进行聚类。 (zh)
dbo:wikiPageID 30632997 (xsd:integer)
dbo:wikiPageLength 25627 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1092792526 (xsd:integer)
dbo:wikiPageWikiLink dbr:Nearest_neighbor_search dbr:Cosine_distance dbr:Bloom_filter dbc:Probabilistic_data_structures dbr:Bias_of_an_estimator dbr:Permutation dbr:Variance dbr:Inverse_transform_sampling dbr:Piotr_Indyk dbr:Count–min_sketch dbr:Google dbr:Google_News dbr:Linear_time dbr:Cluster_analysis dbr:Computer_science dbr:MapReduce dbc:Clustering_criteria dbr:Data_mining dbr:W-shingling dbr:Disjoint_sets dbr:Hash_function dbr:K-independent_hashing dbr:Locality-sensitive_hashing dbr:Logical_matrix dbr:AltaVista dbr:Euclidean_vector dbr:Exponential_distribution dbr:Probability dbr:Random_variable dbc:Hashing dbr:Hamming_distance dbr:Intersection_(set_theory) dbr:Chernoff_bound dbc:Hash_functions dbr:Jaccard_index dbr:RefSeq dbr:Document_clustering dbr:Association_rule_learning dbr:Simple_random_sample dbr:Similarity_measure dbr:Union_(set_theory) dbr:Random_permutation dbr:Universal_hashing dbr:SimHash dbr:Tabulation_hashing dbr:Locality_sensitive_hashing
dbp:authorlink Andrei Broder (en)
dbp:first Andrei (en)
dbp:last Broder (en)
dbp:wikiPageUsesTemplate dbt:Harvtxt dbt:Math dbt:Mvar dbt:Reflist dbt:Short_description dbt:Sqrt dbt:Harvs
dbp:year 1997 (xsd:integer)
dct:subject dbc:Probabilistic_data_structures dbc:Clustering_criteria dbc:Hashing dbc:Hash_functions
gold:hypernym dbr:Technique
rdf:type dbo:TopicalConcept yago:WikicatClusteringCriteria yago:Abstraction100002137 yago:Arrangement105726596 yago:Cognition100023271 yago:DataStructure105728493 yago:Function113783816 yago:MathematicalRelation113783581 yago:Measure100033615 yago:PsychologicalFeature100023100 yago:Relation100031921 yago:WikicatHashFunctions yago:Standard107260623 yago:Structure105726345 yago:SystemOfMeasurement113577171 yago:WikicatProbabilisticDataStructures
rdfs:comment En komputoscienco, MinHaketo (aŭ la mininuma-sepdependa-permuta loko-zorga haketado) estas tekniko por rapide taksi la similecon de du aroj. La teknikon inventis , kaj oni unue uzis por la serĉilo por detekti kaj forigi kopiojn de retpaĝo el la serĉrezulto. Ĝi ankaŭ uziĝas por granda arigado, ekzemple arigi fajloj per simileco de iliaj enhavaj vortoj. (eo) En ciencia de la computacion, MinHash (o el esquema sensible a localidad que trata permutaciones independientes relativos al mínimo) es una técnica para estimar rápidamente cuan similares son dos conjuntos. El esquema fue inventado por Andrei Broder en 1997 ,​ e inicialmente usado en el motor de búsqueda AltaVista para detectar páginas web duplicadas y eliminarlas de los resultados de búsqueda.​También ha sido aplicado en problemas de , tales como por la similitud de las palabras que contienen.​ (es) In computer science and data mining, MinHash (or the min-wise independent permutations locality sensitive hashing scheme) is a technique for quickly estimating how similar two sets are. The scheme was invented by Andrei Broder, and initially used in the AltaVista search engine to detect duplicate web pages and eliminate them from search results. It has also been applied in large-scale clustering problems, such as clustering documents by the similarity of their sets of words. (en) 在计算机科学领域,最小哈希(或最小哈希式独立排列)方法是一种快速判断两个集合是否相似的技术。这种方法是由 (),发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。 它同样也应用于大规模聚类问题,比如通过文档间包含的词语相似性进行聚类。 (zh)
rdfs:label MinHaketo (eo) MinHash (es) MinHash (en) 最小哈希 (zh)
owl:sameAs freebase:MinHash yago-res:MinHash wikidata:MinHash dbpedia-eo:MinHash dbpedia-es:MinHash dbpedia-fa:MinHash dbpedia-zh:MinHash https://global.dbpedia.org/id/Akkw
prov:wasDerivedFrom wikipedia-en:MinHash?oldid=1092792526&ns=0
foaf:isPrimaryTopicOf wikipedia-en:MinHash
is dbo:wikiPageRedirects of dbr:Applications_of_MinHash dbr:Minhash dbr:Min-wise_independence
is dbo:wikiPageWikiLink of dbr:List_of_data_structures dbr:N-gram dbr:Nearest_neighbor_search dbr:Bloom_filter dbr:Andrei_Broder dbr:Levenshtein_distance dbr:List_of_phylogenetics_software dbr:Record_value dbr:Count–min_sketch dbr:Rolling_hash dbr:Applications_of_MinHash dbr:Feature_hashing dbr:Fungal_genome dbr:Machine_learning_in_bioinformatics dbr:W-shingling dbr:K-independent_hashing dbr:Dimensionality_reduction dbr:Bag-of-words_model dbr:Jaccard_index dbr:List_of_statistics_articles dbr:SimHash dbr:Quotient_filter dbr:Tabulation_hashing dbr:Outline_of_machine_learning dbr:Minhash dbr:Min-wise_independence
is foaf:primaryTopic of wikipedia-en:MinHash