BIRCH (original) (raw)

About DBpedia

BIRCH (Akronym für balanced iterative reducing and clustering using hierarchies, deutsch etwa balanciertes iteratives Reduzieren und Clustering unter Verwendung von Hierarchien) ist ein Verfahren der Clusteranalyse für große Datenmengen. Ein Vorteil von BIRCH ist die Fähigkeit, neue multivariate Objekte (auch: Beobachtungen oder Instanzen) aus einem Datenstrom effizient zu clustern. Auf der Basis von BIRCH wurde von SPSS das Two-Step-Clustering entwickelt.

Property Value
dbo:abstract BIRCH (Akronym für balanced iterative reducing and clustering using hierarchies, deutsch etwa balanciertes iteratives Reduzieren und Clustering unter Verwendung von Hierarchien) ist ein Verfahren der Clusteranalyse für große Datenmengen. Ein Vorteil von BIRCH ist die Fähigkeit, neue multivariate Objekte (auch: Beobachtungen oder Instanzen) aus einem Datenstrom effizient zu clustern. Auf der Basis von BIRCH wurde von SPSS das Two-Step-Clustering entwickelt. (de) BIRCH (balanced iterative reducing and clustering using hierarchies) is an unsupervised data mining algorithm used to perform hierarchical clustering over particularly large data-sets. With modifications it can also be used to accelerate k-means clustering and Gaussian mixture modeling with the expectation–maximization algorithm. An advantage of BIRCH is its ability to incrementally and dynamically cluster incoming, multi-dimensional metric data points in an attempt to produce the best quality clustering for a given set of resources (memory and time constraints). In most cases, BIRCH only requires a single scan of the database. Its inventors claim BIRCH to be the "first clustering algorithm proposed in the database area to handle 'noise' (data points that are not part of the underlying pattern) effectively", beating DBSCAN by two months. The BIRCH algorithm received the SIGMOD 10 year test of time award in 2006. (en) Сбалансированное итеративное сокращение и кластеризация с помощью иерархий (BIRCH, англ. balanced iterative reducing and clustering using hierarchies) — это алгоритм интеллектуального анализа данных без учителя, используемый для осуществления иерархической кластеризации на наборах данных большого размера. Преимуществом BIRCH является возможность метода динамически кластеризовать по мере поступления многомерных метрических в попытке получить кластеризацию лучшего качества для имеющегося набора ресурсов (памяти и ). В большинстве случаев алгоритм BIRCH требует одного прохода по базе данных. Разработчики BIRCH утверждали, что это был «первым алгоритмом кластеризации, предлагающим в базах данных эффективно обрабатывать 'шум' (точки данных, которые не являются частью схемы)» побивший DBSCAN за два месяца. Алгоритм получил в 2006 году приз SIGMOD после 10 лет тестирования. (ru) BIRCH(英文全称:balanced iterative reducing and clustering using hierarchies,中文:利用层次方法的平衡迭代规约和聚类)是一个非监督式分层聚类算法,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。 (zh)
dbo:wikiPageID 22114276 (xsd:integer)
dbo:wikiPageLength 8808 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1085388687 (xsd:integer)
dbo:wikiPageWikiLink dbr:Branching_factor dbr:Time_constraint dbr:Tree_data_structure dbr:Performance_tuning dbr:Tree_(data_structure) dbr:Data_mining dbr:Data_point dbr:Data_set dbr:Feature_vector dbr:K-means_clustering dbr:Leaf_node dbr:Algorithms_for_calculating_variance dbr:DBSCAN dbc:Cluster_analysis_algorithms dbr:Hierarchical_clustering dbr:Data_clustering dbr:Catastrophic_cancellation dbr:Expectation–maximization_algorithm dbr:Primary_storage
dbp:date December 2014 (en)
dbp:reason Are these parameters set in advance? (en)
dbp:wikiPageUsesTemplate dbt:About dbt:Clarify dbt:Mvar dbt:Reflist dbt:Short_description dbt:Machine_learning
dcterms:subject dbc:Cluster_analysis_algorithms
gold:hypernym dbr:Algorithm
rdf:type dbo:Software yago:Abstraction100002137 yago:Cognition100023271 yago:Datum105816622 yago:Information105816287 yago:PsychologicalFeature100023100 yago:WikicatDataClusteringAlgorithms
rdfs:comment BIRCH (Akronym für balanced iterative reducing and clustering using hierarchies, deutsch etwa balanciertes iteratives Reduzieren und Clustering unter Verwendung von Hierarchien) ist ein Verfahren der Clusteranalyse für große Datenmengen. Ein Vorteil von BIRCH ist die Fähigkeit, neue multivariate Objekte (auch: Beobachtungen oder Instanzen) aus einem Datenstrom effizient zu clustern. Auf der Basis von BIRCH wurde von SPSS das Two-Step-Clustering entwickelt. (de) BIRCH(英文全称:balanced iterative reducing and clustering using hierarchies,中文:利用层次方法的平衡迭代规约和聚类)是一个非监督式分层聚类算法,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。 (zh) BIRCH (balanced iterative reducing and clustering using hierarchies) is an unsupervised data mining algorithm used to perform hierarchical clustering over particularly large data-sets. With modifications it can also be used to accelerate k-means clustering and Gaussian mixture modeling with the expectation–maximization algorithm. An advantage of BIRCH is its ability to incrementally and dynamically cluster incoming, multi-dimensional metric data points in an attempt to produce the best quality clustering for a given set of resources (memory and time constraints). In most cases, BIRCH only requires a single scan of the database. (en) Сбалансированное итеративное сокращение и кластеризация с помощью иерархий (BIRCH, англ. balanced iterative reducing and clustering using hierarchies) — это алгоритм интеллектуального анализа данных без учителя, используемый для осуществления иерархической кластеризации на наборах данных большого размера. Преимуществом BIRCH является возможность метода динамически кластеризовать по мере поступления многомерных метрических в попытке получить кластеризацию лучшего качества для имеющегося набора ресурсов (памяти и ). В большинстве случаев алгоритм BIRCH требует одного прохода по базе данных. (ru)
rdfs:label BIRCH (de) BIRCH (en) BIRCH (ru) BIRCH (zh)
owl:sameAs freebase:BIRCH wikidata:BIRCH dbpedia-de:BIRCH dbpedia-he:BIRCH dbpedia-ru:BIRCH dbpedia-zh:BIRCH https://global.dbpedia.org/id/4Ud3D
prov:wasDerivedFrom wikipedia-en:BIRCH?oldid=1085388687&ns=0
foaf:isPrimaryTopicOf wikipedia-en:BIRCH
is dbo:wikiPageDisambiguates of dbr:Birch_(disambiguation)
is dbo:wikiPageRedirects of dbr:BIRCH_(data_clustering) dbr:Birch_(data_clustering) dbr:Birch_clustering_method_for_large_databases
is dbo:wikiPageWikiLink of dbr:BIRCH_(data_clustering) dbr:Machine_learning_in_bioinformatics dbr:Data_stream_clustering dbr:ELKI dbr:Birch_(data_clustering) dbr:Birch_(disambiguation) dbr:Automatic_clustering_algorithms dbr:Outline_of_machine_learning dbr:Birch_clustering_method_for_large_databases
is foaf:primaryTopic of wikipedia-en:BIRCH