Chi-square automatic interaction detection (original) (raw)

About DBpedia

Chi-square automatic interaction detection (CHAID) is a decision tree technique based on adjusted significance testing (Bonferroni correction, Holm-Bonferroni testing). The technique was developed in South Africa and was published in 1980 by Gordon V. Kass, who had completed a PhD thesis on this topic. CHAID can be used for prediction (in a similar fashion to regression analysis, this version of CHAID being originally known as XAID) as well as classification, and for detection of interaction between variables. CHAID is based on a formal extension of AID (Automatic Interaction Detection) and THAID (THeta Automatic Interaction Detection) procedures of the 1960s and 1970s, which in turn were extensions of earlier research, including that performed by Belson in the UK in the 1950s. A history o

Property Value
dbo:abstract CHAID (Chi-square Automatic Interaction Detectors) ist ein Algorithmus, der zur Entscheidungsfindung dient. Er wird bei der Konstruktion von Entscheidungsbäumen eingesetzt. Der CHAID-Algorithmus wurde 1964 erstmals von J.A. Sonquist und J.N. Morgan publiziert und ist somit der Älteste der gängigen Entscheidungsbaum-Algorithmen. Anderberg (1973) beschreibt ihn. J.A. Hartigan (1975) gibt eine Implementierung an. Der Hauptunterschied von CHAID zu CART und C4.5 besteht darin, dass der CHAID-Algorithmus das Wachsen des Baumes stoppt, bevor der Baum zu groß geworden ist. Der Baum wird also nicht beliebig wachsen gelassen, um ihn danach mit einer Pruning-Methode wieder zu stutzen. Ein weiterer Unterschied besteht darin, dass CHAID mit kategorial skalierten Variablen wie Farbe (rot, gelb, grün) oder Bewertung (gut, mittel, schlecht) arbeitet anstatt mit metrisch skalierten Variablen wie zum Beispiel Körpergröße in cm. Für die Wahl der Attribute wird beim CHAID-Algorithmus der Chi-Quadrat-Unabhängigkeitstest verwendet. CHAIDs kommen zur Anwendung, wenn eine Aussage über die Abhängigkeit zweier Variablen gemacht werden muss. Dazu wird eine Kennzahl, der Chi-Quadrat-Abstand berechnet. Dabei gilt: Je größer diese Kennzahl, desto größer die Abhängigkeit der betrachteten Variablen. Die Variable mit dem größten Chi-Quadrat-Abstand zur Zielgröße wird als Attributauswahl berücksichtigt. Um die Trennqualität zu erhöhen, können hier – wie auch beim C4.5-Algorithmus – mehr als zwei Verzweigungen pro Knoten vorgenommen werden. Dies hat zur Folge, dass die generierten Bäume kompakter sind als die CARTs. Dieselbe Methode wird zur Ermittlung der besten Unterteilungen verwendet.Da bei diesen Entscheidungsbäumen alle möglichen Kombinationen von Ausprägungen ausgewertet werden müssen, kann es bei großen Datenmengen zu Laufzeitproblemen führen. Deshalb ist es von Vorteil, wenn die numerischen Variablen in Variablen mit kategoriellen Ausprägungen umgewandelt werden, obwohl dies einen zusätzlichen Aufwand bedeutet. Dafür sollte das Ergebnis qualitativ besser sein. (de) Chi-square automatic interaction detection (CHAID) is a decision tree technique based on adjusted significance testing (Bonferroni correction, Holm-Bonferroni testing). The technique was developed in South Africa and was published in 1980 by Gordon V. Kass, who had completed a PhD thesis on this topic. CHAID can be used for prediction (in a similar fashion to regression analysis, this version of CHAID being originally known as XAID) as well as classification, and for detection of interaction between variables. CHAID is based on a formal extension of AID (Automatic Interaction Detection) and THAID (THeta Automatic Interaction Detection) procedures of the 1960s and 1970s, which in turn were extensions of earlier research, including that performed by Belson in the UK in the 1950s. A history of earlier supervised tree methods together with a detailed description of the original CHAID algorithm and the exhaustive CHAID extension by Biggs, De Ville, and Suen, can be found in Ritschard. In practice, CHAID is often used in the context of direct marketing to select groups of consumers to predict how their responses to some variables affect other variables, although other early applications were in the fields of medical and psychiatric research. Like other decision trees, CHAID's advantages are that its output is highly visual and easy to interpret. Because it uses multiway splits by default, it needs rather large sample sizes to work effectively, since with small sample sizes the respondent groups can quickly become too small for reliable analysis. One important advantage of CHAID over alternatives such as multiple regression is that it is non-parametric. (en) CHAID (CHi-squared Automatic Interaction Detector) est une technique de type arbre de décision. Elle a été publiée en 1980 par Gordon V. Kass. En pratique, elle est souvent utilisée en marketing direct pour sélectionner un groupe de consommateurs et prédire comment leurs réponses à certaines variables affectent d'autres variables. Comme avec les autres arbres de décision, ses avantages sont un résultat essentiellement visuel et facilement interprétable. À cause de la segmentation de la population lors de l'analyse, l'échantillonnage doit être suffisamment large de manière que la taille de chaque groupe ne devienne pas trop petite, ce qui rendrait l'analyse peu fiable. CHAID détecte l'interaction entre variables dans un jeu de données. En utilisant cette technique on peut établir des relations de dépendance entre variables. En prenant l’abonnement à un journal, par exemple, il sera possible d'étudier l'influence de variables explicatives comme le prix, la taille, les suppléments, etc. CHAID identifie des groupes discrets puis, en examinant les réactions aux variables explicatives, cherche à prédire l'impact sur la variable initiale. CHAID est souvent utilisé comme technique d'exploration et est une alternative aux multiples régressions, en particulier quand le jeu de données n'est pas parfaitement adapté aux analyses par régression. (fr)
dbo:wikiPageExternalLink https://r-forge.r-project.org/R/%3Fgroup_id=343 https://www.ibm.com/downloads/cas/Z6XD69WQ https://ideas.repec.org/c/boc/bocode/s457752.html https://ideas.repec.org/c/boc/bocode/s457932.html
dbo:wikiPageID 6609041 (xsd:integer)
dbo:wikiPageLength 7044 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1116976883 (xsd:integer)
dbo:wikiPageWikiLink dbc:Statistical_algorithms dbr:Decision_tree_learning dbc:Classification_algorithms dbr:Chi-squared_distribution dbr:Multiple_comparisons dbr:Holm-Bonferroni_method dbr:Structural_equation_modeling dbc:Market_research dbr:Latent_class_model dbc:Decision_trees dbr:Direct_marketing dbr:Regression_analysis dbc:Market_segmentation dbc:Statistical_classification dbr:Bonferroni_correction dbr:Market_segment
dbp:wikiPageUsesTemplate dbt:Reflist
dct:subject dbc:Statistical_algorithms dbc:Classification_algorithms dbc:Market_research dbc:Decision_trees dbc:Market_segmentation dbc:Statistical_classification
rdfs:comment Chi-square automatic interaction detection (CHAID) is a decision tree technique based on adjusted significance testing (Bonferroni correction, Holm-Bonferroni testing). The technique was developed in South Africa and was published in 1980 by Gordon V. Kass, who had completed a PhD thesis on this topic. CHAID can be used for prediction (in a similar fashion to regression analysis, this version of CHAID being originally known as XAID) as well as classification, and for detection of interaction between variables. CHAID is based on a formal extension of AID (Automatic Interaction Detection) and THAID (THeta Automatic Interaction Detection) procedures of the 1960s and 1970s, which in turn were extensions of earlier research, including that performed by Belson in the UK in the 1950s. A history o (en) CHAID (Chi-square Automatic Interaction Detectors) ist ein Algorithmus, der zur Entscheidungsfindung dient. Er wird bei der Konstruktion von Entscheidungsbäumen eingesetzt. Der CHAID-Algorithmus wurde 1964 erstmals von J.A. Sonquist und J.N. Morgan publiziert und ist somit der Älteste der gängigen Entscheidungsbaum-Algorithmen. Anderberg (1973) beschreibt ihn. J.A. Hartigan (1975) gibt eine Implementierung an. (de) CHAID (CHi-squared Automatic Interaction Detector) est une technique de type arbre de décision. Elle a été publiée en 1980 par Gordon V. Kass. En pratique, elle est souvent utilisée en marketing direct pour sélectionner un groupe de consommateurs et prédire comment leurs réponses à certaines variables affectent d'autres variables. CHAID est souvent utilisé comme technique d'exploration et est une alternative aux multiples régressions, en particulier quand le jeu de données n'est pas parfaitement adapté aux analyses par régression. (fr)
rdfs:label CHAID (de) Chi-square automatic interaction detection (en) CHAID (fr)
owl:sameAs yago-res:Chi-square automatic interaction detection wikidata:Chi-square automatic interaction detection dbpedia-de:Chi-square automatic interaction detection dbpedia-fr:Chi-square automatic interaction detection https://global.dbpedia.org/id/744Z
prov:wasDerivedFrom wikipedia-en:Chi-square_automatic_interaction_detection?oldid=1116976883&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Chi-square_automatic_interaction_detection
is dbo:wikiPageDisambiguates of dbr:Aid_(disambiguation)
is dbo:wikiPageRedirects of dbr:CHAID dbr:Chi-squared_Automatic_Interaction_Detection dbr:THAID
is dbo:wikiPageWikiLink of dbr:Decision_tree_learning dbr:Market_segmentation dbr:Aid_(disambiguation) dbr:CHAID dbr:Outline_of_machine_learning dbr:Chi-squared_Automatic_Interaction_Detection dbr:THAID
is foaf:primaryTopic of wikipedia-en:Chi-square_automatic_interaction_detection