Cook's distance (original) (raw)
In der Statistik, insbesondere in der Regressionsdiagnostik, ist der Cook-Abstand, die Cook-Maßzahl, oder auch Cook'sche Distanz genannt, die wichtigste Maßzahl zur Bestimmung sogenannter einflussreicher Beobachtungen, wenn eine Kleinste-Quadrate-Regression durchgeführt wurde. Der Cook-Abstand ist nach dem amerikanischen Statistiker benannt, der das Konzept 1977 vorstellte.
Property | Value |
---|---|
dbo:abstract | In der Statistik, insbesondere in der Regressionsdiagnostik, ist der Cook-Abstand, die Cook-Maßzahl, oder auch Cook'sche Distanz genannt, die wichtigste Maßzahl zur Bestimmung sogenannter einflussreicher Beobachtungen, wenn eine Kleinste-Quadrate-Regression durchgeführt wurde. Der Cook-Abstand ist nach dem amerikanischen Statistiker benannt, der das Konzept 1977 vorstellte. (de) In statistics, Cook's distance or Cook's D is a commonly used estimate of the influence of a data point when performing a least-squares regression analysis. In a practical ordinary least squares analysis, Cook's distance can be used in several ways: to indicate influential data points that are particularly worth checking for validity; or to indicate regions of the design space where it would be good to be able to obtain more data points. It is named after the American statistician R. Dennis Cook, who introduced the concept in 1977. (en) En statistique, la distance de Cook est couramment utilisée pour estimer l'influence d'une donnée lors de l'utilisation de méthodes des moindres carrés. Dans le cas général, de l'utilisation de la méthode des moindres carrés, la distance de Cook peut être utilisée de plusieurs façons : pour indiquer les données qu'il serait intéressant de vérifier; pour indiquer les régions de l'espace de conception où il serait bon d'être en mesure d'obtenir plus de points de données. Ce nom vient du statisticien américain R. Dennis Cook, qui a introduit le concept en 1977. (fr) La distanza di Cook, introdotta nel 1977 dallo statistico statunitense Ralph Dennis Cook, è una funzione comunemente usata per stimare l' di un singolo punto in un'analisi di regressione ai minimi quadrati. Punti con elevato residuo (outlier) o elevato leverage possono distorcere il risultato e l'accuratezza di un'analisi di regressione. La distanza di Cook misura l'effetto causato sull'analisi dalla rimozione di un certo dato, e nell'analisi con il metodo dei minimi quadrati ordinario può essere usata per indicare punti ad alta influenza, di cui sarebbe importante controllare la validità, o per individuare regioni dello spazio nelle quali sarebbe necessario acquisire più dati. (it) Em estatística, a distância de Cook é uma medida da influência de uma observação ao realizar-se uma análise de regressão de mínimos quadrados. O nome é uma homenagem ao estatístico americano . A distância de Cook mede o efeito de excluir uma dada observação. E em pontos com grande distância de Cook considera-se checagem para validação. A distância de Cook é definida como Que é algebricamente equivalente à expressão Nas equações acima: é a previsão do modelo de regressão completo para a observação j; é a previsão de observação j de um modelo de regressão reformado em que a observação i foi omitida; é o i-nésimo elemento da diagonal da ; é o resíduo bruto (i.e., a diferença entre o valor observado e o valor ajustado pelo modelo proposto); é o erro quadrático médio do modelo de regressão; é o número de parâmetros ajustados no modelo (pt) У статистиці відстань Кука є загальноприйнятою оцінкою впливу спостереження під час застосування методу найменших квадратів у регресійному аналізі. На практиці, при застосуванні методу найменших квадратів, відстань Кука може використовуватися для наступних цілей: визначити впливові спостереження даних, які потрібно перевірити на валідність; визначення областей простору, у яких непогано було б отримати більше результатів спостереження. Відстань названа на честь американського статистика , який у 1977 році запропонував дану концепцію. (uk) |
dbo:wikiPageExternalLink | https://www.scikit-yb.org/en/latest/api/regressor/influence.html%23cook-s-distance https://stat.ethz.ch/R-manual/R-devel/library/stats/html/influence.measures.html https://books.google.com/books%3Fid=X0dPBOJ_L4UC&pg=PA22 https://books.google.com/books%3Fid=co3gBwAAQBAJ&pg=PA312 https://www.researchgate.net/publication/258174106 |
dbo:wikiPageID | 4473885 (xsd:integer) |
dbo:wikiPageLength | 20344 (xsd:nonNegativeInteger) |
dbo:wikiPageRevisionID | 1121933217 (xsd:integer) |
dbo:wikiPageWikiLink | dbr:Python_(programming_language) dbr:Projection_matrix dbc:Statistical_outliers dbc:Statistical_distance dbr:DFFITS dbr:Design_matrix dbr:Influential_observation dbr:Leverage_(statistics) dbr:Median dbr:Errors_and_residuals dbr:Outlier dbr:Symmetric_matrix dbr:Statistics dbr:Studentized_residual dbr:Least_squares dbr:F-distribution dbc:Regression_diagnostics dbr:Regression_analysis dbr:Residual_(statistics) dbr:Standard_deviations dbr:Idempotence dbr:Ordinary_least_squares dbr:R._Dennis_Cook dbr:R_(programming_language) dbr:Mean_squared_error dbr:Median_absolute_deviation dbr:Partial_leverage dbr:Robust_measure_of_scale dbr:Eigenvalues dbr:Influential_observations |
dbp:wikiPageUsesTemplate | dbt:Cite_book dbt:Cite_journal dbt:Clarify dbt:Reflist dbt:Refn dbt:Sfn dbt:Short_description |
dct:subject | dbc:Statistical_outliers dbc:Statistical_distance dbc:Regression_diagnostics |
rdf:type | yago:WikicatStatisticalOutliers yago:CausalAgent100007347 yago:Inhabitant109620078 yago:LivingThing100004258 yago:Object100002684 yago:Organism100004475 yago:Outlier110387836 yago:Person100007846 yago:PhysicalEntity100001930 yago:YagoLegalActor yago:YagoLegalActorGeo yago:Resident110523519 yago:Whole100003553 |
rdfs:comment | In der Statistik, insbesondere in der Regressionsdiagnostik, ist der Cook-Abstand, die Cook-Maßzahl, oder auch Cook'sche Distanz genannt, die wichtigste Maßzahl zur Bestimmung sogenannter einflussreicher Beobachtungen, wenn eine Kleinste-Quadrate-Regression durchgeführt wurde. Der Cook-Abstand ist nach dem amerikanischen Statistiker benannt, der das Konzept 1977 vorstellte. (de) In statistics, Cook's distance or Cook's D is a commonly used estimate of the influence of a data point when performing a least-squares regression analysis. In a practical ordinary least squares analysis, Cook's distance can be used in several ways: to indicate influential data points that are particularly worth checking for validity; or to indicate regions of the design space where it would be good to be able to obtain more data points. It is named after the American statistician R. Dennis Cook, who introduced the concept in 1977. (en) En statistique, la distance de Cook est couramment utilisée pour estimer l'influence d'une donnée lors de l'utilisation de méthodes des moindres carrés. Dans le cas général, de l'utilisation de la méthode des moindres carrés, la distance de Cook peut être utilisée de plusieurs façons : pour indiquer les données qu'il serait intéressant de vérifier; pour indiquer les régions de l'espace de conception où il serait bon d'être en mesure d'obtenir plus de points de données. Ce nom vient du statisticien américain R. Dennis Cook, qui a introduit le concept en 1977. (fr) У статистиці відстань Кука є загальноприйнятою оцінкою впливу спостереження під час застосування методу найменших квадратів у регресійному аналізі. На практиці, при застосуванні методу найменших квадратів, відстань Кука може використовуватися для наступних цілей: визначити впливові спостереження даних, які потрібно перевірити на валідність; визначення областей простору, у яких непогано було б отримати більше результатів спостереження. Відстань названа на честь американського статистика , який у 1977 році запропонував дану концепцію. (uk) La distanza di Cook, introdotta nel 1977 dallo statistico statunitense Ralph Dennis Cook, è una funzione comunemente usata per stimare l' di un singolo punto in un'analisi di regressione ai minimi quadrati. (it) Em estatística, a distância de Cook é uma medida da influência de uma observação ao realizar-se uma análise de regressão de mínimos quadrados. O nome é uma homenagem ao estatístico americano . A distância de Cook mede o efeito de excluir uma dada observação. E em pontos com grande distância de Cook considera-se checagem para validação. A distância de Cook é definida como Que é algebricamente equivalente à expressão Nas equações acima: (pt) |
rdfs:label | Cook-Abstand (de) Cook's distance (en) Distance de Cook (fr) Distanza di Cook (it) Distância de Cook (pt) Відстань Кука (uk) |
owl:sameAs | freebase:Cook's distance yago-res:Cook's distance wikidata:Cook's distance dbpedia-de:Cook's distance dbpedia-fa:Cook's distance dbpedia-fr:Cook's distance dbpedia-it:Cook's distance dbpedia-pt:Cook's distance dbpedia-uk:Cook's distance https://global.dbpedia.org/id/4iMEY |
prov:wasDerivedFrom | wikipedia-en:Cook's_distance?oldid=1121933217&ns=0 |
foaf:isPrimaryTopicOf | wikipedia-en:Cook's_distance |
is dbo:knownFor of | dbr:R._Dennis_Cook |
is dbo:wikiPageRedirects of | dbr:Cook's_D dbr:Cook_distance |
is dbo:wikiPageWikiLink of | dbr:Projection_matrix dbr:Cook's_D dbr:Cook_distance dbr:DFFITS dbr:Influential_observation dbr:Leverage_(statistics) dbr:Outlier dbr:Studentized_residual dbr:R._Dennis_Cook dbr:List_of_statistics_articles dbr:Regression_diagnostic dbr:Outline_of_regression_analysis |
is dbp:knownFor of | dbr:R._Dennis_Cook |
is rdfs:seeAlso of | dbr:Robust_statistics |
is foaf:primaryTopic of | wikipedia-en:Cook's_distance |