Missing data (original) (raw)

About DBpedia

통계학에서 결측자료(missing data), 손실자료(損失資料)는 어떠한 자료값도 관측 대상 변수에 저장되지 않을 때 발생한다. 결측자료는 흔히 발생이 가능한 데이터이며 데이터를 가지고 내리는 결론에 상당한 영향을 미칠 수 있다. 결측자료는 무응답을 이유로 발생할 수 있다: 하나 이상의 항목 또는 전체 단위(subject, 서브젝트)를 위해 제공되는 정보가 없는 상황이다. 일부 항목들은 다른 항목들에 비해 무응답을 발생시킬 가능성이 더 높다. 이를테면 소득과 같은 비공개 서브젝트들에 관한 항목을 들 수 있다. 경제학, 사회학, 정치학 연구에서 데이터가 손실되는 일이 종종 있는데, 그 이유는 정부나 사설 기관들이 중요한 통계를 보고하지 않기로 결정하거나 보고를 실패한데 따른 것 때문일 수 있으며 아니면 정보를 이용할 수 없기 때문일 수 있다. 손실값이 연구원에 의해 발생되는 경우도 있는데, 이를테면 데이터 수집이 부적절하게 이루어지거나 데이터 기입에 실수가 발생한 경우가 있다.

thumbnail

Property Value
dbo:abstract En estadística, una dada no disponible o valor no disponible (en anglès missing data) ocorre quan no hi ha cap valor guardat per a una variable d'una observació. Les dades no disponibles apareixen freqüentment i poden tenir un efecte significatiu sobre les conclusions extretes a partir de les dades. Una dada no disponible pot ocórrer a causa d'una no-resposta, és a dir, si no es proveeix informació per un o diversos ítems de la unitat. Alguns ítems són més sensibles a no obtenir resposta que altres (per exemple, ítems sobre temes privats com els ingressos o la religió). Un altre tipus de dada disponible és la causada per l'abandonament (dropout) quan s'estudia un subjecte al llarg del temps: en aquest cas, una dada no disponible ocorre quan el participant abandona abans que l'estudi acabi i, per tant, li manquen una o més dades. Finalment, alguns valors no disponibles poden ser causats per l'investigador: per exemple, si la recopilació de dades no es du a terme correctament o es cometen errors en l'entrada de dades. Àrees on apareixen dades no disponibles sovint són les d'economia, sociologia i ciències polítiques a causa que els governs no informes d'algunes estadístiques. Es poden utilitzar models gràfics per descriure els mecanismes de dades no disponibles en detall. (ca) En statistiques, les données manquantes ou les valeurs manquantes se produisent lorsqu’aucune valeur de données n’est représentée pour une variable pour une observation donnée. Les données manquantes sont courantes et peuvent avoir un effet significatif sur l'inférence, les performances de prédiction ou toute autre utilisation faite avec les données. Des données manquantes peuvent exister dans les données en raison d'une « omission de réponse » pour l'observation donnée. Dans cette situation, aucune information n'est fournie pour un élément, pour plusieurs éléments ou pour une unité entière, c'est-à-dire un sujet. Certains éléments sont plus susceptibles d'avoir une « omission de réponse » que d'autres. Par exemple, les données concernant le revenu sont souvent manquantes. L'attrition est un type de données manquantes qui peut survenir dans les études longitudinales. Par exemple, en étudiant le développement d'un sujet avec une mesure répétée dans un laps de temps. L'absence de données se produit lorsque les participants abandonnent avant la fin du test, ainsi il manque une ou plusieurs mesures. Les données manquent souvent en recherche en économie, en sociologie et en science politique parce que les gouvernements ou les entités privées ne peuvent pas ou choisissent de ne pas communiquer certaines statistiques critiques. L'information pourrait aussi être indisponible. Parfois, les valeurs manquantes sont causées par le chercheur. Ces situations arrivent lorsque la collecte des données est mal effectuée ou que des erreurs sont commises lors de la saisie des données . Différents types de données manquantes existent, ce qui impacte de différentes manières la validité des conclusions d'une recherche. Les données peuvent être soit manquantes de manière complètement aléatoire, soit manquantes aléatoirement, soit manquantes par omission prévisible. Les données manquantes peuvent être traitées de la même manière que les données censurées. (fr) In statistics, missing data, or missing values, occur when no data value is stored for the variable in an observation. Missing data are a common occurrence and can have a significant effect on the conclusions that can be drawn from the data. Missing data can occur because of nonresponse: no information is provided for one or more items or for a whole unit ("subject"). Some items are more likely to generate a nonresponse than others: for example items about private subjects such as income. Attrition is a type of missingness that can occur in longitudinal studies—for instance studying development where a measurement is repeated after a certain period of time. Missingness occurs when participants drop out before the test ends and one or more measurements are missing. Data often are missing in research in economics, sociology, and political science because governments or private entities choose not to, or fail to, report critical statistics, or because the information is not available. Sometimes missing values are caused by the researcher—for example, when data collection is done improperly or mistakes are made in data entry. These forms of missingness take different types, with different impacts on the validity of conclusions from research: Missing completely at random, missing at random, and missing not at random. Missing data can be handled similarly as censored data. (en) 통계학에서 결측자료(missing data), 손실자료(損失資料)는 어떠한 자료값도 관측 대상 변수에 저장되지 않을 때 발생한다. 결측자료는 흔히 발생이 가능한 데이터이며 데이터를 가지고 내리는 결론에 상당한 영향을 미칠 수 있다. 결측자료는 무응답을 이유로 발생할 수 있다: 하나 이상의 항목 또는 전체 단위(subject, 서브젝트)를 위해 제공되는 정보가 없는 상황이다. 일부 항목들은 다른 항목들에 비해 무응답을 발생시킬 가능성이 더 높다. 이를테면 소득과 같은 비공개 서브젝트들에 관한 항목을 들 수 있다. 경제학, 사회학, 정치학 연구에서 데이터가 손실되는 일이 종종 있는데, 그 이유는 정부나 사설 기관들이 중요한 통계를 보고하지 않기로 결정하거나 보고를 실패한데 따른 것 때문일 수 있으며 아니면 정보를 이용할 수 없기 때문일 수 있다. 손실값이 연구원에 의해 발생되는 경우도 있는데, 이를테면 데이터 수집이 부적절하게 이루어지거나 데이터 기입에 실수가 발생한 경우가 있다. (ko) 欠測データ(けっそくデータ、英語:missing data)または欠測値(けっそくち、英語:missing values)は、観測において、変数に値が格納されないときに発生する。欠損データ、欠落データなどとも訳される。データの欠測はよくあることであり、データから引き出す結論に甚大な影響を与える場合がある。 (ja) Brakujące dane, braki danych – miejsca w danych, których wartości nie są znane. Mogą powstawać w sposób naturalny (np. w wyborach znane są wstępne wyniki jedynie z części komisji wyborczych) lub sztuczny (np. po usunięciu obserwacji odstających). (pl) Em estatística, não-resposta é um conceito associado a toda e qualquer falha na obtenção de respostas (observações) sobre os elementos seleccionados e designados para pertencerem à amostra. Qualquer estudo feito por Estudo por amostragem está sujeito a vários erros. Os erros provenientes do próprio mecanismo de aleatorização utilizado, ditos erros de amostragem, são os únicos conhecidos à partida e sem remédio possível. Os erros provenientes de não-repostas estão incluídos na categoria dos erros provenientes da não-observação que, obviamente, não dependem directamente do tipo de amostragem. O principal efeito das não-respostas consiste no enviesamento das estimativas. (pt) 缺失數據(英語:missing data)指在統計调查的过程中,由于受访者对问题的遗漏、拒绝,或是调查员与調查問卷本身的一些疏忽,使得经常会出现缺失数据问题,但是几乎所有标准统计方法都假设每單个案有可用于分析的所有變數信息,因此缺失数据就成为统计研究或问卷调查的工作人员必须解决的问题。 在其2011年出版的Missing Data一书中提到许多解决缺失数据问题的方案,而它们各有利弊。 (zh)
dbo:thumbnail wiki-commons:Special:FilePath/Missing_not_at_random.png?width=300
dbo:wikiPageExternalLink https://www.hydrol-earth-syst-sci-discuss.net/hess-2017-601/hess-2017-601.pdf http://www-03.ibm.com/software/products/en/spss-missing-values http://support.sas.com/onlinedoc/913/docMainpage.jsp https://www.lshtm.ac.uk/research/centres-projects-groups/missing-data http://www.statmodel.com/features5.shtml http://www.cs.hmc.edu/~fleck/envision/user-manual/missing.html https://rmisstastic.netlify.com http://www3.interscience.wiley.com/journal/118686888/abstract%7Carchive-url=https:/archive.today/20130105095426/http:/www3.interscience.wiley.com/journal/118686888/abstract%7Curl-status=dead%7Carchive-date=2013-01-05
dbo:wikiPageID 7859676 (xsd:integer)
dbo:wikiPageLength 24342 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1106900530 (xsd:integer)
dbo:wikiPageWikiLink dbr:Joint_probability_distribution dbr:Bias dbr:Value_(mathematics) dbr:Interpolation dbr:Inverse_probability_weighting dbr:Unit_of_observation dbr:SAGE_Publishing dbc:Missing_data dbr:London_School_of_Hygiene_&_Tropical_Medicine dbr:Statistics dbr:Matrix_completion dbc:Statistical_data_types dbr:Data dbr:Data_analysis dbr:Wiley_(publisher) dbr:Economics dbr:Censoring_(statistics) dbr:Journal_of_Marriage_and_Family dbr:Statistical_power dbr:Guilford_Press dbr:Attrition_(epidemiology) dbr:Chapman_&_Hall dbr:Latent_variable dbr:Political_science dbr:Springer_Science+Business_Media dbr:Expectation-maximization_algorithm dbr:Markov_chain dbr:Maximum_likelihood dbr:Sociology dbr:Variable_(mathematics) dbr:Expectation–maximization_algorithm dbr:Imputation_(statistics) dbr:Listwise_deletion dbr:Robust_statistics dbr:PLOS_Medicine dbr:Censored_data dbr:Indicator_variable dbr:Partial_identification dbr:File:Missing_not_at_random.png
dbp:wikiPageUsesTemplate dbt:Citation dbt:Citation_needed dbt:Cite_conference dbt:Div_col dbt:Div_col_end dbt:Main dbt:Reflist dbt:Rp dbt:Short_description dbt:Statistics
dcterms:subject dbc:Missing_data dbc:Statistical_data_types
rdf:type yago:WikicatMissingData yago:Abstraction100002137 yago:Cognition100023271 yago:Datum105816622 yago:Information105816287 yago:PsychologicalFeature100023100
rdfs:comment 통계학에서 결측자료(missing data), 손실자료(損失資料)는 어떠한 자료값도 관측 대상 변수에 저장되지 않을 때 발생한다. 결측자료는 흔히 발생이 가능한 데이터이며 데이터를 가지고 내리는 결론에 상당한 영향을 미칠 수 있다. 결측자료는 무응답을 이유로 발생할 수 있다: 하나 이상의 항목 또는 전체 단위(subject, 서브젝트)를 위해 제공되는 정보가 없는 상황이다. 일부 항목들은 다른 항목들에 비해 무응답을 발생시킬 가능성이 더 높다. 이를테면 소득과 같은 비공개 서브젝트들에 관한 항목을 들 수 있다. 경제학, 사회학, 정치학 연구에서 데이터가 손실되는 일이 종종 있는데, 그 이유는 정부나 사설 기관들이 중요한 통계를 보고하지 않기로 결정하거나 보고를 실패한데 따른 것 때문일 수 있으며 아니면 정보를 이용할 수 없기 때문일 수 있다. 손실값이 연구원에 의해 발생되는 경우도 있는데, 이를테면 데이터 수집이 부적절하게 이루어지거나 데이터 기입에 실수가 발생한 경우가 있다. (ko) 欠測データ(けっそくデータ、英語:missing data)または欠測値(けっそくち、英語:missing values)は、観測において、変数に値が格納されないときに発生する。欠損データ、欠落データなどとも訳される。データの欠測はよくあることであり、データから引き出す結論に甚大な影響を与える場合がある。 (ja) Brakujące dane, braki danych – miejsca w danych, których wartości nie są znane. Mogą powstawać w sposób naturalny (np. w wyborach znane są wstępne wyniki jedynie z części komisji wyborczych) lub sztuczny (np. po usunięciu obserwacji odstających). (pl) 缺失數據(英語:missing data)指在統計调查的过程中,由于受访者对问题的遗漏、拒绝,或是调查员与調查問卷本身的一些疏忽,使得经常会出现缺失数据问题,但是几乎所有标准统计方法都假设每單个案有可用于分析的所有變數信息,因此缺失数据就成为统计研究或问卷调查的工作人员必须解决的问题。 在其2011年出版的Missing Data一书中提到许多解决缺失数据问题的方案,而它们各有利弊。 (zh) En estadística, una dada no disponible o valor no disponible (en anglès missing data) ocorre quan no hi ha cap valor guardat per a una variable d'una observació. Les dades no disponibles apareixen freqüentment i poden tenir un efecte significatiu sobre les conclusions extretes a partir de les dades. Es poden utilitzar models gràfics per descriure els mecanismes de dades no disponibles en detall. (ca) En statistiques, les données manquantes ou les valeurs manquantes se produisent lorsqu’aucune valeur de données n’est représentée pour une variable pour une observation donnée. Les données manquantes sont courantes et peuvent avoir un effet significatif sur l'inférence, les performances de prédiction ou toute autre utilisation faite avec les données. (fr) In statistics, missing data, or missing values, occur when no data value is stored for the variable in an observation. Missing data are a common occurrence and can have a significant effect on the conclusions that can be drawn from the data. These forms of missingness take different types, with different impacts on the validity of conclusions from research: Missing completely at random, missing at random, and missing not at random. Missing data can be handled similarly as censored data. (en) Em estatística, não-resposta é um conceito associado a toda e qualquer falha na obtenção de respostas (observações) sobre os elementos seleccionados e designados para pertencerem à amostra. Qualquer estudo feito por Estudo por amostragem está sujeito a vários erros. Os erros provenientes do próprio mecanismo de aleatorização utilizado, ditos erros de amostragem, são os únicos conhecidos à partida e sem remédio possível. Os erros provenientes de não-repostas estão incluídos na categoria dos erros provenientes da não-observação que, obviamente, não dependem directamente do tipo de amostragem. (pt)
rdfs:label Missing data (en) Dada no disponible (ca) Données manquantes (fr) 결측자료 (ko) 欠測データ (ja) Brakujące dane (pl) Não-resposta (pt) 缺失数据 (zh)
owl:sameAs freebase:Missing data yago-res:Missing data wikidata:Missing data dbpedia-ca:Missing data dbpedia-fa:Missing data dbpedia-fr:Missing data dbpedia-ja:Missing data dbpedia-ko:Missing data dbpedia-pl:Missing data dbpedia-pt:Missing data dbpedia-zh:Missing data https://global.dbpedia.org/id/4s5bw
prov:wasDerivedFrom wikipedia-en:Missing_data?oldid=1106900530&ns=0
foaf:depiction wiki-commons:Special:FilePath/Missing_not_at_random.png
foaf:isPrimaryTopicOf wikipedia-en:Missing_data
is dbo:knownFor of dbr:Fulufhelo_Nelwamondo
is dbo:wikiPageRedirects of dbr:Missing_completely_at_random dbr:MCAR dbr:Missing_at_random dbr:Missing_value dbr:Missing_values dbr:Missingness
is dbo:wikiPageWikiLink of dbr:Mortality_rate dbr:Annie_Qu dbr:Per_Martin-Löf dbr:Richard_D._Gill dbr:Cyntha_Struthers dbr:Design_effect dbr:Intelligent_Decision_System dbr:Interpolation dbr:Inverse_probability_weighting dbr:J._Lynn_Palmer dbr:Analysis_of_clinical_trials dbr:Elizabeth_A._Stuart dbr:Elizabeth_Stasny dbr:Estimand dbr:Estimation_of_covariance_matrices dbr:Repeated_measures_design dbr:Fulufhelo_Nelwamondo dbr:Crossover_study dbr:Eric_Bradlow dbr:Statistics dbr:Data_analysis dbr:Data_mining dbr:Joan_Hu dbr:Singular_spectrum_analysis dbr:Censoring_(statistics) dbr:Fang_Liu_(statistician) dbr:Grace_Y._Yi dbr:Economic_data dbr:Rebecca_Andridge dbr:Statistical_assumption dbr:Donald_Rubin dbr:Bootstrap_aggregating dbr:Free_statistical_software dbr:MAR dbr:Manufacturing_resource_planning dbr:Nelson–Aalen_estimator dbr:Fabrizia_Mealli dbr:Imputation_(statistics) dbr:List_of_statistics_articles dbr:Listwise_deletion dbr:Robust_statistics dbr:Missing_completely_at_random dbr:Multilevel_modeling_for_repeated_measures dbr:Set_identification dbr:MCAR dbr:Missing_at_random dbr:Missing_value dbr:Missing_values dbr:Missingness
is dbp:knownFor of dbr:Fulufhelo_Nelwamondo
is rdfs:seeAlso of dbr:Per_Martin-Löf
is foaf:primaryTopic of wikipedia-en:Missing_data