Data transformation (statistics) (original) (raw)

About DBpedia

В статистиці перетворення даних зводиться до застосування детермінованої математичної функції до кожного елементу в наборі даних, тобто, кожна точка z в наборі даних замінюється на трансформоване значення , де f – це якась функція. Перетворення зазвичай застосовуються для того, щоб дані точніше відповідали припущенням процедури статистичного зведення, а також для покращення інтерпретації або вигляду графіків. Майже завжди функція, застосована для трансформації даних, має обернену та єнеперервною. Трансформацію зазвичай застосовують до набору порівняних вимірювань. Наприклад, якщо ми маємо набір даних про доходи населення в якійсь валюті, трансформацію зазвичай виконують за допомогою логарифмічної функції.

thumbnail

Property Value
dbo:abstract In statistics, data transformation is the application of a deterministic mathematical function to each point in a data set—that is, each data point zi is replaced with the transformed value yi = f(zi), where f is a function. Transforms are usually applied so that the data appear to more closely meet the assumptions of a statistical inference procedure that is to be applied, or to improve the interpretability or appearance of graphs. Nearly always, the function that is used to transform the data is invertible, and generally is continuous. The transformation is usually applied to a collection of comparable measurements. For example, if we are working with data on peoples' incomes in some currency unit, it would be common to transform each person's income value by the logarithm function. (en) En estadística, la transformación de datos se efectúa para asegurarse que estos tienen una distribución normal (lo que puede ser un remedio para analizar datos que tienen otros tipos de distribución, falta de normalidad, linealidad, y homocedasticidad). Con la transformación de los datos estos se preparan para diferentes tipos de análisis, como los de regresión,​ t de student, correlación y ANOVA. Cuando se usan este tipo de la transformación de datos puede ser necesaria ya que este tipo de análisis asumen que los datos deben ser lineales, normales y tienen homocedasticidad en su varianza. Este tipo de transformación se conoce también como transformación de la linealidad. Un buen indicador de datos con una distribución normal es que el sesgo en el rango va de -0,8 a 0,8 y la curtosis se encuentra en el rango de -3,0 a 3,0. La normalidad se mide comúnmente con , como las de y . Para los novatos en estadística el análisis de muestras que no tienen una distribución normal pueden ser un problema, porque las pruebas paramétricas estadísticas comunes asumen normalidad en los datos, es decir, que la distribución de los mismos se ajusta a una campana de Gauss. Si la distribución de los datos no es normal se asume que la distribución de los datos no es semejante estadísticamente a una campana de Gauss, porque sus intervalos de confianza pueden estar a menudo fuera de centro o ser estrechos. Si el tamaño de la muestra es demasiado pequeño o los datos están sesgados hacia una distribución no normal se puede intentar hacer una de las siguientes transformaciones: logarítmica, raíz cuadrada o inversa. Se debe tener en cuenta que el tipo de trasformación que se use debe ser acorde con el tipo de datos que se desea transformar, para ello debe considerarse si la variable tiene distribución continua y que tipo datos son (por ejemplo, resultados de conteos, porcentajes, etc.). Para personas con mayor experiencia en estadística que tengan datos cuya distribución no se ajusta a la normalidad se sugiere definir la distribución real de los datos, que puede ser exponencial, poisson, etc., y analizarlos usando procedimientos específicos (algunos de ellos encontrados en el ) que asumen de facto ese tipo de distribución. (es) Преобразование данных — это применение детерминированной математической функции к каждой точке множества данных, то есть каждая точка данных zi заменяется преобразованным значением , где f — функция. Преобразования обычно применяются так, что данные больше подходят для процедуры статистического вывода, которую хотят применять, для улучшения интерпретируемости или для представления. Почти всегда функция, которая применяется для преобразования данных, обратима, и обычно является непрерывной. Преобразование обычно применяется к коллекции сравнимых показателей. Например, если мы работаем с данными по доходам людей в некоторой валюте, обычно преобразуется доход каждого человека с помощью логарифмической функции. (ru) В статистиці перетворення даних зводиться до застосування детермінованої математичної функції до кожного елементу в наборі даних, тобто, кожна точка z в наборі даних замінюється на трансформоване значення , де f – це якась функція. Перетворення зазвичай застосовуються для того, щоб дані точніше відповідали припущенням процедури статистичного зведення, а також для покращення інтерпретації або вигляду графіків. Майже завжди функція, застосована для трансформації даних, має обернену та єнеперервною. Трансформацію зазвичай застосовують до набору порівняних вимірювань. Наприклад, якщо ми маємо набір даних про доходи населення в якійсь валюті, трансформацію зазвичай виконують за допомогою логарифмічної функції. (uk)
dbo:thumbnail wiki-commons:Special:FilePath/Population_vs_area.svg?width=300
dbo:wikiPageExternalLink http://www.r-statistics.com/2013/05/log-transformations-for-skewed-and-wide-distributions-from-practical-data-science-with-r/
dbo:wikiPageID 10056274 (xsd:integer)
dbo:wikiPageLength 21667 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1108035558 (xsd:integer)
dbo:wikiPageWikiLink dbr:Probability_distribution dbr:Time_series dbr:Binomial_proportion_confidence_interval dbr:Anscombe_transform dbc:Statistical_data_transformation dbr:Pearson_correlation_coefficient dbr:Variance dbr:Variance-stabilizing_transformation dbr:Decorrelation dbr:Dependent_and_independent_variables dbr:Deterministic_system dbr:Inverse_hyperbolic_functions dbr:Kurtosis dbr:Multiplicative_inverse dbr:Power_transform dbr:Common_logarithm dbr:Confidence_interval dbr:Continuous_function dbr:Errors_and_residuals dbr:Estimation_theory dbr:Gauss–Markov_theorem dbr:Function_(mathematics) dbr:Multivariate_normal_distribution dbr:Homoscedasticity dbr:Statistical_inference dbr:Arithmetic_mean dbr:Logarithm dbr:Logit dbr:Cholesky_decomposition dbr:Stationary_process dbr:Statistics dbr:Feature_engineering dbr:Identity_matrix dbr:Probability_integral_transform dbr:Statistical_population dbr:Symmetry dbc:Statistical_inference dbr:Central_limit_theorem dbr:Data dbr:Least_squares dbr:Linear_regression dbr:Logistic_regression dbr:Cumulative_distribution_function dbr:Currency dbr:Expected_value dbr:Finite_difference dbr:Normal_distribution dbr:Statistical_graphics dbr:Nonlinear_regression dbr:Random_variable dbr:Inverse_function dbr:Covariance_matrix dbr:Coverage_probability dbr:Arcsin dbr:Binomial_distribution dbr:Whitening_transformation dbr:Zipf-Mandelbrot_law dbr:Poisson_distribution dbr:Square_root dbr:Natural_logarithm dbr:Q–Q_plot dbr:Unit_interval dbr:Generalized_linear_models dbr:Order_of_magnitude dbr:Skewness dbr:Standard_error dbr:Uniform_distribution_(discrete) dbr:Linear dbr:Linear_transformation dbr:Type_I_and_type_II_errors dbr:Fisher_transformation dbr:Heteroscedasticity dbr:Polynomial_regression dbr:Normality_test dbr:Yeo–Johnson_transformation dbr:Transformation_(mathematics) dbr:Hypothesis_test dbr:Leptokurtic dbr:Authorship_attribution dbr:Box–Cox_transformation dbr:Expected_values dbr:Logit_transformation dbr:Power_transformation_(statistics) dbr:Wilson–Hilferty_transformation dbr:File:Population_vs_area.svg
dbp:wikiPageUsesTemplate dbt:Distinguish dbt:Main dbt:More_citations_needed dbt:Multiple_issues dbt:Reflist dbt:See_also dbt:Technical
dct:subject dbc:Statistical_data_transformation dbc:Statistical_inference
gold:hypernym dbr:Application
rdf:type owl:Thing dbo:Software
rdfs:comment В статистиці перетворення даних зводиться до застосування детермінованої математичної функції до кожного елементу в наборі даних, тобто, кожна точка z в наборі даних замінюється на трансформоване значення , де f – це якась функція. Перетворення зазвичай застосовуються для того, щоб дані точніше відповідали припущенням процедури статистичного зведення, а також для покращення інтерпретації або вигляду графіків. Майже завжди функція, застосована для трансформації даних, має обернену та єнеперервною. Трансформацію зазвичай застосовують до набору порівняних вимірювань. Наприклад, якщо ми маємо набір даних про доходи населення в якійсь валюті, трансформацію зазвичай виконують за допомогою логарифмічної функції. (uk) In statistics, data transformation is the application of a deterministic mathematical function to each point in a data set—that is, each data point zi is replaced with the transformed value yi = f(zi), where f is a function. Transforms are usually applied so that the data appear to more closely meet the assumptions of a statistical inference procedure that is to be applied, or to improve the interpretability or appearance of graphs. (en) En estadística, la transformación de datos se efectúa para asegurarse que estos tienen una distribución normal (lo que puede ser un remedio para analizar datos que tienen otros tipos de distribución, falta de normalidad, linealidad, y homocedasticidad). Con la transformación de los datos estos se preparan para diferentes tipos de análisis, como los de regresión,​ t de student, correlación y ANOVA. Cuando se usan este tipo de la transformación de datos puede ser necesaria ya que este tipo de análisis asumen que los datos deben ser lineales, normales y tienen homocedasticidad en su varianza. Este tipo de transformación se conoce también como transformación de la linealidad. Un buen indicador de datos con una distribución normal es que el sesgo en el rango va de -0,8 a 0,8 y la curtosis se e (es) Преобразование данных — это применение детерминированной математической функции к каждой точке множества данных, то есть каждая точка данных zi заменяется преобразованным значением , где f — функция. Преобразования обычно применяются так, что данные больше подходят для процедуры статистического вывода, которую хотят применять, для улучшения интерпретируемости или для представления. (ru)
rdfs:label Transformación de datos (es) Data transformation (statistics) (en) Преобразование данных (статистика) (ru) Перетворення даних (статистика) (uk)
rdfs:seeAlso dbr:Linear_regression
owl:differentFrom dbr:Transformation_(mathematics)
owl:sameAs freebase:Data transformation (statistics) wikidata:Data transformation (statistics) dbpedia-es:Data transformation (statistics) dbpedia-ru:Data transformation (statistics) dbpedia-uk:Data transformation (statistics) https://global.dbpedia.org/id/4n39c
prov:wasDerivedFrom wikipedia-en:Data_transformation_(statistics)?oldid=1108035558&ns=0
foaf:depiction wiki-commons:Special:FilePath/Population_vs_area.svg
foaf:isPrimaryTopicOf wikipedia-en:Data_transformation_(statistics)
is dbo:wikiPageDisambiguates of dbr:Transformation
is dbo:wikiPageRedirects of dbr:Data_shaping dbr:Transformation_(statistics) dbr:Transformation_to_linearity dbr:Regression_transformation dbr:Logarithm_transformation dbr:Logarithmic_data_transformation
is dbo:wikiPageWikiLink of dbr:Stylometry dbr:Anomaly_(natural_sciences) dbr:Bias_of_an_estimator dbr:Variance-stabilizing_transformation dbr:Power_transform dbr:Chi-squared_distribution dbr:Gauss–Markov_theorem dbr:Outlier dbr:Model_selection dbr:LIMDEP dbr:Apache_Spark dbr:Logarithm dbr:Logit dbr:Feature_engineering dbr:Predictive_Model_Markup_Language dbr:Aggregated_distribution dbr:Data_analysis dbr:Akaike_information_criterion dbr:Dimensionality_reduction dbr:Flow_cytometry_bioinformatics dbr:Count_data dbr:Statistical_model_specification dbr:High-functioning_autism dbr:Transformation dbr:Transformation_(function) dbr:Poisson_distribution dbr:Data_shaping dbr:Intelligence_quotient dbr:Brown–Forsythe_test dbr:Ranking dbr:I-spline dbr:List_of_statistics_articles dbr:Fisher_transformation dbr:Philosophy_of_statistics dbr:Outline_of_regression_analysis dbr:Parasitism dbr:Transformation_(statistics) dbr:Transformation_to_linearity dbr:Regression_transformation dbr:Logarithm_transformation dbr:Logarithmic_data_transformation
is owl:differentFrom of dbr:Data_transformation_(computing)
is foaf:primaryTopic of wikipedia-en:Data_transformation_(statistics)