Data wrangling (original) (raw)

About DBpedia

데이터 랭글링(Data Wrangling) 혹은 데이터 먼징(Data Munging)이라고 불리는 이것은 원자료(raw data)를 보다 쉽게 접근하고 분석할 수 있도록 데이터를 정리하고 통합하는 과정이다. 이를 통해서 반자동화 도구의 도움으로 데이터를 좀 더 편리하게 소비한다. 데이터 랭글링에는 먼징(munging), 데이터 시각화, 데이터 집합, 통계 모형 학습 뿐만 아니라 많은 다른 잠재적 용도도 포함된다. 일반적으로 데이터 먼징은 일반적인 단계를 따르는데 데이터 원천(Data Source)으로부터 원래 최초 형태로 자료를 추출하는 것으로 시작한다.알고리듬(예로, 정렬)을 사용해서 원자료를 "먼징(munging"하거나 사전 정의된 자료구조로 데이터를 파싱(parsing)한다.그리고 나서 마지막으로 저장이나 미래 사용을 위해서 작업 완료한 콘텐츠를 데이터 싱크(data sink)에 놓아둔다.인터넷의 급격한 확산으로 이러한 기술이 가용한 데이터 양이 증가하고 있는 기관에서는 점점 중요해지고 있다. 데이터 랭글러(Data Wrangler)는 랭글링을 수행하는 사람이다.

thumbnail

Property Value
dbo:abstract Data wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data. The process of data wrangling may include further munging, data visualization, data aggregation, training a statistical model, as well as many other potential uses. Data wrangling typically follows a set of general steps which begin with extracting the data in a raw form from the data source, "munging" the raw data (e.g. sorting) or parsing the data into predefined data structures, and finally depositing the resulting content into a data sink for storage and future use. (en) 데이터 랭글링(Data Wrangling) 혹은 데이터 먼징(Data Munging)이라고 불리는 이것은 원자료(raw data)를 보다 쉽게 접근하고 분석할 수 있도록 데이터를 정리하고 통합하는 과정이다. 이를 통해서 반자동화 도구의 도움으로 데이터를 좀 더 편리하게 소비한다. 데이터 랭글링에는 먼징(munging), 데이터 시각화, 데이터 집합, 통계 모형 학습 뿐만 아니라 많은 다른 잠재적 용도도 포함된다. 일반적으로 데이터 먼징은 일반적인 단계를 따르는데 데이터 원천(Data Source)으로부터 원래 최초 형태로 자료를 추출하는 것으로 시작한다.알고리듬(예로, 정렬)을 사용해서 원자료를 "먼징(munging"하거나 사전 정의된 자료구조로 데이터를 파싱(parsing)한다.그리고 나서 마지막으로 저장이나 미래 사용을 위해서 작업 완료한 콘텐츠를 데이터 싱크(data sink)에 놓아둔다.인터넷의 급격한 확산으로 이러한 기술이 가용한 데이터 양이 증가하고 있는 기관에서는 점점 중요해지고 있다. 데이터 랭글러(Data Wrangler)는 랭글링을 수행하는 사람이다. (ko)
dbo:thumbnail wiki-commons:Special:FilePath/Data_Wrangling_From_M...o_Clean_Data_Management.jpg?width=300
dbo:wikiPageExternalLink https://myinfluencerjourney.com/what-is-data-wrangling-benefits-tools-and-skills/ http://vis.stanford.edu/wrangler/
dbo:wikiPageID 12487489 (xsd:integer)
dbo:wikiPageLength 14451 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1124766133 (xsd:integer)
dbo:wikiPageWikiLink dbr:Program_synthesis dbr:Python_(programming_language) dbr:Mung_(computer_term) dbc:Computer_occupations dbr:Computer-generated_imagery dbr:SQL dbr:Emory_University dbr:Content_format dbr:Machine_learning dbr:Statistical_model dbr:Programming_by_example dbr:Trifacta dbc:Data_mapping dbr:Data dbr:Data_architect dbr:Data_lake dbr:Data_mapping dbr:Data_mining dbr:Data_preparation dbr:Data_science dbr:Data_validation dbr:Alteryx dbr:Data_consistency dbr:Data_visualization dbr:Data_warehouse dbr:Digital_library dbr:KNIME dbr:Research dbr:Jargon_File dbr:Film dbr:OpenRefine dbr:R_(programming_language) dbr:Recommender_system dbr:National_Digital_Information_Infrastructure_and_Preservation_Program dbr:Raw_data dbr:Data_transfer dbr:United_States_Library_of_Congress dbr:File:Data_Wrangling_From_Messy_To_Clean_Data_Management.jpg
dbp:wikiPageUsesTemplate dbt:Data dbt:Cite_web dbt:Ordered_list dbt:Reflist dbt:Short_description dbt:Data_transformation
dcterms:subject dbc:Computer_occupations dbc:Data_mapping
rdf:type yago:WikicatComputerOccupations yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Event100029378 yago:Occupation100582388 yago:PsychologicalFeature100023100 yago:YagoPermanentlyLocatedEntity
rdfs:comment 데이터 랭글링(Data Wrangling) 혹은 데이터 먼징(Data Munging)이라고 불리는 이것은 원자료(raw data)를 보다 쉽게 접근하고 분석할 수 있도록 데이터를 정리하고 통합하는 과정이다. 이를 통해서 반자동화 도구의 도움으로 데이터를 좀 더 편리하게 소비한다. 데이터 랭글링에는 먼징(munging), 데이터 시각화, 데이터 집합, 통계 모형 학습 뿐만 아니라 많은 다른 잠재적 용도도 포함된다. 일반적으로 데이터 먼징은 일반적인 단계를 따르는데 데이터 원천(Data Source)으로부터 원래 최초 형태로 자료를 추출하는 것으로 시작한다.알고리듬(예로, 정렬)을 사용해서 원자료를 "먼징(munging"하거나 사전 정의된 자료구조로 데이터를 파싱(parsing)한다.그리고 나서 마지막으로 저장이나 미래 사용을 위해서 작업 완료한 콘텐츠를 데이터 싱크(data sink)에 놓아둔다.인터넷의 급격한 확산으로 이러한 기술이 가용한 데이터 양이 증가하고 있는 기관에서는 점점 중요해지고 있다. 데이터 랭글러(Data Wrangler)는 랭글링을 수행하는 사람이다. (ko) Data wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data. (en)
rdfs:label Data wrangling (en) 데이터 랭글링 (ko)
owl:sameAs freebase:Data wrangling yago-res:Data wrangling wikidata:Data wrangling dbpedia-fa:Data wrangling dbpedia-is:Data wrangling dbpedia-ko:Data wrangling dbpedia-no:Data wrangling https://global.dbpedia.org/id/4iiG6
prov:wasDerivedFrom wikipedia-en:Data_wrangling?oldid=1124766133&ns=0
foaf:depiction wiki-commons:Special:FilePath/Data_Wrangling_From_Messy_To_Clean_Data_Management.jpg
foaf:isPrimaryTopicOf wikipedia-en:Data_wrangling
is dbo:industry of dbr:Trifacta
is dbo:wikiPageRedirects of dbr:Data_wrangler dbr:Data_munging dbr:Data_mungling
is dbo:wikiPageWikiLink of dbr:Jsoup dbr:Regular_expression dbr:Vadalog dbr:Misuse_of_statistics dbr:Trifacta dbr:Data_blending dbr:Data_cleansing dbr:Data_conversion dbr:Data_curation dbr:Data_editing dbr:Data_integration dbr:Data_mapping dbr:Data_pre-processing dbr:Data_reduction dbr:Data_transformation_(computing) dbr:Pandas_(software) dbr:Data_wrangler dbr:Data_munging dbr:Data_mungling dbr:OpenRefine dbr:Semantic_mapper dbr:Selection_(user_interface) dbr:Simultaneous_editing dbr:Web_scraping
is foaf:primaryTopic of wikipedia-en:Data_wrangling