Data profiling (original) (raw)

About DBpedia

Data-Profiling bezeichnet den weitgehend automatisierten Prozess zur Analyse vorhandener Datenbestände (z. B. in einer Datenbank) durch unterschiedliche Analysetechniken.Durch das Data Profiling werden die existierenden Metadaten zu den Echtdaten validiert und neue Metadaten identifiziert. Zusätzlich werden bestehende Datenqualitätsprobleme validiert, die verursachenden Daten identifiziert und die Informationsqualität der analysierten Daten gemessen. Durch das Data Profiling werden keine Qualitätsprobleme in den Daten behoben, sondern nur die zugehörigen Metadaten korrigiert.

Property Value
dbo:abstract Data-Profiling bezeichnet den weitgehend automatisierten Prozess zur Analyse vorhandener Datenbestände (z. B. in einer Datenbank) durch unterschiedliche Analysetechniken.Durch das Data Profiling werden die existierenden Metadaten zu den Echtdaten validiert und neue Metadaten identifiziert. Zusätzlich werden bestehende Datenqualitätsprobleme validiert, die verursachenden Daten identifiziert und die Informationsqualität der analysierten Daten gemessen. Durch das Data Profiling werden keine Qualitätsprobleme in den Daten behoben, sondern nur die zugehörigen Metadaten korrigiert. (de) Data profiling is the process of examining the data available from an existing information source (e.g. a database or a file) and collecting statistics or informative summaries about that data. The purpose of these statistics may be to: 1. * Find out whether existing data can be easily used for other purposes 2. * Improve the ability to search data by tagging it with keywords, descriptions, or assigning it to a category 3. * Assess data quality, including whether the data conforms to particular standards or patterns 4. * Assess the risk involved in integrating data in new applications, including the challenges of joins 5. * Discover metadata of the source database, including value patterns and distributions, key candidates, foreign-key candidates, and functional dependencies 6. * Assess whether known metadata accurately describes the actual values in the source database 7. * Understanding data challenges early in any data intensive project, so that late project surprises are avoided. Finding data problems late in the project can lead to delays and cost overruns. 8. * Have an enterprise view of all data, for uses such as master data management, where key data is needed, or data governance for improving data quality. (en) Le profiling est le processus qui consiste à récolter les données dans les différentes sources de données existantes (bases de données, fichiers,...) et à collecter des statistiques et des informations sur ces données. C'est ainsi très proche de l'analyse des données. (fr)
dbo:wikiPageID 794330 (xsd:integer)
dbo:wikiPageLength 8241 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1102297638 (xsd:integer)
dbo:wikiPageWikiLink dbr:Descriptive_statistics dbr:Index_term dbr:Analysis_paralysis dbr:Computer_file dbr:Functional_dependency dbr:Tag_(metadata) dbc:Data_quality dbr:Data_analysis dbr:Data_governance dbr:Data_integration dbr:Data_quality dbr:Database_normalization dbr:Join_(SQL) dbr:Data_visualization dbr:Data_warehouse dbr:Frequency_distribution dbc:Data_management dbc:Data_analysis dbr:Metadata dbr:Candidate_key dbr:Master_data_management dbr:Inclusion_dependency
dbp:wikiPageUsesTemplate dbt:Reflist dbt:Refimprove_article
dcterms:subject dbc:Data_quality dbc:Data_management dbc:Data_analysis
gold:hypernym dbr:Process
rdf:type dbo:Election dbo:MusicGenre
rdfs:comment Data-Profiling bezeichnet den weitgehend automatisierten Prozess zur Analyse vorhandener Datenbestände (z. B. in einer Datenbank) durch unterschiedliche Analysetechniken.Durch das Data Profiling werden die existierenden Metadaten zu den Echtdaten validiert und neue Metadaten identifiziert. Zusätzlich werden bestehende Datenqualitätsprobleme validiert, die verursachenden Daten identifiziert und die Informationsqualität der analysierten Daten gemessen. Durch das Data Profiling werden keine Qualitätsprobleme in den Daten behoben, sondern nur die zugehörigen Metadaten korrigiert. (de) Le profiling est le processus qui consiste à récolter les données dans les différentes sources de données existantes (bases de données, fichiers,...) et à collecter des statistiques et des informations sur ces données. C'est ainsi très proche de l'analyse des données. (fr) Data profiling is the process of examining the data available from an existing information source (e.g. a database or a file) and collecting statistics or informative summaries about that data. The purpose of these statistics may be to: (en)
rdfs:label Data-Profiling (de) Data profiling (en) Data profiling (fr)
owl:sameAs freebase:Data profiling wikidata:Data profiling dbpedia-de:Data profiling dbpedia-fr:Data profiling http://hi.dbpedia.org/resource/सोशल_प्रोफाइलिंग dbpedia-no:Data profiling http://ta.dbpedia.org/resource/தரவு_விவரக்குறிப்புகள் https://global.dbpedia.org/id/DpAv
prov:wasDerivedFrom wikipedia-en:Data_profiling?oldid=1102297638&ns=0
foaf:isPrimaryTopicOf wikipedia-en:Data_profiling
is dbo:wikiPageDisambiguates of dbr:Profiling
is dbo:wikiPageWikiLink of dbr:VPN_service dbr:Information_server dbr:Oracle_Warehouse_Builder dbr:ApexKB dbr:Surveillance dbr:Data_and_information_visualization dbr:Data_auditing dbr:Data_cleansing dbr:Data_exploration dbr:Data_governance dbr:Data_quality dbr:Profiling dbr:Prototype dbr:Integration_competency_center dbr:Extract,_transform,_load dbr:Panzura
is foaf:primaryTopic of wikipedia-en:Data_profiling