Data mining (original) (raw)

La mineria de dades (data mining) és un procés no trivial d'identificació d'informació vàlida, nova, potencialment útil i entenible, de patrons comprensibles que es troben ocults en les dades. Engloba tot un conjunt de tècniques encaminades a l'extracció de coneixement processable, implícit en les bases de dades. Està íntimament lligat a la supervisió de processos industrials, ja que resulta molt útil per aprofitar les dades emmagatzemades a les bases de dades. Les bases de la mineria de dades es troben en la intel·ligència artificial i en l'anàlisi estadística. Mitjançant els models extrets utilitzant tècniques de mineria de dades s'aborda la solució a problemes de predicció, classificació i segmentació de memòria.

Property	Value
dbo:abstract	La mineria de dades (data mining) és un procés no trivial d'identificació d'informació vàlida, nova, potencialment útil i entenible, de patrons comprensibles que es troben ocults en les dades. Engloba tot un conjunt de tècniques encaminades a l'extracció de coneixement processable, implícit en les bases de dades. Està íntimament lligat a la supervisió de processos industrials, ja que resulta molt útil per aprofitar les dades emmagatzemades a les bases de dades. Les bases de la mineria de dades es troben en la intel·ligència artificial i en l'anàlisi estadística. Mitjançant els models extrets utilitzant tècniques de mineria de dades s'aborda la solució a problemes de predicció, classificació i segmentació de memòria. (ca) Data mining ([dejta majnyn], angl. dolování z dat či vytěžování dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (knowledge discovery in databases, KDD), jindy se tato dvě označení chápou jako souznačná. Často dochází také k překryvu s termínem data science, který bývá obvykle chápán šířeji než data mining. Data mining se používá v komerční sféře (například v marketingu při rozhodování, které klienty oslovit dopisem s nabídkou produktu), ve vědeckém výzkumu (například při analýze genetické informace) i v jiných oblastech (například při monitorování aktivit na internetu s cílem odhalit činnost potenciálních škůdců a teroristů). (cs) التنقيب في البيانات (بالإنجليزية: data mining)‏ هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة)، لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات. يطلق اسم «نماذج» models على العلاقات والبيانات الملخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثلاً قاعدة بيانات التعاملات في مصرف ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلقاً على طريقة تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن الإحصاء، ولهذا يشار إلى عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضاً إلى أن كمية البيانات تكون عادة كبيرة، أما في حال كون كمية البيانات صغيرة فيفضل استخدام الطرق الإحصائية العادية في تحليلها. عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط المميزة في البيانات، وكيفية تحليل البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي علاقة ظاهرية تعكس حقيقة في طبيعة البيانات. عادة يتم التنقيب في بيانات تكون جزءاً من كامل البيانات حيث يكون الغرض عادة تعميم النتائج على كامل البيانات (مثلاً تحليل البيانات الحالية لمستهلكي منتج ما بغرض توقع طلبات المستهلكين المستقبلية). من أحد أهداف تنقيب البيانات أيضاً هو اختزال كميات البيانات الكبيرة أو ضغطها بحيث تعبر بشكل بسيط عن كامل البيانات بدون تعميم. (ar) Εξόρυξη δεδομένων (ή ανακάλυψη γνώσης από βάσεις δεδομένων) (αγγλ. data mining) είναι η εξεύρεση μιας (ενδιαφέρουσας, αυτονόητης, μη προφανούς και πιθανόν χρήσιμης) πληροφορίας ή προτύπων από μεγάλες βάσεις δεδομένων με χρήση αλγορίθμων ομαδοποίησης ή και των αρχών της στατιστικής, της τεχνητής νοημοσύνης, της μηχανικής μάθησης και των συστημάτων βάσεων δεδομένων. Στόχος της εξόρυξης δεδομένων είναι η πληροφορία που θα εξαχθεί και τα πρότυπα που θα προκύψουν να έχουν δομή κατανοητή προς τον άνθρωπο έτσι ώστε να τον βοηθήσουν να πάρει τις κατάλληλες αποφάσεις. (el) Data mining is the process of extracting and discovering patterns in large data sets involving methods at the intersection of machine learning, statistics, and database systems. Data mining is an interdisciplinary subfield of computer science and statistics with an overall goal of extracting information (with intelligent methods) from a data set and transforming the information into a comprehensible structure for further use. Data mining is the analysis step of the "knowledge discovery in databases" process, or KDD. Aside from the raw analysis step, it also involves database and data management aspects, data pre-processing, model and inference considerations, interestingness metrics, complexity considerations, post-processing of discovered structures, visualization, and online updating. The term "data mining" is a misnomer because the goal is the extraction of patterns and knowledge from large amounts of data, not the extraction (mining) of data itself. It also is a buzzword and is frequently applied to any form of large-scale data or information processing (collection, extraction, warehousing, analysis, and statistics) as well as any application of computer decision support system, including artificial intelligence (e.g., machine learning) and business intelligence. The book Data mining: Practical machine learning tools and techniques with Java (which covers mostly machine learning material) was originally to be named Practical machine learning, and the term data mining was only added for marketing reasons. Often the more general terms (large scale) data analysis and analytics—or, when referring to actual methods, artificial intelligence and machine learning—are more appropriate. The actual data mining task is the semi-automatic or automatic analysis of large quantities of data to extract previously unknown, interesting patterns such as groups of data records (cluster analysis), unusual records (anomaly detection), and dependencies (association rule mining, sequential pattern mining). This usually involves using database techniques such as spatial indices. These patterns can then be seen as a kind of summary of the input data, and may be used in further analysis or, for example, in machine learning and predictive analytics. For example, the data mining step might identify multiple groups in the data, which can then be used to obtain more accurate prediction results by a decision support system. Neither the data collection, data preparation, nor result interpretation and reporting is part of the data mining step, although they do belong to the overall KDD process as additional steps. The difference between data analysis and data mining is that data analysis is used to test models and hypotheses on the dataset, e.g., analyzing the effectiveness of a marketing campaign, regardless of the amount of data. In contrast, data mining uses machine learning and statistical models to uncover clandestine or hidden patterns in a large volume of data. The related terms data dredging, data fishing, and data snooping refer to the use of data mining methods to sample parts of a larger population data set that are (or may be) too small for reliable statistical inferences to be made about the validity of any patterns discovered. These methods can, however, be used in creating new hypotheses to test against the larger data populations. (en) Unter Data-Mining [ˈdeɪtə ˈmaɪnɪŋ] (von englisch data mining, aus englisch data ‚Daten‘ und englisch mine ‚graben‘, ‚abbauen‘, ‚fördern‘) versteht man die systematische Anwendung statistischer Methoden auf große Datenbestände (insbesondere „Big Data“ bzw. Massendaten) mit dem Ziel, neue Querverbindungen und Trends zu erkennen. Solche Datenbestände werden aufgrund ihrer Größe mittels computergestützter Methoden verarbeitet. In der Praxis wurde der Unterbegriff Data-Mining auf den gesamten Prozess der sogenannten „Knowledge Discovery in Databases“ (englisch für Wissensentdeckung in Datenbanken; KDD) übertragen, der auch Schritte wie die Vorverarbeitung und Auswertung beinhaltet, während Data-Mining im engeren Sinne nur den eigentlichen Verarbeitungsschritt des Prozesses bezeichnet. Die Bezeichnung Data-Mining (eigentlich etwa „Abbau von Daten“) ist etwas irreführend, denn es geht um die Gewinnung von Wissen aus bereits vorhandenen Daten und nicht um die Generierung von Daten selbst. Die prägnante Bezeichnung hat sich dennoch durchgesetzt.Die reine Erfassung, Speicherung und Verarbeitung von großen Datenmengen wird gelegentlich ebenfalls mit dem Buzzword Data-Mining bezeichnet. Im wissenschaftlichen Kontext bezeichnet es primär die Extraktion von Wissen, das „gültig (im statistischen Sinne), bisher unbekannt und potentiell nützlich“ ist „zur Bestimmung bestimmter Regelmäßigkeiten, Gesetzmäßigkeiten und verborgener Zusammenhänge“. Fayyad definiert es als „ein[en] Schritt des KDD-Prozesses, der darin besteht, Datenanalyse- und Entdeckungsalgorithmen anzuwenden, die unter akzeptablen Effizienzbegrenzungen eine spezielle Auflistung von Mustern (oder Modellen) der Daten liefern“. Das Schließen von Daten auf (hypothetische) Modelle wird als Statistische Inferenz bezeichnet. (de) Datu-meatzaritza (inglesez data mining) estatistikaren (datu-analisiaren) eta konputazio-zientzien esparru bat da, datu-multzo erraldoietan ereduak aurkitzea helburu duena; informazioaren erauzte-prozesu horretan adimen artifizialeko, estatistikako eta ikasketa automatikoko metodoak erabiltzen dira. KDD (knowledge discovery in databases) izenez ezagutzen den prozesuaren zati bat besterik ez da. Izan ere, KDD prozesuak datu-meatzaritza aplikatu aurretik datuak biltzea, aukeratzea, garbitzea eta eraldatzea eskatu ohi du. Ondoren emaitzak ebaluatu, interpretatu eta azken erabakiak hartu behar izaten dira. Datu-multzo erraldoi horietan ezezagunak diren ereduak aurkitzearen ataza modu automatikoan edo erdi-automatikoan egiten da. Mota desberdineko ereduak izan ohi dira: datuen multzokatzea (clustering analisia), ohikoak ez diren instantzien (kasuen) detekzioa, mendekotasunak aurkitzea etab. Aurkitutako eredu horiek sarrerako datu-multzo erraldoien interpretazio bat eskaintzen dute eta gerora aplika daitezkeen analisi gehigarrietan (ikasketa automatikoa) lagungarri izan daitezke. (eu) La minería de datos o exploración de datos (es la etapa de análisis de "knowledge discovery in databases" o KDD) es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, supone aspectos de gestión de datos y de bases de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de intereses, de consideraciones de la teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea. El término es un concepto de moda, y es frecuentemente mal utilizado para referirse a cualquier forma de datos a gran escala o procesamiento de la información (recolección, extracción, almacenamiento, análisis y estadísticas), pero también se ha generalizado a cualquier tipo de sistema informático de apoyo a decisiones, incluyendo la inteligencia artificial, aprendizaje automático y la inteligencia empresarial. En el uso de la palabra, el término clave es el descubrimiento, comúnmente se define como "la detección de algo nuevo". Incluso el popular libro "La minería de datos: sistema de prácticas herramientas de aprendizaje y técnicas con Java" (que cubre todo el material de aprendizaje automático) originalmente iba a ser llamado simplemente "la máquina de aprendizaje práctico", y el término "minería de datos" se añadió por razones de marketing. A menudo, los términos más generales "(gran escala) el análisis de datos", o "análisis". O cuando se refieren a los métodos actuales, la inteligencia artificial y aprendizaje automático, son más apropiados. La tarea de minería de datos real es el análisis automático o semi-automático de grandes cantidades de datos para extraer patrones interesantes hasta ahora desconocidos, como los grupos de registros de datos (análisis clúster), registros poco usuales (la detección de anomalías) y dependencias (minería por reglas de asociación). Esto generalmente implica el uso de técnicas de bases de datos como los índices espaciales. Estos patrones pueden entonces ser vistos como una especie de resumen de los datos de entrada, y pueden ser utilizados en el análisis adicional o, por ejemplo, en el aprendizaje automático y análisis predictivo. Por ejemplo, el paso de minería de datos podría identificar varios grupos en los datos, que luego pueden ser utilizados para obtener resultados más precisos de predicción por un sistema de soporte de decisiones. Ni la recolección de datos, la preparación de datos, ni la interpretación de los resultados y la información son parte de la etapa de minería de datos, pero que pertenecen a todo el proceso KDD como pasos adicionales. Los términos relacionados con la obtención de datos, la pesca de datos y espionaje de los datos se refieren a la utilización de métodos de minería de datos a las partes de la muestra de un conjunto de datos de población más grandes establecidas que son (o pueden ser) demasiado pequeñas para las inferencias estadísticas fiables que se hizo acerca de la validez de cualquier patrón descubierto. Estos métodos pueden, sin embargo, ser utilizados en la creación de nuevas hipótesis que se prueban contra poblaciones de datos más grandes. (es) L’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques. Elle se propose d'utiliser un ensemble d'algorithmes issus de disciplines scientifiques diverses telles que les statistiques, l'intelligence artificielle ou l'informatique, pour construire des modèles à partir des données, c'est-à-dire trouver des structures intéressantes ou des motifs selon des critères fixés au préalable, et d'en extraire un maximum de connaissances. L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. C'est aussi le mode de travail du journalisme de données. L'exploration de données fait suite, dans l'escalade de l'exploitation des données de l'entreprise, à l'informatique décisionnelle. Celle-ci permet de constater un fait, tel que le chiffre d'affaires, et de l'expliquer comme le chiffre d'affaires décliné par produits, tandis que l'exploration de données permet de classer les faits et de les prévoir dans une certaine mesure ou encore de les éclairer en révélant par exemple les variables ou paramètres qui pourraient faire comprendre pourquoi le chiffre d'affaires de tel point de vente est supérieur à celui de tel autre. (fr) Penggalian data (bahasa Inggris: data mining) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari perusahaan, e-commerce, data saham, data sensus dan data bioinformatika), tetapi tidak tahu pola apa yang bisa didapatkan. (in) 데이터마이닝(data mining), 또는 자료채굴(資料採掘)은, 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적규칙이나 짜임을 분석하여, 가치있는 정보를 빼내는 과정이다. 다른 말로는, KDD(데이터베이스속의 앎발견, knowledge-discovery in databases)라고도 일컫는다. (ko) Datamining (gegevensdelving, datadelving) is het gericht zoeken naar (statistische) verbanden tussen verschillende gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Zo'n verzameling gegevens kan gevormd worden door gebeurtenissen in een praktijksituatie te registreren (aankoopgedrag van consumenten, symptomen bij patiënten, et cetera) of door de resultaten van eerder uitgevoerde wetenschappelijke onderzoeken met elkaar te vergelijken en te herinterpreteren. De naam komt voort uit de overeenkomsten tussen het zoeken naar statistische verbanden en het graven (mining) naar iets waardevols in een grote berg gegevens (big data). Datamining helpt bedrijven en wetenschappers de essentiële informatie te selecteren. Er kan een model mee gecreëerd worden dat het gedrag van mensen of systemen kan voorspellen. (nl) データマイニング（英語: data mining）とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク（heuristic、発見的）な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases（データベースからの知識発見）の頭文字をとってKDDとも呼ばれる。 (ja) L'estrazione di dati o data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di informazioni utili da grandi quantità di dati (es. banche dati, data warehouse, ecc.), attraverso metodi automatici o semi-automatici (es. apprendimento automatico) e l'utilizzo scientifico, aziendale, industriale o operativo delle stesse. (it) Eksploracja danych, pozyskiwanie danych, drążenie danych, wydobywanie danych – jeden z etapów procesu uzyskiwania wiedzy z baz danych. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych. Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki, takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe. (pl) Data mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989 году. Английское словосочетание «data mining» пока не имеет устоявшегося перевода на русский язык. При передаче на русском языке используются следующие словосочетания: просев информации, добыча данных, извлечение данных, а также интеллектуальный анализ данных. Более полным и точным является словосочетание «обнаружение знаний в базах данных» (англ. knowledge discovery in databases, KDD). Основу методов data mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики. К методам data mining нередко относят статистические методы . Такие методы, однако, предполагают некоторые априорные представления об анализируемых данных, что несколько расходится с целями data mining (обнаружение ранее неизвестных нетривиальных и практически полезных знаний). Одно из важнейших назначений методов data mining состоит в наглядном представлении результатов вычислений (визуализация), что позволяет использовать инструментарий data mining людьми, не имеющими специальной математической подготовки. Применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой. (ru) Databrytning, informationsutvinning eller datautvinning, av engelskans data mining, betecknar verktyg för att söka efter mönster, samband och trender i stora datamängder. Verktygen använder beräkningsmetoder för multivariat statistisk analys kombinerat med beräkningseffektiva algoritmer för maskininlärning och mönsterigenkänning hämtade från artificiell intelligens. (sv) Prospecção de dados (português europeu) ou mineração de dados (português brasileiro) (também conhecida pelo termo inglês data mining) é o processo de explorar dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. No campo da administração, a mineração de dados é o uso da tecnologia da informação para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões sobre estratégia e vantagens competitivas. Esse é um tópico recente em ciência da computação, mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões. (pt) 数据挖掘（英語：data mining）是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息，并将其转换成可理解的结构，以进一步使用。除了原始分析步骤，它还涉及到数据库和数据管理方面、、模型与推断方面考量、兴趣度度量、复杂度的考虑，以及发现结构、可视化及在线更新等后处理。数据挖掘是“資料庫知識發現”（Knowledge-Discovery in Databases, KDD）的分析步骤，本质上属于机器学习的范畴。类似词语“資料採礦”、“数据捕鱼”和“数据探测”指用数据挖掘方法来采样（可能）过小以致无法可靠地统计推断出所发现任何模式的有效性的更大总体数据集的部分。不过这些方法可以建立新的假设来检验更大数据总体。 (zh) Добува́ння да́них (англ. data mining), також глиби́нний ана́ліз да́них[джерело?] — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.[джерело?] На сучасних підприємствах, в дослідницьких проектах або в інтернеті утворюються великі обсяги даних. Глибинний аналіз даних здійснюється автоматично шляхом застосування методів математичної статистики, штучних нейронних мереж, теорії нечітких множин або генетичних алгоритмів. Метою аналізу є виявлення правил та закономірностей, наприклад, статистичних подій. Так, наприклад, можливо виявити зміни у поведінці клієнтів або груп клієнтів для покращення стратегії підприємства. (uk)
dbo:thumbnail	wiki-commons:Special:FilePath/Spurious_correlations_-_spelling_bee_spiders.svg?width=300
dbo:wikiPageExternalLink	http://www.kdnuggets.com/meetings/kdd89/ http://cs.nju.edu.cn/zhouzh/zhouzh.files/course/dm/reading/reading01/chen_tkde96.pdf
dbo:wikiPageID	42253 (xsd:integer)
dbo:wikiPageLength	45781 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1123384957 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Cambridge_University_Press dbr:Carrot2 dbr:Behavior_informatics dbr:Prentice_Hall dbr:Privacy dbr:Python_(programming_language) dbr:Qlucore dbr:Robert_Tibshirani dbr:San_Diego dbr:Scikit-learn dbr:Ensemble_learning dbr:List_of_computer_science_conferences dbr:Multivariate_statistics dbr:Natural_language_processing dbr:Time_series dbr:Bayes'_theorem dbr:Bayesian_network dbr:Anomaly_detection dbr:Review_of_Economic_Studies dbr:Customer_analytics dbr:DATADVANCE dbr:US_Congress dbr:User_behavior_analytics dbr:Vertica dbr:Decision_support_system dbr:Decision_tree dbr:Decision_tree_learning dbr:Deep_learning dbr:InformationWeek dbr:Information_extraction dbr:Information_integration dbr:Information_processing dbr:Intellectual_property dbr:Intention_mining dbr:International_Conference_on_Very_Large_Data_Bases dbr:International_Journal_of_Data_Warehousing_and_Mining dbr:International_Safe_Harbor_Privacy_Principles dbr:Limitations_and_exceptions_to_copyright dbr:MOA_(Massive_Online_Analysis) dbr:Conference_on_Knowledge_Discovery_and_Data_Mining dbr:SAS_(software) dbr:SAS_Institute dbr:SPSS dbr:SPSS_Modeler dbr:STATISTICA dbr:National_security dbr:Online_algorithm dbr:Oracle_Data_Mining dbr:Quantitative_structure–activity_relationship dbr:Edward_Snowden dbr:Electronic_discovery dbr:General_Architecture_for_Text_Engineering dbr:Google dbr:Google_Cloud_Platform dbr:Mlpack dbr:Multi_expression_programming dbr:Conference_on_Information_and_Knowledge_Management dbr:Confidentiality dbr:Copyright_law_of_the_European_Union dbr:Copyright_law_of_the_United_States dbr:Cross-industry_standard_process_for_data_mining dbr:Statistical_inference dbr:Angoss dbr:Applied_statistics dbr:Lua_(programming_language) dbr:Machine_learning dbr:Big_Data dbr:Statistical_model dbr:Statistics dbr:Cluster_analysis dbr:Computational_complexity_theory dbr:Computer_science dbr:Data_privacy dbr:Database_system dbr:Pattern dbr:Predictive_analytics dbr:Structured_data_analysis_(statistics) dbr:Surveillance dbr:Tanagra_(machine_learning) dbr:Total_Information_Awareness dbr:Mass_surveillance dbr:Predictive_Model_Markup_Language dbr:Automatic_number_plate_recognition_in_the_United_Kingdom dbr:Buzzword dbr:C++ dbc:Formal_sciences dbr:Aggregate_function dbr:Torch_(machine_learning) dbr:Training_set dbr:Trevor_Hastie dbr:UIMA dbr:Data dbr:Data_Mining_and_Knowledge_Discovery dbr:Data_aggregation dbr:Data_analysis dbr:Data_anonymization dbr:Data_collection dbr:Data_dredging dbr:Data_integration dbr:Data_management dbr:Data_mart dbr:Data_pre-processing dbr:Data_scraping dbr:Data_set dbr:Database_Directive dbr:Weka_(machine_learning) dbr:Drug_discovery dbr:GNU_Project dbr:Cross_Industry_Standard_Process_for_Data_Mining dbr:Law_enforcement dbr:Learning_classifier_system dbr:AAAI dbr:ADVISE dbr:Agent_mining dbr:Amazon.com dbr:Amazon_SageMaker dbr:Analytics dbr:Data_transformation dbr:Data_visualization dbr:Data_warehouse dbr:ELKI dbr:Ethics dbr:European_Commission dbr:European_Union dbr:Factor_analysis dbr:Fair_use dbr:Family_Educational_Rights_and_Privacy_Act dbr:PSPP dbr:PSeven dbr:Educational_data_mining dbr:KNIME dbr:Knowledge_extraction dbr:Dependency_(computer_science) dbr:System_deployment dbr:Usama_Fayyad dbr:Profiling_(information_science) dbr:Regression_analysis dbr:Google_Book_Search_Settlement_Agreement dbr:Health_Insurance_Portability_and_Accountability_Act dbr:Hewlett-Packard dbr:Java_(programming_language) dbr:Sequential_pattern_mining dbr:Stellar_Wind_(code_name) dbr:Artificial_intelligence dbr:Artificial_neural_network dbr:Association_for_Computing_Machinery dbc:Data_mining dbr:A_priori_probability dbr:Academic_Press dbr:Academic_journal dbr:Jerome_H._Friedman dbr:Jiawei_Han dbr:LIONsolver dbr:Bing_Liu_(computer_scientist) dbr:Bioinformatics dbr:Support_vector_machines dbr:Java_Data_Mining dbr:Misnomer dbr:Missing_data dbr:StatSoft dbr:Domain_driven_data_mining dbr:Association_rule_learning dbr:Automatic_summarization dbr:Business_intelligence dbr:PolyAnalyst dbr:Social_media_mining dbr:Spatial_index dbr:European_Conference_on_Machine_Learnin...e_of_Knowledge_Discovery_in_Databases dbr:Global_surveillance_disclosure dbr:Gregory_I._Piatetsky-Shapiro dbr:Scientific_computing dbr:Data_snooping dbr:IBM dbr:Information_Society_Directive dbr:Kluwer_Academic_Publishers dbr:Michael_Lovell dbr:Microsoft dbr:Microsoft_Analysis_Services dbr:National_Security_Agency dbr:Natural_Language_Toolkit dbr:Open_access dbr:Open_source_model dbr:Oracle_Corporation dbr:Orange_(software) dbr:R_(programming_language) dbr:RapidMiner dbr:Receiver_operating_characteristic dbr:Wolters_Kluwer dbr:XML dbr:Genetic_algorithms dbr:NetOwl dbr:Statistical_classification dbr:Exploratory_data_analysis dbr:Chemicalize.org dbr:Programming_language dbr:SEMMA dbr:OpenNN dbr:SIGMOD dbr:Statistical_hypothesis_testing dbr:Examples_of_data_mining dbr:Test_set dbr:Named-entity_recognition dbr:Web_scraping dbr:Multilinear_subspace_learning dbr:Web_mining dbr:Psychometrics dbr:SIGKDD dbr:Interdisciplinary dbr:Philip_S._Yu dbr:Ramasamy_Uthurusamy dbr:Reproducibility dbr:Statistical_noise dbr:Text_mining dbr:Personally_identifiable_information dbr:Overfitting dbr:Surveillance_capitalism dbr:Neural_networks dbr:Database_management dbr:Association_rule_mining dbr:KDD_Conference dbr:Marketing_campaign dbr:Springer_Verlag dbr:Privacy_violation dbr:Decision_rules dbr:CIKM_Conference dbr:Sequence_mining dbr:Morgan_Kaufmann dbr:NLTK dbr:Subspace_clustering dbr:Wikt:automatic dbr:File:Spurious_correlations_-_spelling_bee_spiders.svg dbr:Hargreaves_review dbr:KDD-95
dbp:wikiPageUsesTemplate	dbt:Data dbt:According_to_whom dbt:Authority_control dbt:Cite_book dbt:Cite_journal dbt:Columns-list dbt:Commons_category dbt:Curlie dbt:ISBN dbt:Main dbt:Redirect dbt:Refbegin dbt:Refend dbt:Reflist dbt:Short_description dbt:Computer_science dbt:Data_warehouse dbt:Category_see_also dbt:Machine_learning_bar
dcterms:isPartOf	http://zbw.eu/stw/mapping/dbpedia/target
dcterms:subject	dbc:Formal_sciences dbc:Data_mining
gold:hypernym	dbr:Subfield
rdf:type	owl:Thing dbo:Disease dbo:MusicGenre
rdfs:comment	La mineria de dades (data mining) és un procés no trivial d'identificació d'informació vàlida, nova, potencialment útil i entenible, de patrons comprensibles que es troben ocults en les dades. Engloba tot un conjunt de tècniques encaminades a l'extracció de coneixement processable, implícit en les bases de dades. Està íntimament lligat a la supervisió de processos industrials, ja que resulta molt útil per aprofitar les dades emmagatzemades a les bases de dades. Les bases de la mineria de dades es troben en la intel·ligència artificial i en l'anàlisi estadística. Mitjançant els models extrets utilitzant tècniques de mineria de dades s'aborda la solució a problemes de predicció, classificació i segmentació de memòria. (ca) Εξόρυξη δεδομένων (ή ανακάλυψη γνώσης από βάσεις δεδομένων) (αγγλ. data mining) είναι η εξεύρεση μιας (ενδιαφέρουσας, αυτονόητης, μη προφανούς και πιθανόν χρήσιμης) πληροφορίας ή προτύπων από μεγάλες βάσεις δεδομένων με χρήση αλγορίθμων ομαδοποίησης ή και των αρχών της στατιστικής, της τεχνητής νοημοσύνης, της μηχανικής μάθησης και των συστημάτων βάσεων δεδομένων. Στόχος της εξόρυξης δεδομένων είναι η πληροφορία που θα εξαχθεί και τα πρότυπα που θα προκύψουν να έχουν δομή κατανοητή προς τον άνθρωπο έτσι ώστε να τον βοηθήσουν να πάρει τις κατάλληλες αποφάσεις. (el) 데이터마이닝(data mining), 또는 자료채굴(資料採掘)은, 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적규칙이나 짜임을 분석하여, 가치있는 정보를 빼내는 과정이다. 다른 말로는, KDD(데이터베이스속의 앎발견, knowledge-discovery in databases)라고도 일컫는다. (ko) データマイニング（英語: data mining）とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク（heuristic、発見的）な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases（データベースからの知識発見）の頭文字をとってKDDとも呼ばれる。 (ja) L'estrazione di dati o data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di informazioni utili da grandi quantità di dati (es. banche dati, data warehouse, ecc.), attraverso metodi automatici o semi-automatici (es. apprendimento automatico) e l'utilizzo scientifico, aziendale, industriale o operativo delle stesse. (it) Eksploracja danych, pozyskiwanie danych, drążenie danych, wydobywanie danych – jeden z etapów procesu uzyskiwania wiedzy z baz danych. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych. Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki, takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe. (pl) Databrytning, informationsutvinning eller datautvinning, av engelskans data mining, betecknar verktyg för att söka efter mönster, samband och trender i stora datamängder. Verktygen använder beräkningsmetoder för multivariat statistisk analys kombinerat med beräkningseffektiva algoritmer för maskininlärning och mönsterigenkänning hämtade från artificiell intelligens. (sv) 数据挖掘（英語：data mining）是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息，并将其转换成可理解的结构，以进一步使用。除了原始分析步骤，它还涉及到数据库和数据管理方面、、模型与推断方面考量、兴趣度度量、复杂度的考虑，以及发现结构、可视化及在线更新等后处理。数据挖掘是“資料庫知識發現”（Knowledge-Discovery in Databases, KDD）的分析步骤，本质上属于机器学习的范畴。类似词语“資料採礦”、“数据捕鱼”和“数据探测”指用数据挖掘方法来采样（可能）过小以致无法可靠地统计推断出所发现任何模式的有效性的更大总体数据集的部分。不过这些方法可以建立新的假设来检验更大数据总体。 (zh) التنقيب في البيانات (بالإنجليزية: data mining)‏ هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة)، لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات. يطلق اسم «نماذج» models على العلاقات والبيانات الملخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثلاً قاعدة بيانات التعاملات في مصرف ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلقاً على طريقة تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن الإحصاء، ولهذا يشار إلى عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضاً إلى أن كم (ar) Data mining ([dejta majnyn], angl. dolování z dat či vytěžování dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (knowledge discovery in databases, KDD), jindy se tato dvě označení chápou jako souznačná. Často dochází také k překryvu s termínem data science, který bývá obvykle chápán šířeji než data mining. (cs) Unter Data-Mining [ˈdeɪtə ˈmaɪnɪŋ] (von englisch data mining, aus englisch data ‚Daten‘ und englisch mine ‚graben‘, ‚abbauen‘, ‚fördern‘) versteht man die systematische Anwendung statistischer Methoden auf große Datenbestände (insbesondere „Big Data“ bzw. Massendaten) mit dem Ziel, neue Querverbindungen und Trends zu erkennen. Solche Datenbestände werden aufgrund ihrer Größe mittels computergestützter Methoden verarbeitet. In der Praxis wurde der Unterbegriff Data-Mining auf den gesamten Prozess der sogenannten „Knowledge Discovery in Databases“ (englisch für Wissensentdeckung in Datenbanken; KDD) übertragen, der auch Schritte wie die Vorverarbeitung und Auswertung beinhaltet, während Data-Mining im engeren Sinne nur den eigentlichen Verarbeitungsschritt des Prozesses bezeichnet. (de) Data mining is the process of extracting and discovering patterns in large data sets involving methods at the intersection of machine learning, statistics, and database systems. Data mining is an interdisciplinary subfield of computer science and statistics with an overall goal of extracting information (with intelligent methods) from a data set and transforming the information into a comprehensible structure for further use. Data mining is the analysis step of the "knowledge discovery in databases" process, or KDD. Aside from the raw analysis step, it also involves database and data management aspects, data pre-processing, model and inference considerations, interestingness metrics, complexity considerations, post-processing of discovered structures, visualization, and online updating. (en) Datu-meatzaritza (inglesez data mining) estatistikaren (datu-analisiaren) eta konputazio-zientzien esparru bat da, datu-multzo erraldoietan ereduak aurkitzea helburu duena; informazioaren erauzte-prozesu horretan adimen artifizialeko, estatistikako eta ikasketa automatikoko metodoak erabiltzen dira. KDD (knowledge discovery in databases) izenez ezagutzen den prozesuaren zati bat besterik ez da. Izan ere, KDD prozesuak datu-meatzaritza aplikatu aurretik datuak biltzea, aukeratzea, garbitzea eta eraldatzea eskatu ohi du. Ondoren emaitzak ebaluatu, interpretatu eta azken erabakiak hartu behar izaten dira. (eu) La minería de datos o exploración de datos (es la etapa de análisis de "knowledge discovery in databases" o KDD) es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, supone aspectos de gestión de datos y de bases de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de intereses, de consideraciones de la teorí (es) L’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques. (fr) Penggalian data (bahasa Inggris: data mining) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari perusahaan, e-commerce, data saham, data sensus dan data bioinformatika), tetapi tidak tahu pola apa yang bisa didapatkan (in) Datamining (gegevensdelving, datadelving) is het gericht zoeken naar (statistische) verbanden tussen verschillende gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Zo'n verzameling gegevens kan gevormd worden door gebeurtenissen in een praktijksituatie te registreren (aankoopgedrag van consumenten, symptomen bij patiënten, et cetera) of door de resultaten van eerder uitgevoerde wetenschappelijke onderzoeken met elkaar te vergelijken en te herinterpreteren. (nl) Prospecção de dados (português europeu) ou mineração de dados (português brasileiro) (também conhecida pelo termo inglês data mining) é o processo de explorar dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados. Esse é um tópico recente em ciência da computação, mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões. (pt) Data mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989 году. Применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой. (ru) Добува́ння да́них (англ. data mining), також глиби́нний ана́ліз да́них[джерело?] — процес напівавтоматичного аналізу великих баз даних з метою пошуку корисних фактів. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.[джерело?] (uk)
rdfs:label	Data mining (en) تنقيب في البيانات (ar) Mineria de dades (ca) Data mining (cs) Data-Mining (de) Εξόρυξη δεδομένων (el) Minería de datos (es) Datu-meatzaritza (eu) Penggalian data (in) Exploration de données (fr) Data mining (it) データマイニング (ja) 데이터 마이닝 (ko) Eksploracja danych (pl) Datamining (nl) Mineração de dados (pt) Data mining (ru) Добування даних (uk) Datautvinning (sv) 数据挖掘 (zh)
owl:sameAs	freebase:Data mining freebase:Data mining yago-res:Data mining http://d-nb.info/gnd/4428654-5 wikidata:Data mining dbpedia-ar:Data mining dbpedia-az:Data mining dbpedia-bg:Data mining http://bn.dbpedia.org/resource/উপাত্ত_খনন dbpedia-ca:Data mining dbpedia-cs:Data mining dbpedia-cy:Data mining dbpedia-da:Data mining dbpedia-de:Data mining dbpedia-el:Data mining dbpedia-es:Data mining dbpedia-et:Data mining dbpedia-eu:Data mining dbpedia-fa:Data mining dbpedia-fi:Data mining dbpedia-fr:Data mining dbpedia-he:Data mining http://hi.dbpedia.org/resource/आँकड़ा_खनन dbpedia-hr:Data mining dbpedia-hu:Data mining http://hy.dbpedia.org/resource/Տվյալների_մայնինգ dbpedia-id:Data mining dbpedia-it:Data mining dbpedia-ja:Data mining http://kn.dbpedia.org/resource/ದತ್ತಾಂಶ_ಗಣಿಗಾರಿಕೆ dbpedia-ko:Data mining http://lv.dbpedia.org/resource/Datizrace dbpedia-mk:Data mining http://ml.dbpedia.org/resource/ഡാറ്റാ_മൈനിങ്ങ് http://mn.dbpedia.org/resource/Data_mining dbpedia-mr:Data mining dbpedia-ms:Data mining http://my.dbpedia.org/resource/ဒေတာတူးဖော်ခြင်း dbpedia-nl:Data mining dbpedia-nn:Data mining dbpedia-no:Data mining dbpedia-pl:Data mining dbpedia-pt:Data mining dbpedia-ro:Data mining dbpedia-ru:Data mining dbpedia-sh:Data mining dbpedia-simple:Data mining dbpedia-sk:Data mining dbpedia-sl:Data mining dbpedia-sq:Data mining dbpedia-sr:Data mining http://su.dbpedia.org/resource/Data_mining dbpedia-sv:Data mining http://ta.dbpedia.org/resource/தரவுச்_செயலாக்கம் http://tg.dbpedia.org/resource/Додаковӣ dbpedia-th:Data mining dbpedia-tr:Data mining dbpedia-uk:Data mining dbpedia-vi:Data mining http://yi.dbpedia.org/resource/דאטן_גראבן dbpedia-zh:Data mining https://global.dbpedia.org/id/gGgT
skos:closeMatch	http://zbw.eu/stw/descriptor/19807-1 http://www.springernature.com/scigraph/things/subjects/data-mining
prov:wasDerivedFrom	wikipedia-en:Data_mining?oldid=1123384957&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Spurious_correlations_-_spelling_bee_spiders.svg
foaf:isPrimaryTopicOf	wikipedia-en:Data_mining
is dbo:academicDiscipline of	dbr:David_Hand_(statistician) dbr:International_Journal_of_Data_Warehousing_and_Mining dbr:Chih-Jen_Lin dbr:Suresh_Venkatasubramanian dbr:Trevor_Hastie dbr:Alexander_Tuzhilin dbr:Curtis_Huttenhower dbr:Jie_Tang dbr:BioData_Mining dbr:Ramanathan_V._Guha dbr:Tobias_Preis
is dbo:genre of	dbr:SPSS_Modeler dbr:Tanagra_(machine_learning) dbr:ELKI dbr:Orange_(software) dbr:Neural_Designer dbr:Yooreeka
is dbo:industry of	dbr:SCL_Group dbr:DataSage
is dbo:knownFor of	dbr:Hui_Xiong dbr:Jonathan_Wren
is dbo:service of	dbr:Data_Applied
is dbo:type of	dbr:AggregateIQ
is dbo:wikiPageDisambiguates of	dbr:Mining_(disambiguation) dbr:DM
is dbo:wikiPageRedirects of	dbr:Privacy_concerns_regarding_data_mining dbr:Privacy_issues_in_data_mining dbr:Privacy_issues_with_data_mining dbr:Datamining dbr:Pattern_Mining dbr:Programming_Collective_Intelligence dbr:DATA_MINING dbr:Data_Mining dbr:Data_discovery dbr:Data-mining dbr:Data_Discovery dbr:Data_mine dbr:Data_mined dbr:Data_miner dbr:Data_miners dbr:Data_mining_system dbr:Datamine dbr:Knowledge_discovery_in_databases dbr:Web_mining dbr:List_of_data_mining_software dbr:Web_Mining dbr:Artificial_Intelligence_in_Data_Mining dbr:Pattern_mining dbr:Usage_mining dbr:Visual_Data_Mining dbr:Information-mining dbr:Information_mining dbr:Knowledge_Discovery_in_Databases dbr:Knowledge_discovering_in_databases dbr:Knowledge_mining dbr:Predictive_software dbr:Subject-based_data_mining dbr:Web_content_mining dbr:Web_data_mining dbr:Web_log_mining dbr:Web_usage_mining
is dbo:wikiPageWikiLink of	dbr:Call_of_Duty:_Modern_Warfare_Remastered dbr:Cambridge_Analytica dbr:Caro_Lucas dbr:Catalist dbr:American_Civil_Liberties_Union_v._Clapper dbr:Behavioral_analytics dbr:Presidency_of_Barack_Obama dbr:Privacy_concerns_regarding_data_mining dbr:Privacy_issues_in_data_mining dbr:Privacy_issues_with_data_mining dbr:Process_mining dbr:Programming_with_Big_Data_in_R dbr:Public.Resource.Org dbr:Qiang_Yang dbr:Query_language dbr:Robert_Tibshirani dbr:Root_cause_analysis dbr:Rudi_Studer dbr:Samer_Hassan dbr:Sankar_Kumar_Pal dbr:Scott_Levine dbr:Electronic_tagging dbr:Engineering_physics dbr:Engineering_science_and_mechanics dbr:Enterprise_resource_planning dbr:Epitome_(data_processing) dbr:List_of_academic_fields dbr:List_of_algorithms dbr:List_of_artificial_intelligence_projects dbr:List_of_computer_science_conferences dbr:List_of_computer_scientists dbr:List_of_databases_for_oncogenomic_research dbr:Mine dbr:Mining_(disambiguation) dbr:Multivariate_statistics dbr:Neural_network dbr:Non-negative_matrix_factorization dbr:Normalized_compression_distance dbr:Numerical_linear_algebra dbr:MAINWAY dbr:Meta-learning_(computer_science) dbr:Metabolomics dbr:Mexican_International_Conference_on_Artificial_Intelligence dbr:Omniture dbr:Onomastics dbr:Testing_hypotheses_suggested_by_the_data dbr:Time_series dbr:Privacy_concerns_with_Facebook dbr:Probably_approximately_correct_learning dbr:Semantic_computing dbr:Datamining dbr:Bell_Labs dbr:Binary_relation dbr:Binary_search_algorithm dbr:Biostatistics dbr:Blackbaud dbr:Blaž_Zupan dbr:Bottlenose_(company) dbr:Brian_D._Ripley dbr:David_Hand_(statistician) dbr:Dennis_K.J._Lin dbr:Department_of_Computer_Science,_University_of_Manchester dbr:Andrew_Climo dbr:Anna_Karlin dbr:Anomaly-based_intrusion_detection_system dbr:Anonymous_P2P dbr:Antifragility dbr:Approximate_inference dbr:Architectural_pattern dbr:History_of_artificial_intelligence dbr:History_of_the_Patriot_Act dbr:House_of_Cards_(season_4) dbr:Hui_Xiong dbr:John_Resig dbr:Joseph_G._Davis dbr:Bibliogram dbr:Bibliomining dbr:List_of_Cornell_University_alumni_(natural_sciences) dbr:List_of_software_that_supports_Office_Open_XML dbr:Patriot_Act dbr:Pattern_Mining dbr:Pawel_Lewicki dbr:Pentaho dbr:Peter_L._Hammer dbr:Peter_Thiel dbr:Rexer's_Annual_Data_Miner_Survey dbr:Rob_A._Rutenbar dbr:Robert_Khuzami dbr:Cultural_analytics dbr:Culturomics dbr:Curse_of_dimensionality dbr:Customer_analytics dbr:Customer_attrition dbr:Customer_relationship_management dbr:Cyberinfrastructure dbr:Cyberinfrastructure_for_Network_Science_Center dbr:Cyborg_data_mining dbr:DNA dbr:United_States_Department_of_Homeland_Security dbr:United_States_border_security_concerns dbr:University_of_California,_Irvine dbr:University_of_Illinois_Department_of_Computer_Science dbr:Ushahidi dbr:VRVis dbr:Vera_C._Rubin_Observatory dbr:Vertex_cover_in_hypergraphs dbr:David_Leinweber dbr:Day_of_Archaeology dbr:De-identification dbr:Decision-theoretic_rough_sets dbr:Decision_Model_and_Notation dbr:Decision_tree_learning dbr:Deep_Learning_Studio dbr:Deep_packet_inspection dbr:Dependent_and_independent_variables dbr:Desktop_organizer dbr:Determining_the_number_of_clusters_in_a_data_set dbr:Downloadable_content dbr:Dynamic_Bayesian_network dbr:Dynamic_consent dbr:Industrial_big_data dbr:Inference_attack dbr:Infinite-valued_logic dbr:Information_Harvesting dbr:Information_explosion dbr:Information_integration dbr:Information_silo dbr:Instance_selection dbr:Instantaneously_trained_neural_networks dbr:Institute_of_Analytics_Professionals_of_Australia dbr:Insurance_fraud dbr:Integrative_bioinformatics dbr:Intellectual_freedom dbr:Intelligence_engine dbr:Intelligent_database dbr:Intelligent_decision_support_system dbr:Intention_mining dbr:Interactive_visual_analysis dbr:International_Journal_of_Data_Warehousing_and_Mining dbr:International_reactions_to_the_2012_United_States_presidential_election dbr:Internet dbr:Internet_geolocation dbr:Intruder_detection dbr:Jacqui_Cole dbr:Jain_Pei dbr:Jan_Hajek_(scientist) dbr:Johannes_Gehrke dbr:L-diversity dbr:Lev_Manovich dbr:Liability_and_student_records dbr:Lifestreaming dbr:List_of_information_graphics_software dbr:List_of_numerical-analysis_software dbr:List_of_open-source_bioinformatics_software dbr:List_of_optimization_software dbr:Rule_induction dbr:Questionnaire_construction dbr:Npj_Genomic_Medicine dbr:Ross_Quinlan dbr:String_kernel dbr:Pedometric_mapping dbr:Pedotransfer_function dbr:Postmarketing_surveillance dbr:Prashant_Pandey_(activist) dbr:Predictive_buying dbr:Predictive_methods_for_surgery_duration dbr:Predictive_modelling dbr:Prescriptive_analytics dbr:Proposed_UK_Internet_age_verification_system dbr:Psychoinformatics dbr:Novadios dbr:Unidirectional_network dbr:Time-domain_astronomy dbr:Timeline_of_artificial_intelligence dbr:Combinatorial_meta-analysis dbr:Complex_Engineering_Systems_Institute dbr:Computational_transportation_science dbr:Corinna_Cortes dbr:Corporate_title dbr:Cosine_similarity dbr:Counterterrorism_Mission_Center dbr:Analysis_of_competing_hypotheses dbr:MasPar dbr:Medical_prescription dbr:Medina,_Washington dbr:SAS_(software) dbr:SCL_Group dbr:SPSS dbr:SPSS_Inc. dbr:SPSS_Modeler dbr:Cheminformatics dbr:Chief_data_officer dbr:Chih-Jen_Lin dbr:Error_tolerance_(PAC_learning) dbr:Gathering_of_personally_identifiable_information dbr:General-purpose_computing_on_graphics_processing_units dbr:Generative_topographic_map dbr:Geoff_Webb dbr:Geographic_information_system dbr:Lpod dbr:NooJ dbr:Online_analytical_processing dbr:Oracle_Data_Mining dbr:Outlier dbr:Social_network_analysis dbr:Middleware_(distributed_applications) dbr:Weighted_correlation_network_analysis dbr:Quantitative_structure–activity_relationship dbr:Source_Code_for_Biology_and_Medicine dbr:Sociomapping dbr:Terrorist_Finance_Tracking_Program dbr:Transpromotional dbr:Quantone dbr:Vaccine_Adverse_Event_Reporting_System dbr:Tin_Kam_Ho dbr:Yuying_Li dbr:Christianto_Wibisono dbr:Cochin_University_of_Science_and_Technology dbr:Collaborative_decision-making_software dbr:Alex_Richards_(journalist) dbr:Alexander_Strehl dbr:Effects_range_low_and_effects_range_median dbr:Electronic_discovery dbr:Enterprise_feedback_management dbr:François_Pachet dbr:Fravia dbr:Freakonomics dbr:Gala_Inc. dbr:Gary_Smith_(economist) dbr:Gatchaman_Crowds dbr:Gautam_Das_(computer_scientist) dbr:Get_Ed dbr:Glossary_of_artificial_intelligence dbr:Glossary_of_computer_science dbr:Gogo_Inflight_Internet dbr:Graph-tool dbr:Gratis_versus_libre dbr:Misuse_of_statistics dbr:MonetDB dbr:Moshe_Kam dbr:Music_genre dbr:NSA_warrantless_surveillance_(2001–2007) dbr:Concept_drift dbr:Concept_mining dbr:Connect_(computer_system) dbr:Contact_manager dbr:Contrast_set dbr:Contrast_set_learning dbr:Copyright_law_of_Japan dbr:Copyright_law_of_the_United_Kingdom dbr:Corporate_taxonomy dbr:Credit_card_fraud dbr:Crime_analysis dbr:Crime_prevention dbr:Criminal_Intelligence_Service_Canada dbr:Cross-industry_standard_process_for_data_mining dbr:Crystal_structure_prediction dbr:The_Visualization_Handbook dbr:Thinking_Machines_Corporation dbr:Daniel_A._Keim dbr:LOBPCG dbr:Laboratory_informatics dbr:Laboratory_information_management_system dbr:Simplicial_homology dbr:Spime dbr:Statistical_inference dbr:OptiY dbr:Optimal_discriminant_analysis_and_classification_tree_analysis dbr:Programming_Collective_Intelligence dbr:String_metric dbr:Andrew_Ng dbr:Angoss dbr:Anne_E._Carpenter dbr:Anonymity dbr:AnswerDash dbr:Ant_colony_optimization_algorithms dbr:Anthony_D._Romero dbr:Antifragile_(book) dbr:Antivirus_software dbr:Apache_Hadoop dbr:Applications_of_artificial_intelligence dbr:Archaeology dbr:Aristotle,_Inc. dbr:Battleground_Texas dbr:Legal_case_management dbr:Lift_(data_mining) dbr:Linet_Kwamboka dbr:M._J._Xavier dbr:Machine_learning dbr:Macroscope_(science_concept) dbr:Maltego dbr:Management_information_system dbr:Signal_processing dbr:Silicon_Valley_(season_6) dbr:Situation_awareness dbr:Sketch_Engine dbr:Statistics dbr:Storage_efficiency dbr:Studentized_range_distribution dbr:Click_path
is dbp:discipline of	dbr:International_Journal_of_Data_Warehousing_and_Mining dbr:BioData_Mining
is dbp:field of	dbr:Trevor_Hastie dbr:Jie_Tang
is dbp:fields of	dbr:David_Hand_(statistician) dbr:Suresh_Venkatasubramanian dbr:Alexander_Tuzhilin dbr:Ramanathan_V._Guha
is dbp:genre of	dbr:Tanagra_(machine_learning) dbr:ELKI dbr:Orange_(software) dbr:Neural_Designer
is dbp:industry of	dbr:SCL_Group
is dbp:knownFor of	dbr:Hui_Xiong dbr:Jonathan_Wren
is dbp:subDiscipline of	dbr:Amine_Bensaid
is dbp:type of	dbr:AggregateIQ
is rdfs:seeAlso of	dbr:Mass_surveillance_in_the_United_States
is foaf:primaryTopic of	wikipedia-en:Data_mining