List of datasets for machine-learning research (original) (raw)

About DBpedia

These datasets are applied for machine learning research and have been cited in peer-reviewed academic journals. Datasets are an integral part of the field of machine learning. Major advances in this field can result from advances in learning algorithms (such as deep learning), computer hardware, and, less-intuitively, the availability of high-quality training datasets. High-quality labeled training datasets for supervised and semi-supervised machine learning algorithms are usually difficult and expensive to produce because of the large amount of time needed to label the data. Although they do not need to be labeled, high-quality datasets for unsupervised learning can also be difficult and costly to produce.

thumbnail

Property Value
dbo:abstract These datasets are applied for machine learning research and have been cited in peer-reviewed academic journals. Datasets are an integral part of the field of machine learning. Major advances in this field can result from advances in learning algorithms (such as deep learning), computer hardware, and, less-intuitively, the availability of high-quality training datasets. High-quality labeled training datasets for supervised and semi-supervised machine learning algorithms are usually difficult and expensive to produce because of the large amount of time needed to label the data. Although they do not need to be labeled, high-quality datasets for unsupervised learning can also be difficult and costly to produce. (en) Набори даних використовуються для дослідження машинного навчання, посилання на них використовуються в наукових академічних статтях. Набори даних є невід’ємною частиною галузі машинного навчання. Значні досягнення в цій галузі можуть бути результатом прогресу в алгоритмах навчання (наприклад, deep learning), комп'ютерного обладнання та, що не так очевидно, доступності високоякісних наборів навчальних даних. Високоякісні марковані навчальні набори даних для алгоритмів машинного навчання з учителем і напівавтоматичне навчання зазвичай важко та дорого створити через велику кількість часу, необхідного для позначення даних. Хоча їх не потрібно позначати, високоякісні набори даних для напівавтоматичного навчання також може бути складним і дорогим у створенні. Набори даних орієнтовані, здебільшого, на вирішення задач класифікації та розпізнавання і містять оцифровані зображення, відео, тексти, сигнали, звуки тощо. (uk)
dbo:thumbnail wiki-commons:Special:FilePath/images_(.png?width=300
dbo:wikiPageExternalLink https://hadyelsahar.github.io/t-rex/ https://metatext.io/datasets https://www.atticusprojectai.org/cuad
dbo:wikiPageID 49082762 (xsd:integer)
dbo:wikiPageLength 268267 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1121163548 (xsd:integer)
dbo:wikiPageWikiLink dbr:Carnegie_Mellon_University dbr:Royal_Military_Academy_(Belgium) dbr:San_Francisco_Bay_Area dbr:List_of_biological_databases dbr:N-gram dbr:Natural_language_processing dbr:Time_series dbr:Binghamton_University dbr:Demosponge dbr:Algorithm dbr:Anomaly_detection dbc:Datasets_in_machine_learning dbr:Johns_Hopkins_University dbr:Reuters dbr:United_States_Census_Bureau dbr:United_States_Department_of_Defense dbr:United_States_Department_of_Health_and_Human_Services dbr:University_of_California,_Berkeley dbr:University_of_Mainz dbr:University_of_Massachusetts dbr:University_of_York dbr:Urban_Dictionary dbr:Deep_learning dbr:Mauna_Loa_Observatory dbr:List_of_manual_image_annotation_tools dbc:Artificial_intelligence dbr:Comma-separated_values dbr:Common_Voice dbr:Crowdsourcing dbr:Social_network_analysis dbr:Enron dbr:Freebase_(database) dbr:GB_2312 dbr:Getty_Center dbr:Modern_Standard_Arabic dbr:Mozilla dbr:NASA dbr:Creative_Commons_license dbr:Appen_(company) dbr:Arabic_Speech_Corpus dbr:MATLAB dbr:MIT_Computer_Science_and_Artificial_Intelligence_Laboratory dbr:MNIST_database dbr:Machine_learning dbr:Caltech_101 dbr:Signal_processing dbr:Cluster_analysis dbr:Comparison_of_deep_learning_software dbr:Computer_vision dbr:Email_spam dbr:Attribute-Relation_File_Format dbr:Pacific_Marine_Environmental_Laboratory dbr:Peer_review dbr:Speech_synthesis dbr:Multi-label_classification dbr:Australian_Broadcasting_Corporation dbc:Machine_learning dbr:TripAdvisor dbr:Data_set dbr:WAV dbr:Wikidata dbr:Wikipedia dbr:Galit_Shmueli dbr:Current_population_survey_(US) dbr:Iris_flower_data_set dbr:LamaH dbr:Amazon.com dbr:American_Association_for_the_Advancement_of_Science dbr:Daimler_AG dbr:Examiner.com dbr:Facial_recognition_system dbr:Federal_Court_of_Australia dbr:British_Oceanographic_Data_Centre dbr:Handwriting_recognition dbr:Lemmatisation dbr:Web_feed dbr:Regression_analysis dbr:Speech_recognition dbr:International_Monetary_Fund dbr:The_Irish_Times dbr:Object_detection dbr:Chinese_characters dbr:Alex_Krizhevsky dbr:King_Juan_Carlos_University dbr:Witty_(computer_worm) dbr:TIMIT dbr:Relation_network dbr:Unified_Parkinson's_disease_rating_scale dbr:DigitalGlobe dbr:Dominique_Strauss-Kahn dbr:Audiobook dbr:Automatic_summarization dbr:CIFAR-10 dbr:Pontifical_Catholic_University_of_Rio_de_Janeiro dbr:Free_Music_Archive dbr:GroupLens_Research dbr:Edmunds.com dbr:Microsoft_Research dbr:National_Institute_of_Standards_and_Technology dbr:New_York_City_Taxi_and_Limousine_Commission dbr:One-shot_learning_(software) dbr:Yahoo! dbr:Mel-frequency_cepstrum dbr:Semi-supervised_learning dbr:Sentiment_analysis dbr:Statistical_classification dbr:FERET_(facial_recognition_technology) dbr:Face_Recognition_Grand_Challenge dbr:Face_detection dbr:IEEE_Signal_Processing_Society dbr:IPUMS dbr:ImageNet dbr:Kannada_alphabet dbr:Unsupervised_learning dbr:Overhead_Imagery_Research_Data_Set dbr:Institute_of_Automation,_Chinese_Academy_of_Sciences dbr:Supervised_learning dbr:Queen_Mary_University dbr:ImageNet_Large_Scale_Visual_Recognition_Challenge dbr:CAMELS
dbp:wikiPageUsesTemplate dbt:Anchor dbt:Reflist dbt:Short_description dbt:Use_dmy_dates dbt:Machine_learning_bar dbt:Differentiable_computing
dcterms:subject dbc:Datasets_in_machine_learning dbc:Artificial_intelligence dbc:Machine_learning
rdfs:comment These datasets are applied for machine learning research and have been cited in peer-reviewed academic journals. Datasets are an integral part of the field of machine learning. Major advances in this field can result from advances in learning algorithms (such as deep learning), computer hardware, and, less-intuitively, the availability of high-quality training datasets. High-quality labeled training datasets for supervised and semi-supervised machine learning algorithms are usually difficult and expensive to produce because of the large amount of time needed to label the data. Although they do not need to be labeled, high-quality datasets for unsupervised learning can also be difficult and costly to produce. (en) Набори даних використовуються для дослідження машинного навчання, посилання на них використовуються в наукових академічних статтях. Набори даних є невід’ємною частиною галузі машинного навчання. Значні досягнення в цій галузі можуть бути результатом прогресу в алгоритмах навчання (наприклад, deep learning), комп'ютерного обладнання та, що не так очевидно, доступності високоякісних наборів навчальних даних. Високоякісні марковані навчальні набори даних для алгоритмів машинного навчання з учителем і напівавтоматичне навчання зазвичай важко та дорого створити через велику кількість часу, необхідного для позначення даних. Хоча їх не потрібно позначати, високоякісні набори даних для напівавтоматичного навчання також може бути складним і дорогим у створенні. Набори даних орієнтовані, здебільшого (uk)
rdfs:label List of datasets for machine-learning research (en) Список наборів даних для досліджень з машинного навчання (uk)
owl:sameAs wikidata:List of datasets for machine-learning research dbpedia-uk:List of datasets for machine-learning research https://global.dbpedia.org/id/2AyFV
prov:wasDerivedFrom wikipedia-en:List_of_datasets_for_machine-learning_research?oldid=1121163548&ns=0
foaf:depiction wiki-commons:Special:FilePath/images_(.png
foaf:isPrimaryTopicOf wikipedia-en:List_of_datasets_for_machine-learning_research
is dbo:wikiPageRedirects of dbr:COCO_(dataset) dbr:General_Language_Understanding_Evaluation dbr:Comparison_of_datasets_in_machine_learning dbr:Comparison_of_facial_image_datasets dbr:List_of_datasets_for_machine_learning_research dbr:Machine_learning_datasets dbr:KITTI dbr:AudioSet
is dbo:wikiPageWikiLink of dbr:Deep_learning dbr:Institute_of_Automation dbr:Comparison_of_deep_learning_software dbr:COCO_(dataset) dbr:General_Language_Understanding_Evaluation dbr:Explicit_semantic_analysis dbr:Comparison_of_datasets_in_machine_learning dbr:Comparison_of_facial_image_datasets dbr:List_of_datasets_for_machine_learning_research dbr:Machine_learning_datasets dbr:KITTI dbr:AudioSet
is foaf:primaryTopic of wikipedia-en:List_of_datasets_for_machine-learning_research