Variant Call Format (original) (raw)

About DBpedia

Il Variant Call Format (VCF) è un formato di file testuale di tipo tab-separated usato in bioinformatica per raccogliere le varianti genomiche ed attualmente è alla versione 4.3. Il formato permette di descrivere in formato tabulare le varianti genomiche più comuni di un genoma, insieme alla possibilità di inserire annotazioni e metadati. È stato sviluppata a partire dal progetto 1000 Genome ed è stato adottato da diversi progetti tra cui UK10K, dbSNP e NHLBI Exome Project. Sono anche stati sviluppati diversi strumenti e librerie software per poter manipolare il formato.

thumbnail

Property Value
dbo:abstract El Variant Call Format (VCF) és un format de fitxer de text que s'utilitza en bioinformàtica per a emmagatzemar informació sobre les variacions en la seqüència dels gens. El format s'ha dissenyat sota l'aixopluc de grans projectes de seqüenciació de l'ADN i genotipatge, com ara el . Es va veure la necessitat d'un nou format, perquè altres formats ja existents per emmagatzemar dades genètiques, com ara el General Feature Format, en utilitzar-se per a diferents genomes inclourien masses dades redundants. Amb el VCF només es desarien les diferents variacions respecte a un genoma de referència. A part, el Projecte 1000 Genomes ha desenvolupat les seves pròpies especificacions per a variacions estructurals, com ara duplicats, difícils d'acomodar en l'esquema existent. També existeixen un grup d'eines per editar i manipular els fitxers VCF. (ca) El Variant Call Format (VCF, formato de llamado de variantes) es un formato de texto que se usa en Bioinformática para almacenar variantes de una o varias secuencias de genes respecto a un genoma de referencia. Este formato se ha desarrollado a la luz de los grandes proyectos de secuenciación del ADN y genotipado, como el Proyecto 1000 Genomas. Otros formatos para almacenar datos genéticos como el , almacena todos los datos genéticos pero muchos de ellos son redundantes, al compartirse a lo largo de los genomas. En cambio, en el formato VCF sólo se almacenan las variantes genéticas respecto al . La versión actual es la 4.3,​​ aunque el Proyecto 1000 Genomas ha desarrollado sus propias especificaciones para variación estructural como duplicaciones y rearreglos genómicos, que son difíciles de acomodar en el esquema existente.​ También existen un grupo de herramientas para editar y manipular los ficheros VCF.​ (es) Das Variant Call Format (VCF) ist ein wichtiges Text-Format in der Bioinformatik zur Speicherung von Gensequenz-Variationen. Das Format wurde mit dem Aufkommen von groß angelegten Genotypisierungs- und DNA-Sequenzierungs-Projekten, wie dem 1000-Genome-Projekt, entwickelt. Andere Formate für genetische Daten wie das speicherten alle genetischen Daten, von denen viele redundant sind, da sie über die Genome hinweg gemeinsam genutzt werden. Bei Verwendung des Variant-Call-Formats müssen nur die Variationen zusammen mit einem Referenzgenom gespeichert werden. Die neuste Version des Standards ist derzeit 4.3. Version 4.4 ist aktuell in Entwicklung. Es gibt auch ein Genomic VCF (gVCF) erweitertes Format, das zusätzliche Informationen über "Blöcke", die mit der Referenz übereinstimmen, und deren Qualitäten enthält. Für die Bearbeitung und Manipulation der Dateien steht eine Reihe von Tools zur Verfügung. (de) [Quoi ?] Le Variant Call Format ( VCF ) spécifie le format d'un fichier texte utilisé en bioinformatique pour stocker les variations de séquences génétiques. Le format a été développé avec l'avènement des projets de génotypage et de séquençage de l'ADN à grande échelle, tels que le projet 1000 génomes . Les formats existants pour les données génétiques, tels que le format général des caractéristiques (GFF), stockaient toutes les données génétiques, dont la plupart sont redondantes car elles seront partagées entre les génomes. En utilisant le format d'appel de variante, seules les variantes doivent être stockées avec un génome de référence. La norme est actuellement en version 4.3, bien que le 1000 Genomes Project ait développé sa propre spécification pour les variations structurelles telles que les duplications, qui ne s'intègrent pas facilement dans le schéma existant. Il existe également un format étendu Genomic VCF ( gVCF ), qui comprend des informations supplémentaires sur les « blocs » qui correspondent à la référence et à leurs qualités. Un ensemble d'outils est également disponible pour l'édition et la manipulation des fichiers. (fr) The Variant Call Format (VCF) specifies the format of a text file used in bioinformatics for storing gene sequence variations. The format has been developed with the advent of large-scale genotyping and DNA sequencing projects, such as the 1000 Genomes Project. Existing formats for genetic data such as General feature format (GFF) stored all of the genetic data, much of which is redundant because it will be shared across the genomes. By using the variant call format only the variations need to be stored along with a reference genome. The standard is currently in version 4.3, although the 1000 Genomes Project has developed its own specification for structural variations such as duplications, which are not easily accommodated into the existing schema. There is also a genomic VCF (gVCF) extended format, which includes additional information about "blocks" that match the reference and their qualities. A set of tools is also available for editing and manipulating the files. (en) Il Variant Call Format (VCF) è un formato di file testuale di tipo tab-separated usato in bioinformatica per raccogliere le varianti genomiche ed attualmente è alla versione 4.3. Il formato permette di descrivere in formato tabulare le varianti genomiche più comuni di un genoma, insieme alla possibilità di inserire annotazioni e metadati. È stato sviluppata a partire dal progetto 1000 Genome ed è stato adottato da diversi progetti tra cui UK10K, dbSNP e NHLBI Exome Project. Sono anche stati sviluppati diversi strumenti e librerie software per poter manipolare il formato. (it)
dbo:thumbnail wiki-commons:Special:FilePath/Binary_BCF_versus_VCF_format.png?width=300
dbo:wikiPageExternalLink https://samtools.github.io/hts-specs/ https://vcftools.github.io/index.html http://vcftools.sourceforge.net/VCF-poster.pdf https://spectrum.ieee.org/biomedical/diagnostics/the-race-to-build-a-search-engine-for-your-dna%7Ctitle
dbo:wikiPageID 30712001 (xsd:integer)
dbo:wikiPageLength 10657 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID 1111129960 (xsd:integer)
dbo:wikiPageWikiLink dbr:DbSNP dbr:Indel dbr:1000_Genomes_Project dbr:Genotyping dbr:General_feature_format dbr:Alleles dbr:DNA_sequencing dbr:FASTA_format dbr:Global_Alliance_for_Genomics_and_Health_(GA4GH) dbr:Bioinformatics dbr:Tab-separated_values dbc:Biological_sequence_format dbr:Human_genetic_variation dbr:Human_genome dbr:Metadata dbr:SAM_(file_format) dbr:Single-nucleotide_polymorphism dbr:FASTQ_format dbr:IEEE_Spectrum dbr:GFF3 dbr:Gene_sequence dbr:File:Binary_BCF_versus_VCF_format.png dbr:GVF_format
dbp:developer https://vcftools.github.io/index.html
dbp:extendedFrom dbr:Tab-separated_values
dbp:extension vcf (en)
dbp:genre Genomic sequence format (en)
dbp:latestReleaseDate 2021-01-13 (xsd:date)
dbp:latestReleaseVersion 4.300000 (xsd:double)
dbp:name Variant Call Format (en)
dbp:open Yes (en)
dbp:url https://samtools.github.io/hts-specs/
dbp:wikiPageUsesTemplate dbt:Cite_news dbt:Infobox_file_format dbt:Mono dbt:Reflist dbt:Short_description dbt:Start_date_and_age dbt:Bioinformatics
dcterms:subject dbc:Biological_sequence_format
rdf:type yago:WikicatComputerFileFormats yago:Abstraction100002137 yago:Communication100033020 yago:Format106636806 yago:Information106634376 yago:Message106598915
rdfs:comment Il Variant Call Format (VCF) è un formato di file testuale di tipo tab-separated usato in bioinformatica per raccogliere le varianti genomiche ed attualmente è alla versione 4.3. Il formato permette di descrivere in formato tabulare le varianti genomiche più comuni di un genoma, insieme alla possibilità di inserire annotazioni e metadati. È stato sviluppata a partire dal progetto 1000 Genome ed è stato adottato da diversi progetti tra cui UK10K, dbSNP e NHLBI Exome Project. Sono anche stati sviluppati diversi strumenti e librerie software per poter manipolare il formato. (it) El Variant Call Format (VCF) és un format de fitxer de text que s'utilitza en bioinformàtica per a emmagatzemar informació sobre les variacions en la seqüència dels gens. El format s'ha dissenyat sota l'aixopluc de grans projectes de seqüenciació de l'ADN i genotipatge, com ara el . Es va veure la necessitat d'un nou format, perquè altres formats ja existents per emmagatzemar dades genètiques, com ara el General Feature Format, en utilitzar-se per a diferents genomes inclourien masses dades redundants. Amb el VCF només es desarien les diferents variacions respecte a un genoma de referència. (ca) Das Variant Call Format (VCF) ist ein wichtiges Text-Format in der Bioinformatik zur Speicherung von Gensequenz-Variationen. Das Format wurde mit dem Aufkommen von groß angelegten Genotypisierungs- und DNA-Sequenzierungs-Projekten, wie dem 1000-Genome-Projekt, entwickelt. Andere Formate für genetische Daten wie das speicherten alle genetischen Daten, von denen viele redundant sind, da sie über die Genome hinweg gemeinsam genutzt werden. Bei Verwendung des Variant-Call-Formats müssen nur die Variationen zusammen mit einem Referenzgenom gespeichert werden. (de) [Quoi ?] Le Variant Call Format ( VCF ) spécifie le format d'un fichier texte utilisé en bioinformatique pour stocker les variations de séquences génétiques. Le format a été développé avec l'avènement des projets de génotypage et de séquençage de l'ADN à grande échelle, tels que le projet 1000 génomes . Les formats existants pour les données génétiques, tels que le format général des caractéristiques (GFF), stockaient toutes les données génétiques, dont la plupart sont redondantes car elles seront partagées entre les génomes. En utilisant le format d'appel de variante, seules les variantes doivent être stockées avec un génome de référence. (fr) El Variant Call Format (VCF, formato de llamado de variantes) es un formato de texto que se usa en Bioinformática para almacenar variantes de una o varias secuencias de genes respecto a un genoma de referencia. Este formato se ha desarrollado a la luz de los grandes proyectos de secuenciación del ADN y genotipado, como el Proyecto 1000 Genomas. Otros formatos para almacenar datos genéticos como el , almacena todos los datos genéticos pero muchos de ellos son redundantes, al compartirse a lo largo de los genomas. En cambio, en el formato VCF sólo se almacenan las variantes genéticas respecto al . (es) The Variant Call Format (VCF) specifies the format of a text file used in bioinformatics for storing gene sequence variations. The format has been developed with the advent of large-scale genotyping and DNA sequencing projects, such as the 1000 Genomes Project. Existing formats for genetic data such as General feature format (GFF) stored all of the genetic data, much of which is redundant because it will be shared across the genomes. By using the variant call format only the variations need to be stored along with a reference genome. (en)
rdfs:label Variant Call Format (ca) Variant Call Format (de) Formato Variant Call (es) Variant Call Format (fr) Variant Call Format (it) Variant Call Format (en)
owl:sameAs freebase:Variant Call Format yago-res:Variant Call Format wikidata:Variant Call Format dbpedia-ca:Variant Call Format dbpedia-de:Variant Call Format dbpedia-es:Variant Call Format dbpedia-fr:Variant Call Format dbpedia-he:Variant Call Format dbpedia-it:Variant Call Format https://global.dbpedia.org/id/4xcjD
prov:wasDerivedFrom wikipedia-en:Variant_Call_Format?oldid=1111129960&ns=0
foaf:depiction wiki-commons:Special:FilePath/Binary_BCF_versus_VCF_format.png
foaf:isPrimaryTopicOf wikipedia-en:Variant_Call_Format
is dbo:wikiPageDisambiguates of dbr:VCF
is dbo:wikiPageWikiLink of dbr:PrecisionFDA dbr:List_of_alignment_visualization_software dbr:List_of_file_formats dbr:Mega2,_the_Manipulation_Environment_for_Genetic_Analysis dbr:GeneTalk dbr:General_feature_format dbr:Pileup_format dbr:SNV_calling_from_NGS_data dbr:PLINK_(genetic_tool-set) dbr:Jalview dbr:SnpEff dbr:ANNOVAR dbr:VCF
is foaf:primaryTopic of wikipedia-en:Variant_Call_Format