Variant Call Format
De Wikipedia, l'encyclopédie encyclopedia
Modèle:Variant Call Format[Quoi ?]
La mise en forme de cet article est à améliorer ().
La mise en forme du texte ne suit pas les recommandations de Wikipédia : il faut le « wikifier ».
Le Variant Call Format (abrégé par VCF) est le format d'un fichier texte utilisé en bioinformatique pour stocker les variations de séquences génétiques. Le format VCF a été développé avec l'avènement des projets de génotypage et de séquençage de l'ADN à grande échelle, tels que le 1000 Genomes Project.
Les formats préexistants pour stocker les séquences génétiques, tels que le format général des caractéristiques (GFF), conservaient des données redondantes car partagées entre les génomes. Le format VCF permet de ne stocker que la différence ou l'absence de différence par rapport à un génome de référence.
La norme est actuellement la version 4.3[1],[2], et le format n'est aujourd'hui plus utilisé par le 1000 Genomes Project. Il existe également un format étendu Genomic VCF (gVCF), qui comprend des informations supplémentaires sur les « blocs » qui correspondent à la référence et à leurs qualités[3]. Un ensemble d'outils est également disponible pour l'édition et la manipulation des fichiers[4],[5].