Votre génome a été séquencé. Et maintenant ?

Vous avez payé entre 300 et 500 dollars pour le séquençage complet de votre génome. Peut-être Nebula, peut-être Dante, peut-être l’un des nouveaux fournisseurs qui se font concurrence à coup de baisses de prix. Vous avez reçu un dossier. Dans ce dossier : un fichier VCF avec 4,86 millions de lignes de données de variants et un tableau de bord qui vous montre peut-être 1 % de ce qu’il contient.

Le tableau de bord répond à leurs questions. Répartition ancestrale. Une poignée d’associations de traits. Peut-être un dépistage de porteur si vous avez de la chance. Mais vos questions — celles qui comptent vraiment pour vous — n’ont pas de bouton.

« Quels sont mes phénotypes métaboliseurs des enzymes CYP ? » Pas de bouton.

« Quelles variants ai-je hérités de mon père versus ma mère ? » Clairement pas de bouton.

« Que dit ClinVar sur cette variant que mon médecin a signalée la semaine dernière ? » Pas même en approche.

Cet article porte sur la façon de combler ce fossé. Je vais vous montrer pourquoi il existe, à quoi ça ressemble quand il n’est plus là, et comment le mettre en place vous-même — en local, sans téléverser votre génome nulle part.

Personnage pixel art fixant des données génomiques écrasantes sur un écran brillant dans un bureau cosy de nuit

Le problème du « Et maintenant ? »

Le marché du séquençage génomique grand public a une asymétrie étrange. Se faire séquencer est facile. Couverture trente fois pour moins de 500 dollars en 2026. La courbe des prix baisse depuis des années et continue de baisser.

Mais l’interprétation n’a pas suivi le rythme.

Vous recevez un fichier VCF avec des millions de lignes de variants. Chaque ligne est une position dans votre génome qui diffère de la référence. Certaines de ces différences comptent beaucoup. La plupart non. Et les plateformes grand public qui vous ont vendu le test ? Elles vous montrent une tranche soigneusement sélectionnée — des rapports préconçus avec des réponses préconçues.

C’est bien pour les questions qu’elles ont anticipées. C’est inutile pour celles qu’elles n’ont pas prévues.

Voici ce qui se perd dans le tableau de bord moyen du consommateur :

Les variations non-SNP. Variants structurels, variations du nombre de copies, ADN mitochondrial. La plupart des plateformes grand public les ignorent complètement ou les traitent comme secondaires.

Les requêtes familiales. Si vous avez aussi séquencé vos parents, vous avez un trio — trois génomes qui peuvent vous dire quels variants sont venus de qui. Zéro plateforme grand public propose l’analyse de trio.

La recherche flexible de preuves. Vous lisez un article de recherche mentionnant un variant. Vous voulez savoir si vous le portez, ce que dit ClinVar, quelle est la fréquence dans la population selon les groupes ancestraux. Le tableau de bord n’a pas de bouton « chercher un rsID arbitraire ».

La faillite de 23andMe en mars 2025 a rendu cela concret. Dans les 24 heures suivant le dépôt du Chapitre 11, le site a reçu 1,5 million de visites — un pic de 526 %. La page de suppression de données a reçu 376 000 visites le premier jour, 480 000 le deuxième. Les gens ont réalisé que leur jeu de données le plus personnel était sur le serveur de quelqu’un d’autre, et ils le voulaient récupérer.

La demande d’analyse locale n’est pas hypothétique. Elle se mesure en clics sur la page de suppression.

À quoi ça ressemble quand vous comblez le fossé

Le stack que j’utilise a trois composants :

GeneChat-MCP gère les requêtes VCF locales. Il lit vos fichiers de variants directement — rien ne quitte votre machine. Vous pouvez interroger des gènes spécifiques, scanner les variants pathogènes connues, comparer les schémas d’héritage entre membres de la famille.

OpenCRAVAT-MCP se connecte aux bases de données d’annotation dans le cloud, mais n’envoie que les rsIDs (les identifiants publics des variants connus, comme rs4988235 pour la persistance de la lactase). Votre génotype réel reste en local. Ce qui revient : fréquences dans les populations, prédictions fonctionnelles, données d’interaction protéique, annotations régulatrices — le contexte qui rend un variant significatif.

Pomera gère les notes de session. Quand vous travaillez sur des requêtes complexes, vous voulez un contexte persistant.

Les trois fonctionnent dans votre IDE via le Model Context Protocol. Antigravity, Codex, Claude Code — tout ce qui supporte MCP. Vous posez votre question en langage naturel. L’IDE route la requête vers le bon outil. Vous obtenez des réponses fondées sur vos fichiers réels.

Pas de téléversement. Pas de niveaux d’abonnement. Pas d’attente pour un rapport.

Personnage pixel art détendu dans un espace de travail IDE propre avec des résultats de requête génomique organisés et un compagnon robot flottant — Même bureau, autre histoire. Les données sont organisées, interrogeables et entièrement locales.

Quatre exemples tirés d’un génome réel

J’ai exécuté toutes ces requêtes sur des données réelles. Les rapports complets — avec les tableaux, les bases de données sources et les marqueurs de version — sont disponibles dans le répertoire d’exemples sur GitHub. Voici ce qu’ils ont trouvé.

Métabolisme des médicaments (Pharmacogénomique)

Requête : « Quels sont mes phénotypes métaboliseurs des enzymes CYP pour le métabolisme des médicaments ? »

Gène	Phénotype probable	Résultat clé
CYP2C19	Métaboliseur normal	Pas d’allèles 2, 3 ou *17
CYP2D6	Métaboliseur intermédiaire	Porteur hétérozygote de 4 (1/*4)
CYP2C9	Métaboliseur normal	Pas d’allèles 2 ou 3
CYP3A5	Non-expresseur (3/3)	Génotype européen courant

Le CYP2D6 est le plus important ici. Il métabolise environ 25 % de tous les médicaments prescrits — codéine, tramadol, tamoxifène, de nombreux antidépresseurs, plusieurs bêtabloquants. Un statut de métaboliseur intermédiaire signifie une activité enzymatique réduite. La codéine ne se convertira pas en morphine aussi efficacement. Certains antidépresseurs peuvent nécessiter des ajustements de dose.

Ce sont des données génotypiques factuelles, pas une ordonnance. Mais c’est exactement le type d’information qu’il vaut la peine de discuter avec un prescripteur avant qu’il rédige une ordonnance de tramadol.

Plus de cent étiquettes de médicaments de la FDA font référence à des biomarqueurs pharmacogénomiques. Votre prescripteur peut ne pas connaître votre statut métaboliseur. Vous pouvez lui apporter cette information.

→ Rapport complet : Profil pharmacogénomique

Boutique de potions RPG pixel art réimaginée en laboratoire de pharmacogénomique avec des icônes d'enzymes brillant en vert et ambre — Quatre enzymes, quatre résultats. Celle en ambre — CYP2D6 — traite un quart de tous les médicaments prescrits.

Ce que vous avez hérité de qui (Analyse de trio)

Requête : « Pour ces variants bien connus, de quel parent les ai-je hérités ? »

Trois fichiers VCF. Trois génomes. Logique de trio standard : si vous êtes hétérozygote et qu’un parent porte le variant tandis que l’autre non, vous savez de quel côté il vient.

Variant	Gène	Héritage
rs1801131	MTHFR (A1298C)	Paternel — le père est hét, la mère est type sauvage
rs17822931	ABCC11 (type de cérumen)	Maternel — la mère est hét, le père est type sauvage
rs4988235	MCM6 (lactase)	Les deux parents — un allèle de chaque
rs1050450	GPX1 (antioxydant)	Non hérité — la mère le porte, le sujet est type sauvage

Cette dernière ligne est celle que les gens n’attendent pas. Votre parent porte un variant. Vous ne l’avez pas hérité. C’est une question à laquelle seule l’analyse de trio peut répondre, et rien d’autre n’est disponible pour les consommateurs.

→ Rapport complet : Analyse d’héritage de trio

Famille pixel art de trois personnes autour d'une table avec des orbes génomiques brillants et des fils lumineux d'héritage les reliant — Trois génomes, trois orbes. Les fils de lumière tracent ce qui a été hérité — et ce qui ne l'a pas été.

Scan génomique ClinVar

Requête : « Scanne mon génome pour les variants pathogènes de ClinVar. »

ClinVar est la base de données du NIH pour les variants cliniquement pertinents — ceux liés à des maladies, des réponses aux médicaments ou d’autres phénotypes. Un scan complet contre 4,86 millions de variants a trouvé :

100 variants pathogènes dans 41 gènes
25 variants de réponse aux médicaments

Ça semble alarmant jusqu’à ce que vous creusiez. La plupart des entrées marquées « pathogènes » ont des classifications contradictoires. Un labo la qualifie de pathogène, un autre de bénigne, un troisième dit signification incertaine. La base de données capture ce désaccord, ce qui est en fait précieux — ça vous dit où la science n’est pas encore tranchée.

Une poignée de variants avaient des classifications pathogènes cohérentes parmi plusieurs soumissionnaires. Ceux-là méritent d’être revus avec un conseiller génétique. Le reste est du bruit, ou du moins du bruit jusqu’à ce que plus de preuves s’accumulent.

→ Rapport complet : Scan de variants ClinVar

Annotation profonde de variants (OpenCRAVAT)

Requête : « Donne-moi une annotation profonde de rs4988235. »

C’est là que la requête cloud avec rsID seul prouve sa valeur. Un seul appel — annotate_rsid("rs4988235") — a retourné plus de 150 champs d’annotation pour le variant de persistance de la lactase :

Score CADD : Prédiction d’impact fonctionnel
Fréquences dans les populations pour sept groupes ancestraux : 60,2 % chez les Européens, 0,3 % chez les Asiatiques de l’Est (ce variant a permis l’élevage laitier en Europe du Nord — sa distribution géographique raconte une histoire de 10 000 ans)
56 interacteurs protéiques : Le réseau moléculaire élargi
Données d’éléments régulateurs : Où ce variant se situe dans l’architecture de contrôle du génome

Obtenir tout cela nécessite normalement un pipeline bioinformatique — télécharger des bases de données, exécuter des outils d’annotation, analyser des formats de sortie. Ici, c’est un seul appel de fonction qui n’envoie que le rsID, pas votre génotype.

→ Rapport complet : Annotation profonde OpenCRAVAT

Deux rapports supplémentaires — associations de traits et scores de risque polygénique — sont disponibles dans le répertoire d’exemples GitHub.

Cloner, configurer, interroger

Ce dont vous avez besoin

Vos fichiers VCF de n’importe quel fournisseur de séquençage génomique complet
Un IDE agentique supportant MCP (Antigravity, Codex, Claude Code)
Python 3.10+ et conda (pour GeneChat-MCP)
Environ 2 Go d’espace disque pour les bases de données d’annotation (ClinVar, SnpEff, GWAS Catalog, modèles PGS)
Optionnel : un compte cloud OpenCRAVAT (niveau gratuit) pour l’annotation profonde

Architecture

Votre IDE (chat)
  Antigravity / Codex / Claude Code
       │                │
       ▼                ▼
  ┌──────────┐   ┌──────────────┐
  │ GeneChat │   │  OpenCRAVAT  │
  │   MCP    │   │     MCP      │
  │ (local)  │   │ (cloud API)  │
  └────┬─────┘   └──────┬───────┘
       │                │
       ▼                │ rsIDs uniquement
  ┌──────────┐          │ (aucune donnée génomique)
  │ Vos VCF  │          ▼
  │ fichiers │     CADD, REVEL,
  │ (local)  │     gnomAD, BioGRID
  └──────────┘

Installation

Je ne vais pas reproduire le README ici. Si vous savez configurer un serveur MCP dans votre IDE, vous pouvez suivre les instructions du dépôt.

Clonez-le : github.com/matbanik/agentic-genomics

L’installation comprend trois parties : GeneChat-MCP (requêtes VCF locales), OpenCRAVAT-MCP (annotation cloud), et la configuration MCP de votre IDE. Le README détaille chaque étape.

Deux pièges fréquents :

L’indexation VCF. Vos fichiers VCF doivent être indexés avec tabix avant la première requête. GeneChat attend des paires .vcf.gz + .vcf.gz.tbi. Si l’index manque, les requêtes échoueront silencieusement ou produiront des erreurs cryptiques. Le dépôt le documente, mais c’est le problème d’installation le plus courant.

Le format des contigs. Certains fournisseurs utilisent les préfixes chr1, chr2, chr3. D’autres utilisent simplement 1, 2, 3. Si votre VCF utilise un format et que les bases de données de référence attendent l’autre, les recherches de variants échoueront. Le dépôt gère la conversion, mais ça vaut le coup de savoir pourquoi une requête pourrait retourner « non trouvé » alors que vous savez que le variant est là.

Analyse de trio ? Même installation, plus de génomes. Enregistrez le fichier VCF de chaque membre de la famille et interrogez-les tous.

Ce que vous pouvez demander

Ce sont des prompts en langage naturel que vous pouvez taper directement dans votre IDE. L’agent route chaque requête vers le bon outil MCP automatiquement.

Quel est mon statut métaboliseur CYP2D6 ?

Scanne mon génome pour les variants pathogènes ClinVar

Quels variants ai-je hérités de ma mère ?

Calcule mon score de risque polygénique d'IMC

Donne-moi une annotation profonde de rs4988235

Quelles associations GWAS existent pour le métabolisme de la caféine ?

→ Les six rapports d’exemple sur GitHub

Le paysage

Vous n’êtes pas seul

Cet espace évolue rapidement. Quelques projets à connaître.

ClawBio est sorti du UK AI Agent Hackathon à Imperial College. C’est une CLI Python et une bibliothèque — pas un serveur MCP, donc l’architecture diffère, mais l’objectif se chevauche. Ils ont construit deux outils que je n’ai pas vus ailleurs : gwas-lookup fédère les requêtes sur neuf bases de données GWAS simultanément, et clinpgx extrait des guidelines PharmGKB, CPIC et des annotations d’étiquettes FDA en un seul appel. Travail complémentaire, paradigme d’interface différent.

Les signaux académiques émergent aussi. Un article dans Briefings in Bioinformatics a formalisé le framework MCPmed pour les agents médicaux IA. L’EMBL a BioContextAI en développement. cBioPortal — la base de données de génomique du cancer — a maintenant une interface MCP. IBM Research a présenté des travaux connexes à l’ISMB.

Côté open source : Bio-MCP fournit un accès général aux outils bioinformatiques, gget-mcp encapsule la bibliothèque gget pour les requêtes gènes/protéines, et IGV-MCP se connecte à l’Integrative Genomics Viewer pour la visualisation.

Le schéma est clair. Les données génomiques deviennent interrogeables via des interfaces conversationnelles. La question est de savoir si cela se passe sur votre machine ou celle de quelqu’un d’autre.

Ce que ce n’est pas

Je veux être direct sur les limites.

Ceci ne diagnostique pas de maladie. Un marqueur « pathogène » de ClinVar n’est pas un diagnostic — c’est une entrée de base de données reflétant des preuves soumises, souvent avec des interprétations contradictoires.

Ceci ne recommande pas de traitements. Un statut de métaboliseur intermédiaire CYP2D6 est un fait génotypique. Que faire avec relève d’une décision clinique qui dépend de votre contexte médical complet, de vos autres médicaments et du jugement de votre prescripteur.

Ceci ne fournit pas de conseils nutritionnels. Votre statut MTHFR ne vous dit pas quels compléments prendre.

Les appels d’allèles étoiles — CYP2D6 *1/*4, CYP2C19 *1/*1 — sont des données génotypiques factuelles. Ils décrivent quels variants vous portez. Traduire cela en action nécessite un humain avec une formation clinique et votre tableau complet.

Si vous trouvez quelque chose de préoccupant, discutez-en avec un conseiller génétique ou votre prescripteur. Ce n’est pas une clause de prudence ; c’est comme ça que ça marche.

Les bases de données sources sont nommées et versionnées dans chaque résultat de requête : PharmVar pour les définitions d’allèles étoiles, CPIC pour les correspondances génotype-phénotype, ClinVar pour les classifications cliniques des variants, gnomAD pour les fréquences dans les populations.

Conclusion

Votre génome est le jeu de données le plus personnel que vous posséderez jamais. En ce moment, la majeure partie est dans un dossier que vous n’avez jamais ouvert — ou sur un serveur que vous ne contrôlez pas.

Les outils pour changer cela sont gratuits, ouverts et fonctionnent sur votre machine.

Personnage pixel art debout au sommet d'une colline au coucher du soleil tenant un éclat de génome brillant, avec un compagnon robot, tournant le dos à une forteresse cloud lointaine — Vos données. Votre machine. Vos questions.

Si vous bloquez pendant l’installation, ouvrez une issue sur GitHub. C’est fait pour ça.

Ressources

⚠️ Avertissement : Ceci est un rapport de génotype factuel, pas un avis médical. Discutez des résultats exploitables avec votre prescripteur ou conseiller génétique. Bases de données sources : PharmVar, CPIC, ClinVar, gnomAD — versions indiquées par requête.