Te secuenciaron el genoma completo. ¿Y ahora qué?

Pagaste entre 300 y 500 dólares por la secuenciación completa de tu genoma. Tal vez Nebula, tal vez Dante, tal vez alguno de los nuevos proveedores que compiten bajando precios. Recibiste una carpeta. Dentro de esa carpeta: un archivo VCF con 4,86 millones de filas de datos de variantes y un panel de control que te muestra quizá el 1% de lo que hay ahí.

El panel responde a sus preguntas. Desglose de ancestros. Un puñado de asociaciones de rasgos. Tal vez un cribado de portador con suerte. Pero tus preguntas — las que realmente te importan — no tienen botón.

“¿Cuáles son mis fenotipos metabolizadores de enzimas CYP?” Sin botón.

“¿Qué variantes heredé de mi padre y cuáles de mi madre?” Definitivamente sin botón.

“¿Qué dice ClinVar sobre esa variante que mi médico señaló la semana pasada?” Ni de cerca.

Este artículo trata sobre cerrar esa brecha. Te mostraré por qué existe, cómo se ve cuando desaparece, y cómo configurarlo tú mismo — en local, sin subir tu genoma a ningún lado.

Personaje pixel art mirando datos genómicos abrumadores en un monitor brillante en una acogedora oficina casera de noche

El problema del “¿Y ahora qué?”

El mercado de secuenciación genómica para consumidores tiene una asimetría extraña. Secuenciarte es fácil. Cobertura de treinta veces por menos de 500 dólares en 2026. La curva de precios lleva años bajando y sigue cayendo.

Pero la interpretación no ha seguido el ritmo.

Recibes un archivo VCF con millones de filas de variantes. Cada fila es una posición en tu genoma que difiere de la referencia. Algunas de esas diferencias importan mucho. La mayoría no. ¿Y las plataformas de consumo que te vendieron el test? Te muestran una rebanada curada — informes prediseñados con respuestas prediseñadas.

Eso está bien para las preguntas que anticiparon. Es inútil para las que no.

Esto es lo que se pierde en el panel de control promedio del consumidor:

Variación no-SNP. Variantes estructurales, variaciones en el número de copias, ADN mitocondrial. La mayoría de las plataformas de consumo las omiten por completo o las tratan como secundarias.

Consultas con contexto familiar. Si también secuenciaste a tus padres, tienes un trío — tres genomas que pueden decirte qué variantes vinieron de quién. Cero plataformas de consumo ofrecen análisis de trío.

Búsqueda flexible de evidencia. Lees sobre una variante en un artículo de investigación. Quieres saber si la portas, qué dice ClinVar, cuál es la frecuencia poblacional en diferentes grupos ancestrales. El panel no tiene un botón de “buscar un rsID arbitrario”.

La bancarrota de 23andMe en marzo de 2025 lo hizo concreto. En las 24 horas posteriores a la solicitud del Capítulo 11, el sitio recibió 1,5 millones de visitas — un aumento del 526%. La página de eliminación de datos recibió 376.000 visitas el primer día, 480.000 el segundo. La gente se dio cuenta de que su conjunto de datos más personal estaba en el servidor de otra persona, y lo querían de vuelta.

La demanda de análisis local no es hipotética. Se mide en clics en la página de eliminación.

Cómo se ve cuando cierras la brecha

El stack que he estado usando tiene tres componentes:

GeneChat-MCP maneja las consultas locales de VCF. Lee tus archivos de variantes directamente — nada sale de tu máquina. Puedes preguntar sobre genes específicos, escanear variantes patogénicas conocidas, comparar patrones de herencia entre miembros de la familia.

OpenCRAVAT-MCP se conecta a bases de datos de anotación en la nube, pero solo envía rsIDs (los identificadores públicos de variantes conocidas, como rs4988235 para la persistencia de lactasa). Tu genotipo real se queda en local. Lo que vuelve: frecuencias poblacionales, predicciones funcionales, datos de interacción de proteínas, anotaciones reguladoras — el contexto que hace que una variante sea significativa.

Pomera maneja las notas de sesión. Cuando trabajas con consultas complejas, quieres contexto persistente.

Los tres funcionan dentro de tu IDE a través del Model Context Protocol. Antigravity, Codex, Claude Code — cualquier cosa que soporte MCP. Preguntas en lenguaje natural. El IDE enruta la consulta a la herramienta correcta. Obtienes respuestas fundamentadas de tus archivos reales.

Sin subidas. Sin niveles de suscripción. Sin esperar un informe.

Personaje pixel art relajado en un espacio de trabajo IDE limpio con resultados de consulta genómica organizados y un compañero robot flotante — Mismo escritorio, otra historia. Los datos están organizados, consultables y completamente en local.

Cuatro ejemplos de un genoma real

He ejecutado todas estas consultas con datos reales. Los informes completos — con tablas, bases de datos fuente y marcas de versión — están disponibles en el directorio de ejemplos en GitHub. Esto es lo que encontraron.

Metabolismo de fármacos (Farmacogenómica)

Consulta: “¿Cuáles son mis fenotipos metabolizadores de enzimas CYP para el metabolismo de fármacos?”

Gen	Fenotipo probable	Hallazgo clave
CYP2C19	Metabolizador normal	Sin alelos 2, 3 ni *17
CYP2D6	Metabolizador intermedio	Portador heterocigoto de 4 (1/*4)
CYP2C9	Metabolizador normal	Sin alelos 2 ni 3
CYP3A5	No expresor (3/3)	Genotipo europeo común

CYP2D6 es el más importante aquí. Metaboliza aproximadamente el 25% de todos los medicamentos recetados — codeína, tramadol, tamoxifeno, muchos antidepresivos, varios betabloqueantes. Un estatus de metabolizador intermedio significa actividad enzimática reducida. La codeína no se convertirá en morfina tan eficientemente. Algunos antidepresivos pueden necesitar ajustes de dosis.

Estos son datos genotipos factuales, no una receta. Pero es exactamente el tipo de información que vale la pena discutir con un prescriptor antes de que escriba una receta de tramadol.

Más de cien etiquetas de medicamentos de la FDA hacen referencia a biomarcadores farmacogenómicos. Tu prescriptor puede no conocer tu estatus metabolizador. Puedes llevarle esta información.

→ Informe completo: Perfil farmacogenómico

Tienda de pociones RPG pixel art reimaginada como laboratorio de farmacogenómica con iconos de enzimas brillando en verde y ámbar — Cuatro enzimas, cuatro resultados. La ámbar — CYP2D6 — procesa un cuarto de todos los medicamentos recetados.

Qué heredaste de quién (Análisis de trío)

Consulta: “Para estas variantes conocidas, ¿de qué progenitor las heredé?”

Tres archivos VCF. Tres genomas. Lógica de trío estándar: si eres heterocigoto y un progenitor porta la variante mientras el otro no, sabes de qué lado vino.

Variante	Gen	Herencia
rs1801131	MTHFR (A1298C)	Paterna — el padre es het, la madre es tipo silvestre
rs17822931	ABCC11 (tipo de cerumen)	Materna — la madre es het, el padre es tipo silvestre
rs4988235	MCM6 (lactasa)	Ambos progenitores — un alelo de cada uno
rs1050450	GPX1 (antioxidante)	No heredada — la madre la porta, el sujeto es tipo silvestre

Esa última fila es la que la gente no espera. Tu progenitor porta una variante. Tú no la heredaste. Es una pregunta que puedes responder con análisis de trío y literalmente nada más disponible para consumidores.

→ Informe completo: Análisis de herencia de trío

Familia pixel art de tres alrededor de una mesa con orbes genómicos brillantes e hilos luminosos de herencia conectándolos — Tres genomas, tres orbes. Los hilos de luz trazan lo que se heredó — y lo que no.

Escaneo genómico ClinVar

Consulta: “Escanea mi genoma en busca de variantes patogénicas de ClinVar.”

ClinVar es la base de datos del NIH de variantes clínicamente relevantes — las vinculadas a enfermedades, respuestas a fármacos u otros fenotipos. Un escaneo completo contra 4,86 millones de variantes encontró:

100 variantes patogénicas en 41 genes
25 variantes de respuesta a fármacos

Eso suena alarmante hasta que profundizas. La mayoría de las entradas marcadas como “patogénicas” tienen clasificaciones contradictorias. Un laboratorio la llama patogénica, otro la llama benigna, un tercero dice significado incierto. La base de datos captura este desacuerdo, lo cual en realidad es valioso — te dice dónde la ciencia aún no está resuelta.

Un puñado de variantes tenían clasificaciones patogénicas consistentes entre múltiples presentadores. Esas vale la pena revisarlas con un consejero genético. El resto es ruido, o al menos ruido hasta que se acumule más evidencia.

→ Informe completo: Escaneo de variantes ClinVar

Anotación profunda de variantes (OpenCRAVAT)

Consulta: “Dame una anotación profunda de rs4988235.”

Aquí es donde la consulta en la nube solo con rsID demuestra su valor. Una sola llamada — annotate_rsid("rs4988235") — devolvió más de 150 campos de anotación para la variante de persistencia de lactasa:

Puntuación CADD: Predicción de impacto funcional
Frecuencias poblacionales en siete grupos ancestrales: 60,2% en europeos, 0,3% en asiáticos orientales (esta variante permitió la ganadería lechera en el norte de Europa — su distribución geográfica cuenta una historia de 10.000 años)
56 interactores de proteínas: La red molecular más amplia
Datos de elementos reguladores: Dónde se sitúa esta variante en la arquitectura de control del genoma

Obtener esto normalmente requiere un pipeline bioinformático — descargar bases de datos, ejecutar herramientas de anotación, parsear formatos de salida. Aquí es una sola llamada de función que envía solo el rsID, no tu genotipo.

→ Informe completo: Anotación profunda OpenCRAVAT

Dos informes adicionales — asociaciones de rasgos y puntuaciones de riesgo poligénico — están disponibles en el directorio de ejemplos de GitHub.

Clonar, configurar, consultar

Lo que necesitas

Tus archivos VCF de cualquier proveedor de secuenciación genómica completa
Un IDE agéntico que soporte MCP (Antigravity, Codex, Claude Code)
Python 3.10+ y conda (para GeneChat-MCP)
Aproximadamente 2GB de espacio en disco para bases de datos de anotación (ClinVar, SnpEff, GWAS Catalog, modelos PGS)
Opcional: una cuenta en la nube de OpenCRAVAT (nivel gratuito) para anotación profunda

Arquitectura

Tu IDE (chat)
  Antigravity / Codex / Claude Code
       │                │
       ▼                ▼
  ┌──────────┐   ┌──────────────┐
  │ GeneChat │   │  OpenCRAVAT  │
  │   MCP    │   │     MCP      │
  │ (local)  │   │ (cloud API)  │
  └────┬─────┘   └──────┬───────┘
       │                │
       ▼                │ solo rsIDs
  ┌──────────┐          │ (sin datos genómicos)
  │ Tus VCF  │          ▼
  │ archivos │     CADD, REVEL,
  │ (local)  │     gnomAD, BioGRID
  └──────────┘

Instalación

No voy a reproducir el README aquí. Si puedes configurar un servidor MCP en tu IDE, puedes seguir las instrucciones del repositorio.

Clónalo: github.com/matbanik/agentic-genomics

La instalación tiene tres partes: GeneChat-MCP (consultas locales de VCF), OpenCRAVAT-MCP (anotación en la nube), y la configuración MCP de tu IDE. El README recorre cada una.

Dos cosas que causan problemas:

Indexación VCF. Tus archivos VCF necesitan ser indexados con tabix antes de la primera consulta. GeneChat espera pares .vcf.gz + .vcf.gz.tbi. Si falta el índice, las consultas fallarán silenciosamente o lanzarán errores crípticos. El repositorio lo documenta, pero es el problema de configuración más común.

Discrepancia de formato de contig. Algunos proveedores de secuenciación usan prefijos chr1, chr2, chr3. Otros usan 1, 2, 3 sin prefijo. Si tu VCF usa un formato y las bases de datos de referencia esperan el otro, las búsquedas de variantes fallarán. El repositorio maneja la conversión, pero vale la pena saber por qué una consulta podría devolver “no encontrado” cuando sabes que la variante está ahí.

¿Análisis de trío? Misma configuración, más genomas. Registra el archivo VCF de cada miembro de la familia y consulta todos a la vez.

Qué puedes preguntar

Estos son prompts en lenguaje natural que puedes escribir directamente en tu IDE. El agente enruta cada uno a la herramienta MCP correcta automáticamente.

¿Cuál es mi estatus metabolizador de CYP2D6?

Escanea mi genoma en busca de variantes patogénicas de ClinVar

¿Cuáles de estas variantes heredé de mi madre?

Calcula mi puntuación de riesgo poligénico de IMC

Dame una anotación profunda de rs4988235

¿Qué asociaciones GWAS existen para el metabolismo de la cafeína?

→ Los seis informes de ejemplo en GitHub

El panorama

No estás solo

Este espacio se mueve rápido. Algunos proyectos que vale la pena conocer.

ClawBio surgió del UK AI Agent Hackathon en Imperial College. Es una CLI de Python y biblioteca — no un servidor MCP, así que la arquitectura difiere, pero el objetivo se superpone. Han construido dos herramientas que no he visto en otro lugar: gwas-lookup federa consultas en nueve bases de datos GWAS simultáneamente, y clinpgx extrae de las guías de PharmGKB, CPIC y anotaciones de etiquetas de la FDA en una sola llamada. Trabajo complementario, paradigma de interfaz diferente.

Las señales académicas también están emergiendo. Un artículo en Briefings in Bioinformatics formalizó el framework MCPmed para agentes médicos de IA. EMBL tiene BioContextAI en desarrollo. cBioPortal — la base de datos de genómica del cáncer — ahora tiene una interfaz MCP. IBM Research presentó trabajo relacionado en ISMB.

En el lado del código abierto: Bio-MCP proporciona acceso general a herramientas bioinformáticas, gget-mcp envuelve la biblioteca gget para consultas de genes/proteínas, y IGV-MCP se conecta al Integrative Genomics Viewer para visualización.

El patrón es claro. Los datos genómicos se están volviendo consultables a través de interfaces conversacionales. La cuestión es si eso sucede en tu máquina o en la de alguien más.

Lo que esto no es

Quiero ser directo sobre los límites.

Esto no diagnostica enfermedades. Una marca “patogénica” de ClinVar no es un diagnóstico — es una entrada en una base de datos que refleja evidencia presentada, a menudo con interpretaciones contradictorias.

Esto no recomienda tratamientos. Un estatus de metabolizador intermedio de CYP2D6 es un hecho genotípico. Qué hacer al respecto es una decisión clínica que depende de tu contexto médico completo, otros medicamentos y el juicio de tu prescriptor.

Esto no proporciona consejos nutricionales. Tu estatus MTHFR no te dice qué suplementos tomar.

Las llamadas de alelos estrella — CYP2D6 *1/*4, CYP2C19 *1/*1 — son datos genotípicos factuales. Describen qué variantes portas. Traducir eso en acción requiere un humano con formación clínica y tu panorama completo.

Si encuentras algo preocupante, discútelo con un consejero genético o tu prescriptor. Eso no es una cobertura; es como funciona esto.

Las bases de datos fuente se nombran y versionan en cada resultado de consulta: PharmVar para definiciones de alelos estrella, CPIC para mapeos genotipo-fenotipo, ClinVar para clasificaciones clínicas de variantes, gnomAD para frecuencias poblacionales.

Cierre

Tu genoma es el conjunto de datos más personal que jamás tendrás. Ahora mismo, la mayor parte de él está en una carpeta que nunca abriste — o en un servidor que no puedes controlar.

Las herramientas para cambiar eso son gratuitas, abiertas y funcionan en tu máquina.

Personaje pixel art de pie en la cima de una colina al atardecer sosteniendo un fragmento de genoma brillante, con un compañero robot, alejado de una fortaleza en la nube distante — Tus datos. Tu máquina. Tus preguntas.

Si te atascas durante la instalación, abre un issue en GitHub. Para eso está.

Recursos

⚠️ Aviso legal: Este es un informe de genotipo factual, no un consejo médico. Discute los hallazgos accionables con tu prescriptor o consejero genético. Bases de datos fuente: PharmVar, CPIC, ClinVar, gnomAD — versiones indicadas por consulta.