¿Por qué es fácil probar el ADN pero es difícil probar el genoma humano completo?

Escala y costo y complejidad.

Tomemos, por ejemplo, una prueba de identidad forense estándar. Ejecuta menos de 20 PCR y al final genera aproximadamente el doble de esos valores numéricos (2 alelos para cada marcador STR. Por lo tanto, puede escribir fácilmente los resultados en una tarjeta de índice, o incluso ajustarlos en un tweet. Esas pruebas han sido cuidadosamente diseñado para ser muy robusto y dar resultados fáciles de interpretar. Los resultados también tienen casi ningún significado más allá de la identificación. El equipo para generar esto se puede comprar por menos de $ 10K, incluso si compra un buen equipo. Un estudiante de secundaria puede ser fácilmente entrenado para ejecutar el experimento y leer los resultados. El costo de los materiales para una identificación es quizás unas pocas decenas de dólares (es probable que sea una estimación alta). Además, es una rutina hacer esto a partir de muestras muy pequeñas.

Generar una secuencia completa del genoma humano significa crear aproximadamente 90 gigabytes de datos sin procesar, aproximadamente 4 discos Blu-Ray. Eso se hace en un instrumento de precisión que cuesta al menos $ 300K (más probable en unos mucho más que eso). Operar esto requiere mucho más entrenamiento; título universitario más experiencia. Generar esos datos cuesta $ 1K por pop para materiales. Los datos deben ser procesados ​​por computadoras relativamente poderosas para hacer las llamadas variantes. La interpretación de esas llamadas requiere más analistas informáticos y expertos que probablemente tengan Ph.D. o grados de MD. Y de manera realista, habrá muchas variantes de significado poco claro (VUS). Para el ADN de entrada, generalmente necesita más como una muestra de sangre que solo un hisopo en la mejilla. Y de manera realista, esos genomas de $ 1K pierden la mayoría de las variantes estructurales: ganancias y pérdidas de fragmentos cortos de cromosomas. Para eso, tendrá que ir por un factor de aproximadamente 10 en costo para generar una secuencia de “lectura larga”, que requiere una generación de datos más costosa y más cómputo.

Las pruebas de matriz son intermedias, que es lo que utilizan muchos de los servicios de genética personal. Estos pueden leer 10 o incluso cientos de miles de marcadores. La generación de datos es más barata que la secuenciación completa. El equipo es más barato, pero sigue siendo caro.

Hay seis mil millones de bases para observar en el genoma humano, contando ambas cadenas. Si su prueba es 99.998% precisa, y ninguna prueba de ADN actual tiene una precisión tan alta, entonces todavía comete un error 2 veces en 100,000 pruebas. Usando una prueba tan increíblemente precisa, se espera que una prueba de todo el genoma humano cometa 120,000 errores. Supongamos que su médico le dijo los resultados de su ADN, con el descargo de responsabilidad de que 120,000 de los resultados, más o menos 50,000, están equivocados. Y la realidad es que cada prueba tiene la suerte de tener una precisión del 99.8%, es decir, 100 veces peor que el mejor de los casos que mencioné anteriormente.