¿Cuál es el porcentaje real del ADN humano descodificado?

Está en el orden del 95%.

La razón por la que no es 100% es que hay regiones altamente repetitivas del genoma (por ejemplo, en el centro del cromosoma, llamadas centrómeros, y en los extremos de los cromosomas, llamados telómeros) que son muy difíciles de secuenciar, ya que se extienden de miles a millones de bases, y la tecnología de secuenciación actual secuencia extensiones de ADN del orden de 50 bases a quizás 1000 bases.

Incluso con manipulaciones avanzadas, para obtener tramos de secuencia con un ‘espacio’ intermedio definido (llamado extremo emparejado si el espacio es relativamente corto en los cientos de bases, o pareja de pares si el espacio está en los miles de bases) , el problema sigue siendo una secuencia relativamente no informativa que se repite una y otra vez. (Por ejemplo, imagine la cadena de bases AACCAACCAACCAACCAACCAACC multiplicada cien veces).

La nueva tecnología (como Pacific Biosciences) ofrece lecturas largas (longitud de lectura promedio de 2500 pares de bases), pero la precisión es mucho menor que la secuencia existente de lectura corta. Dado que también es relativamente costoso (del orden de 10x a 100x el costo por base para la secuenciación de lectura corta existente), no se usa para este propósito para el genoma humano.

Por último, mencionas “decodificado” en tu pregunta, y si considero que se ha secuenciado el ADN que codifica todas las proteínas en una célula humana, la respuesta es sí. Esta secuencia se llama ‘exoma’, la secuencia de ADN que consta de unos 23,000 genes y aproximadamente 10 veces más que (más de 230,000) exones individuales cuya disposición precisa puede producir muchas más proteínas con exones que están en diferentes combinaciones (también conocidas como ‘alternativas’ variantes de empalme). Por lo tanto, aunque hay 23K genes, puede haber más de 100,000 proteínas diferentes que codifican estos genes.

Supongo que esto puede depender de lo que quieres decir con “decodificado”. Si se refiere simplemente a la secuencia de ADN del genoma humano, entonces la excelente respuesta de Dale Yuzuki proporciona su respuesta. Se conoce aproximadamente el 95% de la secuencia de nucleótidos del genoma humano.

Sin embargo, si quiere decir con “decodificado” lo que codifica el genoma en cuanto a funcionalidad, se estima que solo el 3% del genoma existe como genes. Los genes se definen como secuencias de ADN que codifican proteínas. Hay solo 20-25,000 genes en el genoma humano, lo cual es sorprendente porque las bacterias, como E. coli, contienen 4,290 genes. ¿Somos solo 5 veces más complejos que las bacterias? La respuesta (no) se encuentra al menos parcialmente en lo que se encuentra en el 97% restante del genoma.

Este 97% restante es, en mi opinión, está resultando ser mucho más interesante que el 3% que codifica las proteínas. Este ADN solía denominarse “ADN basura” porque los investigadores pensaban que no tenía ninguna función. Resulta que este ADN es cualquier cosa menos basura que no tiene ningún propósito.

Parte de este ADN consiste en regiones reguladoras de genes a las cuales las proteínas se unen y activan / desactivan varios genes. Otras porciones de este 97% se transcriben en moléculas de ARN que los investigadores están descubriendo que juegan papeles muy importantes (y fascinantes) en la regulación génica, la síntesis de proteínas, el empalme alternativo y las modificaciones postraduccionales. Estas moléculas de ARN actúan a través de una amplia variedad de mecanismos que son extremadamente interesantes (y realmente son un tema de discusión por sí mismos).

Entonces, todo depende de lo que quieras decir con “decodificado”. Elucidar la secuencia de nucleótidos del genoma fue realmente solo el primer paso en un largo y rico futuro de investigación de lo que realmente hace el genoma.

Espero que esto haya ayudado.

John W. Rooney, Ph.D., JD