¿Cuánta información almacena el ADN humano?

Sin saber en detalle lo que representa una “cadena de dígitos binarios” (bits), no se puede decir mucho sobre el “contenido de información” de esa cadena. Lo que podemos hacer es hacer un recuento aproximado de cuántos bits almacena el genoma humano.

Primero, el “panorama general”: de Wikipedia (artículo Haploid ):

“El número gametico o haploide ( n ) es el número de cromosomas en un gameto. Dos gametos forman un cigoto diploide con el doble de este número ( 2n , el número cigótico o diploide ), es decir, dos copias de cromosomas autosómicos . Para los humanos, una especie diploide, n = 23. Una célula somática humana típica contiene 46 cromosomas: 2 juegos haploides completos , que forman 23 pares de cromosomas homólogos “.

Y del sitio web www.ncbi.nlm.nih.gov (artículo The Human Genome ):

“Cada una de las aproximadamente 10 [matemáticas] ^ {13} [/ matemáticas] en el cuerpo humano adulto tiene su propia copia o copias del genoma, con la única excepción de esos pocos tipos de células, como los glóbulos rojos, que carecen un núcleo en su estado completamente diferenciado. La gran mayoría de las células son diploides y, por lo tanto, tienen dos copias de cada autosoma, más dos cromosomas sexuales, XX para mujeres o XY para hombres, 46 cromosomas en total “.

El ADN es bicatenario, por lo que su “tamaño” se cuenta en número de pares de bases (pb), generalmente expresados ​​en kilo pares de bases (kbp), megapares (Mbp) y gigapares (Gbp):

1 kbp = 10 [matemática] ^ 3 [/ matemática] = 1000 pb

1 Mbp = 1 000 kbp = 10 [matemática] ^ 6 [/ matemática] = 1 000 000 pb

1 Gbp = 1 000 Mbp = 1 000 000 kbp = 10 [matemática] ^ 9 [/ matemática] = 1 000 000 000 pb

Tenga en cuenta que esto es diferente de cómo las computadoras cuentan bits’n’bytes, donde “una k” = 2 [matemática] ^ {10} [/ matemática] = 1 024, lo que hace que una kb ≈ 2.4% más grande (en número de bits) de un kbp .

La base de ADN es un código digital cuaternario (en la base 4 , es decir , usando cuatro símbolos diferentes: T , C , A y G , cada uno con dos bits , T = 00, C = 01, A = 10 y G = 11). Al mapear los 64 posibles tripletes de ADN a los aminoácidos que codifican (más los códigos para “inicio” y “detención”) se obtiene esta tabla (con el número de triplete (“codón”) en decimal y cuaternario ):

Notas: 1) Los trillizos 10 , 11 y 14 sirven solo como códigos de parada (sin codificaciones de aminoácidos); 2) Los tripletes 15 y 35 codifican los aminoácidos W y M , respectivamente; 3) Triplet 35 realiza “doble tarea” como el código universal de “iniciar transcripción” .

Los nombres de aminoácidos se muestran en sus códigos estándar de 3 y 1 letras.

Una coincidencia interesante: la suma de los valores de triplete 10 + 11 + 14 (los códigos de parada ) es igual a 35 (el código de inicio).

El número total de pares de bases de ADN en el genoma humano varía un poco, dependiendo de quién cuente: Wikipedia tiene dos valores bastante diferentes ( 3 234 830 000 pb y 3 095 693 981 pb), pero parece haber un “consenso general” alrededor de 3.200 millones de pares de bases , así que usaré esa figura bonita y redonda como base para este ejercicio (descargue la hoja de cálculo de Excel utilizada para mis cálculos, Tamaño del genoma humano (Mbp-Mb) .xlsx, para consultar mis cifras y / o sustituir sus propios datos).

Los números se caen de la siguiente manera:

Al interpretar estos números en unidades de ” pares de bases “, obtenemos:

Y cuando leemos los mismos números en la unidad ” bytes de 8 bits “, obtenemos:

No es sorprendente que la respuesta sea una vez más, “depende”

Tenga en cuenta que esta respuesta analiza la “información” del ADN como un número de bits , y no dice (casi) nada sobre su ” contenido de información ” real (sobre el cual la ciencia sabe muy poco, hasta ahora). Para conocer la “información” contenida en una cadena de bits, primero debemos saber qué representan los bits; esto se refleja en el número de “ADN de codificación” , que es bastante pequeño (menos del 5%) en comparación con el número total de ADN “pedacitos”!

Decir que el “contenido de información” de un genoma es igual al número de bits que almacena el genoma es equivalente a decir que “El contenido de información de un libro es igual al recuento de símbolos (caracteres) utilizados al imprimir el libro”. .. No es lo mismo.

Hay aproximadamente 2.85 mil millones de nucleótidos (letras) en el genoma humano, o 2.85 Gigabases.

Si representa cada nucleótido con un código de 2 bits (por ejemplo, A = 00 C = 01 G = 10 T = 11), tendrá 5.7 Giga bits .

Divida esto entre 8 para dar la respuesta en Bytes , que es 0.7125 gigabytes, que se expresa mejor como 712.5 mb.

Sin embargo, si tradujo la secuencia a las secuencias de aminoácidos que codifica, podría reducir el número de combinaciones posibles para cada triplete de 64 a 21 (20 aminoácidos más los que codifican una secuencia de parada). Esto le permite representar en 5 bits lo que anteriormente estaba representado por 6.

Esto debería reducir el tamaño total del archivo en 118.75 mb, a 593.75

http://www.nature.com/nature/jou

En un solo genoma humano hay aproximadamente 2.9 mil millones de nucleótidos (letras).

Para darle una mejor idea de lo que eso significa, aquí hay un libro de miles de páginas que incluye solo los nucleótidos de un solo genoma en el orden correcto:

Hace poco asistí a una conferencia sobre el ADN humano y el profesor nos mostró este libro para ilustrar su punto. Fue fascinante.

Desafortunadamente, Quora reduce la calidad de la foto y no puedes acercarla por completo.

Pero si pudieras, verías que todos estos signos son letras minúsculas.

Miles de millones de ellos.

Más de 200 libros como este contendrían la cantidad de información que tiene el ADN humano.

Gracias por tu interesante pregunta.
En pocas palabras, la “vida” es un proceso químico continuo que tiene lugar en las células.
Todas las formas de vida (plantas y animales) tienen cromosomas donde se encuentra el ADN y toda la información (para estar vivo) debe estar disponible en todas las formas de vida.
Los animales deben tener prácticamente los mismos órganos (esqueleto, piel, corazón, estómago, etc.), por lo que la información del ADN animal debe ser capaz de dar a las células la capacidad de producir estos órganos.
Entonces, el ADN humano, aunque tiene la misma información que toda la vida, también tiene información apropiada para animales, primates (simios) y específicamente para seres humanos. Pero no puedo dar una cantidad como tal, excepto decir que es la cantidad que le da a un ser humano.