Sin saber en detalle lo que representa una “cadena de dígitos binarios” (bits), no se puede decir mucho sobre el “contenido de información” de esa cadena. Lo que podemos hacer es hacer un recuento aproximado de cuántos bits almacena el genoma humano.
Primero, el “panorama general”: de Wikipedia (artículo Haploid ):
“El número gametico o haploide ( n ) es el número de cromosomas en un gameto. Dos gametos forman un cigoto diploide con el doble de este número ( 2n , el número cigótico o diploide ), es decir, dos copias de cromosomas autosómicos . Para los humanos, una especie diploide, n = 23. Una célula somática humana típica contiene 46 cromosomas: 2 juegos haploides completos , que forman 23 pares de cromosomas homólogos “.
- ¿De qué están hechas las huellas digitales?
- ¿Puedes acceder a la memoria de tu propio ADN con tu subconsciencia?
- ¿Cuáles son las probabilidades de que la vida extraterrestre tenga ADN, ARN o genes, de la misma manera que la vida en la Tierra?
- ¿Por qué cada rostro humano, ADN y huella digital son diferentes de los demás?
- ¿Cuáles son los usos de las huellas digitales de ADN?
Y del sitio web www.ncbi.nlm.nih.gov (artículo The Human Genome ):
“Cada una de las aproximadamente 10 [matemáticas] ^ {13} [/ matemáticas] en el cuerpo humano adulto tiene su propia copia o copias del genoma, con la única excepción de esos pocos tipos de células, como los glóbulos rojos, que carecen un núcleo en su estado completamente diferenciado. La gran mayoría de las células son diploides y, por lo tanto, tienen dos copias de cada autosoma, más dos cromosomas sexuales, XX para mujeres o XY para hombres, 46 cromosomas en total “.
El ADN es bicatenario, por lo que su “tamaño” se cuenta en número de pares de bases (pb), generalmente expresados en kilo pares de bases (kbp), megapares (Mbp) y gigapares (Gbp):
1 kbp = 10 [matemática] ^ 3 [/ matemática] = 1000 pb
1 Mbp = 1 000 kbp = 10 [matemática] ^ 6 [/ matemática] = 1 000 000 pb
1 Gbp = 1 000 Mbp = 1 000 000 kbp = 10 [matemática] ^ 9 [/ matemática] = 1 000 000 000 pb
Tenga en cuenta que esto es diferente de cómo las computadoras cuentan bits’n’bytes, donde “una k” = 2 [matemática] ^ {10} [/ matemática] = 1 024, lo que hace que una kb ≈ 2.4% más grande (en número de bits) de un kbp .
La base de ADN es un código digital cuaternario (en la base 4 , es decir , usando cuatro símbolos diferentes: T , C , A y G , cada uno con dos bits , T = 00, C = 01, A = 10 y G = 11). Al mapear los 64 posibles tripletes de ADN a los aminoácidos que codifican (más los códigos para “inicio” y “detención”) se obtiene esta tabla (con el número de triplete (“codón”) en decimal y cuaternario ):
Notas: 1) Los trillizos 10 , 11 y 14 sirven solo como códigos de parada (sin codificaciones de aminoácidos); 2) Los tripletes 15 y 35 codifican los aminoácidos W y M , respectivamente; 3) Triplet 35 realiza “doble tarea” como el código universal de “iniciar transcripción” .
Los nombres de aminoácidos se muestran en sus códigos estándar de 3 y 1 letras.
Una coincidencia interesante: la suma de los valores de triplete 10 + 11 + 14 (los códigos de parada ) es igual a 35 (el código de inicio).
El número total de pares de bases de ADN en el genoma humano varía un poco, dependiendo de quién cuente: Wikipedia tiene dos valores bastante diferentes ( 3 234 830 000 pb y 3 095 693 981 pb), pero parece haber un “consenso general” alrededor de 3.200 millones de pares de bases , así que usaré esa figura bonita y redonda como base para este ejercicio (descargue la hoja de cálculo de Excel utilizada para mis cálculos, Tamaño del genoma humano (Mbp-Mb) .xlsx, para consultar mis cifras y / o sustituir sus propios datos).
Los números se caen de la siguiente manera:
Al interpretar estos números en unidades de ” pares de bases “, obtenemos:
Y cuando leemos los mismos números en la unidad ” bytes de 8 bits “, obtenemos:
No es sorprendente que la respuesta sea una vez más, “depende” …
Tenga en cuenta que esta respuesta analiza la “información” del ADN como un número de bits , y no dice (casi) nada sobre su ” contenido de información ” real (sobre el cual la ciencia sabe muy poco, hasta ahora). Para conocer la “información” contenida en una cadena de bits, primero debemos saber qué representan los bits; esto se refleja en el número de “ADN de codificación” , que es bastante pequeño (menos del 5%) en comparación con el número total de ADN “pedacitos”!
Decir que el “contenido de información” de un genoma es igual al número de bits que almacena el genoma es equivalente a decir que “El contenido de información de un libro es igual al recuento de símbolos (caracteres) utilizados al imprimir el libro”. .. No es lo mismo.