¿Por qué los números de bases nitrogenadas coincidentes que componen el ADN (A, T y C, G) no son exactamente iguales?

Depende de si estos números están relacionados con un recuento de nucleobases de ADN de una o dos cadenas.

Hay dos “reglas básicas de Chargaff” con respecto a los números de A, G, T, C en el ADN del genoma.

La primera regla dice que | A | = | T | para ADN de doble cadena de un genoma completo. Esto es muy obvio, ya que cada A debe tener una T complementaria, lo mismo que G y C. Como mencionó Stephen He, hay casos en los que no hay una doble hélice habitual, como en los telómeros, centrómeros, donde el enrollamiento similar al ARN podría ocurren (por ejemplo, cuádruplex), pero estos no son una parte significativa de todo el genoma, por lo que no afectan mucho la regla de paridad.

La segunda regla dice que la misma igualdad se aplica también a una sola cadena del mismo ADN. Esto es mucho menos obvio, ya que aparentemente no hay necesidad de complementariedad dentro de un solo filamento de una doble hélice. Además, se aplica no solo a un genoma completo, sino también independientemente a cada cromosoma (en el caso de un genoma que comprenda varios cromosomas). Y aquí la igualdad no debe y, de hecho, no es precisa (ver más abajo).

Lo que es más curioso es que, lo que podríamos llamar la regla de la tercera paridad , no existe tal igualdad dentro de las purinas y las pirimidinas, sino que hay un predominio bastante significativo de bases con 2 enlaces de hidrógeno sobre 3 enlaces de hidrógeno, es decir | A | > | G |, | T | > | C |, y la proporción, en el caso humano, es igual alrededor de 1.445:

También es curioso que esa proporción se mantenga, si la secuencia es leída por dobletes (dinucleótidos), triples, etc., por ejemplo:

Arriba, toda la secuencia del genoma se leía como pares de “letras” y los pares se agrupaban por la primera nucleobase, sin tener en cuenta la última (* = cualquier nucleobase). En la segunda columna hay ocurrencias en el genoma completo, y en la última columna: proporción de T: C, A: G.

Lo mismo para trillizos

Y lo mismo para secuencias más largas.

En cuanto a cromosomas particulares, las proporciones varían pero siempre se mantiene la desigualdad, es decir | A | = | T | > | G | = | C |, p. Ej. Cromosoma 1:

(los números se calcularon a partir de algunas secuencias recientes del genoma humano en bancos de genomas disponibles)

——————————————————————————————

Hay muchas más relaciones numéricas (más sofisticadas también) en las secuencias del genoma, que muestran algunas propiedades intrincadas intrínsecas del ADN a gran escala. Sin embargo, todavía no responden la pregunta: ¿por qué?

La respuesta corta es que las propiedades y la función de los pares de bases de 3 enlaces (CG) son diferentes de AT, y una proporción específica entre estas retenciones como resultado de esta diferencia.

La naturaleza de la diferencia es compleja: apilamiento de pares de bases, enlaces de hidrógeno (con oscilaciones y las correspondientes dinámicas de dipolo EM), bases de aromaticidad y corrientes aromáticas, inducidas dentro de los dinucleótidos y a mayor escala, tal construcción multinivel en general decide sobre la dinámica y el funcionamiento físico real del ADN. (¡sin contar la cromatina, la hidratación y otras influencias externas!).

Un buen resumen de los detalles moleculares es, por ejemplo, este artículo “VINCULACIÓN DE HIDRÓGENO, APILAMIENTO DE BASES Y EFECTOS ESTERICOS EN LA REPLICACIÓN DEL ADN” (Eric T. Kool, 2001).

Aún así, la pregunta de “¿Por qué esta proporción (por ejemplo, 1.445) y no alguna otra?” No tiene respuesta y requiere explicación.

Para ser sincero, creo que es porque estos números provienen del experimento de Chargaff de 1951 utilizando un método increíblemente obsoleto de hidrólisis de ácido fórmico seguido de cromatografía y luego una medición colorimétrica de P, N para obtener una relación N: P que refleja el nucleótido que estaban mirando …

Un recordatorio de que esto se hizo con la tecnología UV / Vis pre HPLC pre 1950 moderna. El error estándar es 0.5%, lo que significa que la diferencia medida no es estadísticamente significativa. También es importante reconocer que este descubrimiento fue antes de que se determinara la estructura del ADN, por lo que no hubo motivación para garantizar que los A / TG ​​/ C fueran exactamente iguales a 1.0.

El artículo de Wikipedia ofrece una buena idea de lo imprecisa que es la medición.

Las diferencias se deben a errores aleatorios en las mediciones y reflejan el límite de precisión en la técnica. Si la medición se repitiera varias veces, obtendría una respuesta ligeramente diferente cada vez.

Primero, creo que esto se debe principalmente al costo por error de método como se publicó en respuestas anteriores.
Hay otra cosa interesante que aprender es que el ADN tiene una estructura en la cola llamada telómero, que tiene una parte sobresaliente. El voladizo es una pequeña cadena del ADN que permaneció sin igual. Supongo que esto puede causar la diferencia, pero como el saliente e incluso el telómero en sí mismo es solo una pequeña parte pequeña del ADN, las estadísticas pueden descuidarse y atribuirse al error.
Acabo de aprender sobre el telómero en una clase corta durante el verano, no una experiencia: D

More Interesting

¿Qué pasaría si los humanos rediseñaran su ADN para volverse más y más jóvenes después de cierta edad y finalmente morir como un bebé?

Si entendiéramos perfectamente el ADN, ¿podríamos crear un nuevo organismo desde cero?

¿Cómo una combinación de solo 4 bases en el ADN almacena toda la información de la célula desde la división hasta la muerte? ¿Cómo rRNA entiende lo que está escrito en mRNA? ¿Cómo es posible que una proteína pueda transportar información, ya que es solo una combinación de diferentes aminoácidos?

Como la selección natural ya no funciona en la mayoría de las poblaciones humanas, ¿sería beneficioso encontrar una manera de evitar que nuestro ADN mute tan a menudo?

Si se sospecha que las mitocondrias generadoras de energía se han convertido en parte de las células animales a través de la simbiosis, ¿cómo se han convertido en "una especie" con su animal subsumidor?

¿Por qué cada rostro humano, ADN y huella digital son diferentes de los demás?

¿Es posible clonar un Neanderthal usando las muestras de ADN disponibles actualmente?

¿Cuál es el enfoque algorítmico para resolver el problema de ADN de Albocede en Google APAC ronda B?

Dejando a un lado el debate de creación versus evolución, ¿la vida tal como la conocemos se reduce a la complejidad del ADN, etc., estadísticamente posible simplemente por casualidad?

¿Qué son las etiquetas de secuencia expresada (EST) y por qué son importantes para la investigación genómica?

¿Cuántas guías telefónicas llenaría nuestra secuencia de ADN?

¿Con qué precisión se puede estimar la edad de alguien a partir de una muestra de ADN?

¿Cómo funciona la promoción del ADN?

¿Podría la 'fusión eucariota' realmente haber sido una 'mutación procariota'?

¿Es el ADN una base de datos o un ser vivo?