¿Por qué la cantidad de genes que codifican proteínas es menor que la cantidad de proteínas en un genoma humano?

De un blog:

Según los trabajos de Iakes Ezkurdia y Michael Tress y colegas:

En un artículo enviado a Molecular Biology and Evolution, estos muchachos dicen que la verdadera cantidad de genes codificadores en el genoma humano probablemente esté más cerca de los 19,000.

La tarea de detectar genes que codifican proteínas no es fácil. El mejor método es tomar una muestra de una célula, ionizar las proteínas que contiene y enviarlas a través de un espectrómetro de masas. Las proteínas en la muestra se pueden determinar haciendo coincidir las masas medidas con las masas de proteínas predichas.

La idea es identificar todas las proteínas de las que está hecho un organismo y, por lo tanto, todos los genes que las codifican. Pero esto solo es posible con muestras de todos los tipos de células posibles y en la práctica esto es difícil de reunir.

Como resultado, muchas proteínas, y sus genes correspondientes, pueden pasarse por alto porque no están presentes en la muestra, son técnicamente difíciles de detectar o degradar muy rápidamente. Y solo porque nadie haya encontrado la proteína para un gen dado, eso no significa que no exista.

Más información se puede leer aquí

El genoma humano se reduce a solo 19,000 genes – The Physics arXiv Blog

Los humanos son eucariotas, y los genes eucariotas tienen secciones de ADN no codificante llamadas “intrones”, mientras que los segmentos de codificación son “exones”. Los intrones se empalman durante la transcripción y los exones se unen para formar el ARNm maduro, que viajará al ribosoma para ser traducido. Este proceso ofrece la oportunidad de un empalme alternativo, donde se pueden producir diferentes proteínas a partir del mismo gen al unir diferentes exones.

Por ejemplo, una secuencia de genes puede ser: [exon1 ——— exon2 —— exon3 ———- exon4 ——- exon5], donde los exones son exones y secuencias intrónicas representadas por -. Un ARNm puede tener esta forma: [exon1exon2exon5]. Otro ARNm hecho del mismo gen puede empalmarse de manera diferente y tener la forma [exon2exon3exon4exon5]. Estos producirían diferentes proteínas, debido a la diferente secuencia de aminoácidos que especificarían. Es por eso que tenemos más proteínas que genes codificadores de proteínas.

Si bien la respuesta de Sarah Turner es buena, pasa por alto la fuente de muchas (¿millones?) De proteínas que no están codificadas directamente en el genoma humano. Los vertebrados con mandíbula (peces, humanos y muchas otras especies) tienen un tipo especial de recombinación para producir moléculas de inmunoglobina (anticuerpos). Por lo tanto, menos de 30,000 genes pueden producir millones de anticuerpos diferentes junto con todo lo demás.

No puedo explicarlo brevemente para Quora, pero el proceso es la recombinación de VDJ, vea Wiki

V (D) J recombinación

Anticuerpo

Para muchas de las áreas, todavía no sabemos para qué son.

Hay un montón de ADN al final de los cromosomas que se acorta a medida que envejece, por lo que podría programarse la muerte cuando se acortan lo suficiente como para dañar el ADN real (telómeros)

Podría haber ADN que se transmitió que fue mutado o que de otra manera nunca se activó, como si tuviéramos un gen branquial.

Olvidé si los operones producen proteínas, pero los operones activan y desactivan genes, reprimen e inducen.

Los transposones son genes que saltan y activan y desactivan genes dependiendo de su ubicación.

Transposones (Genes de salto)