¿Cómo determinan los genetistas la función de un bloque de ADN?

Nota: Los genes no tienen inherentemente funciones en sentido macroscópico. Puede sonar pedante, pero es relevante. Un gen es simplemente un fragmento de código que describe una proteína particular. Un gen no codifica un fenotipo particular; eso se forma solo junto con todos los productos de todos los otros genes, así como el medio ambiente. Las propiedades reactivas o catalíticas de una proteína no están necesariamente restringidas a una sola ruta o función. La verdadera “función” de un gen es el comportamiento químico del producto genético en su probable contexto fisiológico. [ver comentarios para matices]

Dicho esto, podemos relajar un poco la terminología. Hay varias formas en que podemos determinar la función de un gen, y generalmente se emplean y combinan varios métodos para formar una buena idea.

Secuencia de similitud . Si la secuencia de un gen es similar a la de otro gen que ya conocemos en otro organismo, entonces es probable que los productos proteicos tengan propiedades similares y puedan tener actividades similares en la célula. La tecnología de secuenciación de segunda generación lo hace posible a gran escala por un precio bajo. Debido a las razones mencionadas en la nota anterior, es solo una suposición, pero podría decirnos qué buscar. Algunos signos reveladores de la secuencia también son útiles incluso sin mirar a través de una base de datos de secuencias conocidas; por ejemplo, las proteínas de membrana pueden reconocerse típicamente a partir de la secuencia sola.

Análisis de nocaut, subexpresión y sobreexpresión . Un mutante knock-out es un individuo en el que el gen se altera para que ya no se exprese o ya no sea funcional. El fenotipo de dicho mutante a menudo da una pista sobre el papel que juega el gen en la célula. Para dar un ejemplo sencillo, si el mutante knock-out ya no es capaz de descomponer cierto compuesto, es probable que el gen (¡pero no necesariamente!) Esté relacionado con su transporte o metabolismo. Los mutantes que subexpresan o sobreexpresan un gen en particular descubren pistas similares. Crear mutantes como este es fácil para algunos organismos; Por ejemplo, los científicos que estudian S. cerevisiae ( levadura de panadero / cervecero) tienen acceso a una biblioteca de mutantes eliminados, ¡uno para cada gen ! Por razones obvias, la situación es un poco diferente para, por ejemplo, H. sapiens .

Estudios de interacción de proteínas . Conocer el fenotipo de un mutante no nos dice cómo la mutación causa ese fenotipo, por lo que en realidad no nos dice la función del gen. Para saberlo, necesitamos conocer las reacciones químicas en las que está involucrado el producto genético. El modelado estructural in silico puede ayudar con esto, pero la única forma de saberlo con certeza es probar las reacciones. La actividad catalítica se puede probar extrayendo el producto génico y colocándolo en un tubo de ensayo junto con los reactivos. También hay técnicas para detectar interacciones proteína-proteína. Por ejemplo, en levadura-dos-híbrido (Y2H), los genes se colocan en una levadura genéticamente transformada, que se ilumina (literalmente) cuando los dos productos genéticos interactúan.

Como puede ver, es un proceso bastante complicado con muchas trampas y trabajo duro si desea hacerlo bien. Las bases de datos como Genbank ofrecen buenas descripciones de lo que se conoce para cualquier gen, combinando información de muchos (¡muchos!) Estudios científicos. La mayoría de los organismos modelo tienen su propio sitio web, por ejemplo, SGD para levadura, FlyBase para Drosophila .


Editar: GWAS y QTL . Los mutantes son útiles para observar la influencia de un gen en un fenotipo particular, pero ¿qué sucede si desea investigar un fenotipo y encontrar los genes asociados? Reúne un grupo de individuos, examina su fenotipo y secuencia sus genomas, luego observa la correlación entre ciertas diferencias en sus genomas (polimorfismos) y fenotipos. Esa es la idea detrás del estudio de asociación amplia del genoma y el locus de rasgos cuantitativos. Debido a que la secuenciación de un genoma completo no es tan barata, es un trabajo duro y da como resultado información imperfecta, el paso de secuenciación se reemplaza por marcadores de secuencia o microarrays.

Hay varios enfoques posibles para ese problema.

Lo primero y más obvio es ver qué sucede cuando el gen está mutado y no puede funcionar correctamente. En el organismo modelo, puede producir mutantes y estudiar su fenotipo, mientras que en humanos normalmente trata de relacionar los datos clínicos con una variante genética particular. La racionalización es que si el gen no funciona, su función se verá comprometida. Usando este enfoque, uno normalmente identifica a individuos con rasgos particulares, y luego trata de identificar cuál es el gen mutado. Si la reinserción del gen en un mutante restaura la función, es fácil concluir que el gen es importante para eso. Un enfoque similar es insertar copias adicionales del gen o inducir una expresión no regulada para ver qué sucede si el gen está trabajando más de lo normal.

Otra opción es tratar de inferir la función del gen comparándolo con genes similares en otra especie. Esto no es sencillo, ya que el gen puede duplicarse fácilmente y obtener nuevas funciones, pero la lógica es que si tiene el gen A en el organismo 1 para el cual el gen B en el organismo 2 es el más similar; Y a la inversa; entonces es muy probable que esos genes tengan la misma función. En muchos casos esto no es posible. Incluso entonces, el hecho de que los genes se parezcan a otros genes con funciones conocidas sugiere que la función, o al menos los mecanismos moleculares, debería ser similar.

Otra opción es tratar de correlacionar los cambios en la expresión génica con una función biológica. Si estudiamos qué genes se expresan durante el proceso que nos interesa, y lo comparamos con una situación de control; Observaremos una lista de genes con cambios en sus niveles de expresión. Es probable que esos genes estén relacionados con los procesos que afectan la condición probada y, por lo tanto, con su función.

Otra forma de ver qué genes son importantes para una función dada es comparar organismos cerrados que difieren en la función que estamos tratando de estudiar. Por ejemplo, podemos querer comparar diferentes cepas de un microbio que difieren en su patogenicidad y ver qué tienen en común las cepas virulentas versus las no virulentas.

La visualización del gen in vivo también puede proporcionar pistas de la función. La localización del gen en estructuras particulares sugiere que el gen es importante para la función de esas estructuras. La visualización se puede realizar marcando los genes con proteínas fluorescentes o ciertas enzimas a través de la manipulación genética; o usando anticuerpos marcados que se dirigen específicamente a la proteína.

En el caso de las enzimas, uno puede tratar de purificar la proteína y realizar ensayos enzimáticos. Mostrar que una proteína dada tiene la capacidad de actuar como catalizador para una reacción química dada es una fuerte evidencia de un papel muy similar en el organismo nativo.

Al expresar la proteína en otros organismos, como bacterias o levaduras, es posible realizar experimentos que prueban si dos proteínas interactúan o no. Esto es importante, por ejemplo, en el caso de las proteínas que regulan la función de otras proteínas.

Y … probablemente hay aún más enfoques, pero ahora no puedo pensar en otra cosa.

Esta es una pregunta realmente abierta, ya que es la pregunta general que hace cualquier genetista, o al menos los genetistas moleculares.

Al final del día, se trata de asociar (es decir, encontrar correlaciones entre) diferentes fenotipos y genotipos .

Los enfoques genéticos “hacia adelante” comienzan con el fenotipo e intentan identificar el genotipo asociado. La genética clásica implica encontrar dos (o varias) clases diferentes de un fenotipo dado, y luego examinar varios marcadores genéticos para ayudar a identificar los loci asociados (“bloques de ADN”). Los métodos incluyen mutagénesis y reproducción para generar variación fenotípica, y mapeo QTL y mapeo de asociación para identificar el ADN. Una limitación importante es que generalmente solo podrá identificar un bloque de ADN con este método. También puede detectar ARN y proteínas, que generalmente es más costoso, pero puede ser útil para identificar genes específicos.

Los enfoques genéticos “inversos” comienzan con el genotipo, luego intentan identificar el genotipo. Los métodos incluyen TILLING, inserciones transgénicas, silenciamiento génico (por ejemplo, inducido por virus = VIGS, RNAi). En estos casos, generalmente comienza con un gen candidato (o bloque de ADN), genera variaciones dentro de esa región y luego examina los fenotipos.

Tenga en cuenta que la diferencia entre la genética directa e inversa puede descomponerse en algunos casos, especialmente con técnicas más modernas. Por ejemplo, puede combinar la identificación de muchos genes candidatos utilizando un enfoque genético avanzado, pero también utilizar técnicas de genética inversa en esos candidatos.

Existe una gran cantidad de técnicas experimentales, pero la que generalmente correlaciona un fenotipo con un genotipo más fuertemente, es cuando la eliminación de un gen da como resultado la pérdida de ese fenotipo; se concluye que este gen es al menos parcialmente responsable / esencial para ese fenotipo. . The Yeast Deletion Collection: A Decade of Functional Genomics: un enlace al documento sobre los genes inactivados en levaduras. es posible que desee investigar el mismo tema en los modelos de ratones para obtener una mejor visión de los genes inactivados basados ​​en mamíferos.

En cuanto a eso en condiciones más complejas … posiblemente podría usar el aprendizaje automático: regresión lineal para trazar la actividad de codificación de un gen (medido en datos de conteo de RNA-seq o hibridación en análisis de microarrays) frente a la gravedad / intensidad de una afección. El paquete R ‘limma’ podría ser útil para este propósito … Creo que todo lo anterior es correcto …

Básicamente, debe eliminar un gen en una especie modelo (generalmente ratones o drosophila, moscas de la fruta) para determinar cuál es su función en función de las anomalías observadas en las muestras que se estudian una vez que ya no tiene ese gen. O bien, puede usar un plásmido (ADN circular) con un gen objetivo y transfectar ese plásmido en una especie modelo (podría ser cualquier cosa, desde ratones hasta células en una placa de Petri) y observar lo que sucede. Esa es la versión corta, la versión larga podría enseñarse en el transcurso de un semestre.

A veces sí, pero no en general.

Por ejemplo, en perros es posible hacerse pruebas de ADN que examinan genes específicos que controlan partes del ojo, el color del pelaje, etc., y obtener información sobre la genética que lleva el perro.

Sin embargo, la mayoría de los genes interactúan con muchos otros genes y, a menudo, de manera inesperada. Nuevamente, para usar una analogía canina, los investigadores están bastante seguros de que el gen que hace que la coloración dálmata se vea así:

En lugar de como uno de estos:

También es el gen que hace que no puedan procesar normalmente el ácido úrico. Nadie sabe cómo un gen de color de pelaje también podría ser un gen metabólico para el sistema urinario, pero aparentemente lo es.

Del mismo modo, el color del ojo humano está determinado por al menos 15 genes. Identificar la función de uno de ellos sería un desafío ya que los otros también varían.

Al comparar la expresión de genes entre grupos de humanos (o animales) que los tienen y que no. Esta expresión podría referirse a un tipo específico de comportamiento, una reacción bioquímica, una característica física, etc.

Tres métodos

  1. genética avanzada: identifican un gen y lo manipulan y ven el efecto en el individuo (animal experimental)
  2. Genética atrasada un individuo tiene una enfermedad y luego los científicos analizan múltiples genes para encontrar el defecto en un gen
  3. La asociación del genoma completo estudia una enfermedad, pero no conocemos el gen o los genes que la controlan. Podemos examinar todo el genoma hasta que descubramos qué configuración de genes está significativamente asociada con la enfermedad. [1]

Notas al pie

[1] Tratamiento de fertilidad