Cómo identificar la región promotora de un gen

Kien Malarney cubre su pregunta bastante bien.

Este sitio cubre bien el tema, al menos desde una perspectiva de 2010:

“Muchas personas tienen problemas para identificar o predecir la secuencia promotora de un gen, o no saben cómo obtener la secuencia real para el análisis, como el diseño del cebador, la búsqueda del sitio de unión al factor de transcripción, etc. Aquí proporciono formas de cómo hacer estas cosas . 1. Cómo encontrar y recuperar secuencias promotoras de bases de datos del genoma Las secuencias promotoras suelen ser la secuencia inmediatamente aguas arriba del sitio de inicio de la transcripción (TSS) o primer exón. Si conocemos el TSS de un gen, sabremos con confianza dónde está el promotor incluso sin caracterización experimental. Para muchos organismos, como el humano, el ratón, el genoma está bien anotado y el TSS está bien definido. Así, la recuperación de la secuencia del promotor es una tarea fácil. Hay tres navegadores genómicos principales: NCBI, Ensembl y UCSC. Para nuestro propósito, Ensembl proporciona la interfaz más conveniente ”. De: Cómo encontrar secuencias promotoras

Aquí hay otro buen recurso bioinformático: UCSC Genome Browser Home

Espero que ayude, John 🙂

Existen innumerables herramientas bioinformáticas que le permitirán conocer los sitios del promotor en una secuencia determinada.

Para comprender el mecanismo de regulación transcripcional, es esencial identificar y caracterizar el promotor, que se encuentra próximo al sitio de inicio del ARNm. Para identificar los promotores de los grandes volúmenes de secuencias genómicas, utilizamos sitios de inicio de ARNm determinados por una secuenciación a gran escala de las bibliotecas de ADNc construidas por el método de “oligo-capping”. Alineamos los sitios de inicio de ARNm con las secuencias genómicas y recuperamos las secuencias adyacentes como regiones promotoras potenciales (PPR) para 1031 genes. Se buscaron las secuencias PPR para determinar las frecuencias de los principales elementos promotores. Entre 1031 PPR, 329 (32%) contenían cajas TATA, 872 (85%) contenían iniciadores, 999 (97%) contenían caja GC y 663 (64%) contenían caja CAAT.

Este método de “oligo-capping” es fácil de usar en el que usamos la estructura de cap del ARNm, que es la estructura característica del extremo 5 ‘de los ARNm eucariotas. Mediante tres reacciones enzimáticas secuenciales, el método de protección de oligo reemplaza la estructura de protección de ARNm con oligoribonucleótido sintético (Fig. (Fig.1) .1). Usando este oligoribonucleótido 5 ‘como etiqueta de secuencia, los ADNc que originalmente contenían la estructura de la tapa se clonan selectivamente. Este tipo de biblioteca (bibliotecas de ADNc con cubierta oligo) contenía del 50% al 80% de los ADNc de longitud completa cuyos extremos 5 ‘corresponden a los sitios de inicio de ARNm.

Lo mejor es ir al navegador del genoma UCSC en http://genome.ucsc.edu

Hay algunas maneras de determinarlo, y sospecho que hay muchas más que no conozco.

Usando un algoritmo de bioinformática, puede buscar motivos promotores presentes aguas arriba de su gen de interés y probar regiones que tengan motivos promotores. Por ejemplo, su algoritmo podría detectar algo como un cuadro TATA. Independientemente de lo que encuentre, podría subclonar (Clonación de plásmidos por digestión enzimática de restricción (con protocolos)) las regiones que el algoritmo encuentra en un plásmido informador, como una construcción GFP o luciferasa, o podría tener regiones que sospeche que afectan a la transcripción sintetizada. También depende del tamaño del promotor; podría ser más fácil probar varias regiones más pequeñas al sintetizarlas también como oligonucleótidos de ADN, lo que es más costoso con secuencias más grandes.

Si conoce alguna de las proteínas específicas que activan o inhiben la transcripción de su gen, puede usar la inmunoprecipitación de cromatina (inmunoprecipitación de cromatina – Wikipedia) con un anticuerpo específico para esa proteína de unión al ADN y secuenciar la región aguas arriba recuperada de la inmunoprecipitación de cromatina. Encuentra esa secuencia en tu secuencia del genoma y has encontrado el promotor. Pruebe este promotor en un plásmido gen informador que transfecte en sus células para confirmar. Sin embargo, tenga en cuenta que los anticuerpos son caros y, por supuesto, debe conocer las proteínas específicas que afectan la transcripción de su gen si va a utilizar este método.

También podría usar un ensayo de huella de ADNasa (ensayo de huella de ADNasa – Wikipedia) para encontrar regiones en las que las proteínas están unidas al ADN, con los resultados conocidos como huellas de ADN. Haga una secuencia de esas huellas, compare estas secuencias con su región promotora y, con suerte, encuentre una secuencia de huella que coincida con su promotor. Nuevamente, construya y pruebe un plásmido informador con el promotor que sospecha, y transfecte el plásmido en sus células para asegurarse. Aunque este método le permite saber menos sobre interacciones específicas de ADN-proteína, requiere más secuenciación de ADN y palabras clave bioinformáticas, y múltiples coincidencias pueden ser problemáticas.

¡Buena suerte encontrando al promotor!

Cada región se identifica sobre la base de tres codones. Cuáles son la combinación de tres bases nitrogenadas. AUG es el codón de iniciación y promotor que otros también lo son pero es un codón universal.

Como tiene toda la secuencia, simplemente mire hacia arriba desde la secuencia de codificación.