¿Qué herramientas bioinformáticas se necesitan con urgencia?

Un método para almacenar y recuperar fácilmente anotaciones complejas de ADN y alinear secuencias con ellas. Actualmente, cada organismo tiene una o dos anotaciones de referencia que generalmente son generadas por un consorcio como UCSC o conjunto. Para los humanos y los ratones y otros organismos comúnmente investigados, ahora tenemos de cientos a miles de genomas secuenciados, necesitamos una forma de representar la suma de esas secuencias como un consenso y al mismo tiempo representar la variabilidad entre los individuos. Probablemente será una especie de estructura de base de datos y deberá ser utilizada por muchas personas y organizaciones diferentes. Como resultado, es probable que ninguna persona resuelva este problema, pero se necesitará una solución para que los esfuerzos de suma de todo nuestro trabajo de secuenciación no se enmascaren como un consenso o se distribuyan a miles de archivos / bases de datos separados.

Sugeriré uno. El principio principal de la biología molecular: un gen es una secuencia de ADN -> que codifica ARN -> que luego puede leerse, para instruir la construcción de cadenas de aminoácidos -> que luego se pliegan en estructuras de proteínas tridimensionales – que se llevan a cabo funciones en el organismo. Podemos secuenciar genomas completos y cargarlos en bases de datos, podemos buscar genes en ellos y podemos obtener las secuencias de aminoácidos. Sin embargo, no hemos encontrado una solución bioinformática confiable y eficiente que pueda derivar la estructura 3D completa de una proteína conociendo solo la secuencia de aminoácidos. Tenemos predicción de estructura secundaria (es decir, qué segmentos son hélice alfa, hoja beta y bobina aleatoria). Tenemos modelos de homología estructural (es decir, si esta secuencia de aminoácidos, A, conduce a una estructura de proteínas, y mi secuencia actual, B, tiene una gran similitud con la secuencia A, puedo tratar de derivar la estructura de B mirando la estructura de proteínas de secuencia A). Sin embargo, un solo cambio de aminoácidos puede conducir a cambios dramáticos en la estructura (como lo demuestran muchas enfermedades genéticas). Se necesita más precisión para resolver el problema.

Los experimentos CASP (Inicio – Centro de predicción) conducen hacia este objetivo. Son esencialmente competencias para grupos de investigación computacional en todo el mundo para desarrollar un algoritmo que pueda predecir con mayor precisión la estructura 3D de una proteína a partir de su secuencia de aminoácidos sola. Para la competencia, la estructura 3D experimental habrá sido aclarada, pero se mantendrá en secreto hasta que los grupos hayan presentado sus predicciones. Luego se comparan las predicciones y las estructuras experimentales. La predicción más precisa es el ganador.

También puede leer sobre este tema buscando ” Problema de plegamiento de proteínas ” en los motores de búsqueda. Podrá descubrir por qué este problema es tan difícil de resolver. Tiene que ver con el número extremadamente alto de conformaciones posibles dado el rango y el número de articulaciones giratorias en la estructura molecular, lo que genera demandas computacionales que no pueden satisfacerse fácilmente sin alguna forma de refinamiento y optimización de búsqueda.

El impacto de tener una herramienta así es tremendo. La estructura es la clave de la función biológica. Se necesita financiación, tiempo y esfuerzo para llevar a cabo experimentos de aclaración estructural sobre proteínas mediante cristalografía de rayos X, resonancia magnética nuclear (RMN) o, más recientemente, microscopía crioelectrónica para obtener su estructura 3D. Estos estudios pueden ser complicados por proteínas que no cooperan con las técnicas utilizadas. Por ejemplo, puede ser difícil lograr que la proteína se cristalice para un estudio de rayos X, o la proteína se sigue agregando en solución causando problemas para la RMN en solución (por ejemplo, proteínas de membrana con alta hidrofobicidad). En primer lugar, simplemente expresar la proteína (debidamente plegada, no solo una cadena peptídica desordenada o agregada) en el laboratorio dado el código de ADN conocido ya puede ser un problema. Si se desarrolla una solución computacional, se ahorrarían recursos. La biología estructural ganaría un impulso.

Tenga en cuenta que muchas enfermedades surgen de proteínas mal plegadas o mutadas, por ejemplo, las proteínas involucradas en el Alzheimer forman grandes agregados de proteínas. Si conocemos un algoritmo para plegar las proteínas adecuadamente, podemos aprender a abordar las proteínas mal plegadas. Este es un video esclarecedor sobre el plegamiento de proteínas, el cáncer y la enfermedad de Alzheimer:

Una aplicación fascinante sería la capacidad de construir o editar proteínas a medida que hagan la función que queramos. Podremos editar la entrada del código genético en la computadora, ver el cambio resultante en el modelo 3D y así aprender cómo construir nuestras propias proteínas. Esto tendrá implicaciones para la nanotecnología y también la medicina, ya que podemos construir fármacos peptídicos para contrarrestar un objetivo biológico dado.

No digo que no haya solución. Hay muchos intentos y simulaciones razonablemente buenas por ahí, pero no una completamente concluyente, por ejemplo, poder derivar una estructura precisa en todos los casos a pesar de la gran variedad de entradas posibles. El santo grial es conocer todas las reglas del plegamiento de proteínas dada una secuencia, es decir, el algoritmo fundamental. Si se encuentra tal solución, el descubridor probablemente obtendría un Premio Nobel.

More Interesting

¿Qué tan poderoso es el impulso para satisfacer nuestra curiosidad?

¿Hay alguna forma de unirse a un experimento sobre astrofísica nuclear como individuo interesado en la rama?

¿Cuáles son algunas nuevas empresas interesantes de investigación y ciencia en Israel?

Cómo seleccionar e investigar mi tema de tesis

¿Por qué hay tantos graduados desempleados de University College Dublin?

¿Existe alguna herramienta de investigación de palabras clave de Amazon que pueda ayudar a encontrar palabras clave rentables?

¿Cuál es la mejor manera posible (inteligente y productiva) de traducir el conocimiento de documentos científicos / patentes en productos de salud en tiempo real?

¿Podemos culpar a los lingüistas por la falta de progreso en el lenguaje (por ejemplo, no hay nuevos tipos de palabras comparables a los verbos)?

¿El IISc es bueno para la investigación en biología?

¿Qué hacen los profesores de investigación? ¿Cuál es su carrera profesional? ¿Cómo eligen la universidad y cómo eligen qué investigar?

¿Cuál es la forma más inteligente de hacer 'investigación', en su sentido más amplio? ¿Puedes encontrar la mayor parte de lo que estás buscando en Google?

Si se aceptan resultados estadísticos basados ​​en un nivel de confianza del 95%, ¿eso significa que 1 de cada 20 artículos científicos informan resultados que pueden no ser ciertos?

¿Dónde debo comenzar a hacer mi investigación para las próximas elecciones en Singapur?

¿Cuáles son los mejores temas front-end para la investigación en VLSI?

¿Cuál es una buena manera de investigar en profundidad los productos menos populares como el cobre, aluminio, soja, etc.?