¿Cómo podemos acelerar el estudio / caracterización de la otra mitad poco estudiada de los ~ 20,000 genes codificadores de proteínas en el genoma humano?

El ritmo de la investigación generalmente está determinado por 2 factores principales: 1) dinero y 2) tecnología. Dejemos de lado el dinero para esta pregunta, pero tengamos en cuenta que el dinero de la investigación no solo está limitado, sino que sigue disminuyendo (por favor, escriba a su representante si desea ver más gasto del gobierno en investigación).

La tecnología ha mejorado enormemente y continúa mejorando (y haciéndose más barata) por lo que la parte de secuenciación será la parte fácil. El análisis bioinformático para predecir qué genes y variantes genéticas son importantes para diversas enfermedades (o en el caso del artículo en el que el OP publicó un enlace, el proceso normal de envejecimiento), después de que se secuencian más muestras, será más lento que la secuencia, pero no muy lento tampoco.

Una parte más lenta será tomar las predicciones de los estudios genómicos y traducirlas en información biológica validada y real. Esto normalmente requiere estudios in vitro utilizando líneas celulares, estudios in vivo utilizando modelos animales y, en última instancia, estudios en humanos. Esto es mucho más lento porque requiere un esfuerzo individualizado, gen por gen, en busca de la función, sin mencionar todo el aluvión de ARN potenciales no codificantes que son importantes para la regulación. agregue a eso la capa de epigenética que también controla los procesos celulares y obtendrá la imagen.

Pero la parte más lenta será traducir todos estos descubrimientos en beneficio clínico, particularmente con respecto al envejecimiento. La naturaleza nos quiere muertos: superar eso será muy difícil. Todos los organismos se vuelven senescentes y mueren. Sobrescribir ese programa será muy, muy difícil.

Creo que va a ser lento.

La restricción que no se puede escapar es la necesidad de más datos de alta calidad. Los grandes conjuntos de datos que ya tenemos, son aún demasiado pequeños en varios pliegues. El almacenamiento mejorado de datos, la recopilación de datos y la integración de datos son importantes. Por ejemplo, se ha hablado del potencial de los registros digitalizados del hospital durante varias décadas, pero debe suceder.

Ver: ¿Cuál es el valor de tener una base de datos relativamente grande de genotipos humanos o secuencias genómicas?

Hasta cierto punto, los enfoques de genética inversa que utilizan la edición de genes pueden ser útiles. Pero como se trata de humanos, en el mejor de los casos se limita al cultivo celular y al cultivo de tejidos. Otros enfoques pueden ser útiles para otras especies modelo que pueden ser manipuladas, pero en humanos, inevitablemente tendremos que obtener tamaños de muestra más grandes.

Necesitamos aprovechar nuestro tiempo de manera más efectiva aquí mediante el uso de lenguajes informáticos lo suficientemente potentes como para capturar las múltiples ambigüedades inmanentes en la codificación del plegamiento de proteínas.

El lenguaje Clojure claramente está produciendo algunos resultados sorprendentes, pero no han sido publicados aún, a mi entender.