¿Cómo puede un biólogo molecular pasar de la biología experimental a la computacional?

He trabajado en ambos antes, primero en laboratorio húmedo y luego en computación. En general, encontrará una gran diferencia en la metodología, específicamente la validación.

En el entorno de laboratorio húmedo, supongamos que está haciendo la expresión y purificación de proteínas. Hay muchas maneras de expresar y purificar una proteína, y hay protocolos establecidos en línea. Tienes un flujo de trabajo. A veces puede usar sonicación y, a veces, centrifugación. Solo tiene que asegurarse de registrar cuánto tiempo y con qué intensidad, etc., ya que la sonicación y la centrifugación ya son conceptos bien establecidos. Y cuando usa una columna de purificación, la obtiene de una empresa. La empresa puede tener aspectos de propiedad o marca registrada de su columna que no son de dominio público. Eso está bien, siempre y cuando informe que usó la columna de esa compañía y sepa que está usando la columna según lo previsto. En la mayoría de los casos, no valida rigurosamente cada aspecto de cómo funciona la columna, solo verifica si la proteína se purifica o no. Si no es así, intente usar otra forma, como una etiqueta de afinidad en la proteína.

En el mundo computacional, sí, tienes un flujo de trabajo. La diferencia es que las proteínas serán modelos virtuales basados ​​en experimentos de determinación estructural, y en lugar de técnicas moleculares como PCR, cromatografía, utilizará herramientas computacionales – programas. Pero he encontrado que la principal diferencia cultural entre el laboratorio húmedo y el mundo computacional está en las herramientas: que en informática, no nos gusta un enfoque de caja negra. En el laboratorio húmedo, puede cargar su ADN en una máquina de secuenciación, o su proteína en una máquina de espectrometría de masas, y es posible que no comprenda todos los aspectos de cómo funciona (pero, por supuesto, habrá sido entrenado en sus principios principales). Esto es como conducir un automóvil: uno puede saber cómo conducir, pero es posible que no pueda desmontar el motor y luego repararlo. No importa: los técnicos pueden reparar el secuenciador o la máquina de espectrometría de masas. Solo necesita saber si puede sacar su producto. Ese es un enfoque de caja negra. La máquina es como una caja negra; no sabes exactamente lo que pasa adentro.

Sin embargo, no es para las personas computacionales. No me refiero a saber cómo desmontar y reparar una computadora, me refiero a que no es simplemente suficiente para usar un programa. Como principiante, puede aprender a usar un programa de un tutorial, pero a medida que avanza, no es raro escribir sus propios scripts y programas, y profundizar en el código del programa que está utilizando para modificarlo. para que funcione para tu propio proyecto. En muchas publicaciones de investigación, los grupos de investigación hacen que su código sea accesible en línea para su escrutinio. La ocultación del código está mal vista. Hay un espíritu de ciencia abierta. Esto puede ser útil; Si necesita una secuencia de comandos en particular que se mencionó en un documento en particular, puede enviarles un correo electrónico y la mayoría de las veces, la persona de contacto con gusto lo hará. También puedes mencionarlos como colaboradores. Las entidades comerciales (me refiero a las empresas) tienen sus propios derechos para mantener el secreto en el código que publican como programas, pero esto no representa el mundo de la investigación académica. En la investigación académica computacional, las personas escriben nuevos algoritmos, informan sus resultados, y la única forma de creer que su algoritmo realmente produce la calidad de los resultados que afirman que es es tomar su código y probarlo para ver si funciona como se prometió. Si no es así, entonces podrían haber estado exagerando o reteniendo algunos pasos adicionales que podrían haber tomado inadvertidamente. Además, los escritores tienen que ser abiertos acerca de su código y dejar que otros lo vean para que puedan demostrar que, de hecho, es un código nuevo y no plagiado.

He usado un script de Perl (un lenguaje de programación) que se me proporcionó y que produjo un resultado erróneo que solo se descubrió después de que se completó el proyecto aproximadamente 4/5. El error en el guión fue elegido por alguien que sabía leer Perl. Esto podría haberse evitado si supiera leer Perl yo mismo y hubiera revisado cada línea del guión (relativamente corto). Recuerde Garbage in, Garbage out, pero si su secuencia de comandos es defectuosa, cualquier cosa que ingrese resultará en la basura. A estas alturas, será evidente que existe una presión para comprender el código que está utilizando, incluso si no está escribiendo su propio código, sino solo un estudiante que usa el código de otra persona. Puede ver que hay una diferencia entre esto y el caso de la máquina de secuenciación de ADN / espectrometría de masas: no se espera que conozca la ingeniería mecánica en este último caso.

Por supuesto, descubrirá que puede usar lo que quiera, comer y beber mientras trabaja, tal vez trabajar desde casa a través de VPN para el trabajo computacional. Puede deshacer las cosas con solo presionar el botón, a diferencia de un laboratorio mojado. Desafortunadamente, también puede eliminar todo presionando el botón. No tiene que preocuparse de que un pequeño temblor de sus dedos cause algo de contaminación. Sin embargo, debe preocuparse de que un solo cero adicional en su código desperdicie 4 meses de trabajo, especialmente si ese cero adicional se agregó justo al comienzo de 4 meses. También experimentará que su trabajo probablemente será considerado con sospecha por los biólogos experimentales, a menos que sus resultados puedan coincidir con los datos experimentales reales, lo cual es realmente difícil de hacer, ya que no puede simular todas las condiciones en su computadora. Sin embargo, dependiendo de la escala del cálculo, es posible que pueda generar conclusiones más rápido que en un laboratorio húmedo (sin embargo, si publicar es otra cosa). El laboratorio húmedo tiene sus momentos difíciles; computacional tiene un sabor diferente, solo asegúrese de qué sabor de sufrimiento preferiría, ¿sí? ¡Espero que esto ayude!

La transición de la biología molecular a la biología computacional puede parecer desalentadora al principio, pero con paciencia y esfuerzo constante sería una transición fácil.

Yo recomendaría tomar la siguiente estrategia:

  1. ¡Comienza despacio y no te apresures! La informática tiene un paradigma de pensamiento completamente diferente. Valora la lógica bien diseñada sobre los datos bien recopilados e inferidos. Esto puede tomar algo de tiempo. ¡No se apresure!
  2. Comience con cursos en línea sobre informática y programación básica. Coursera tiene muchas especializaciones dedicadas a diferentes aspectos de la programación. Recomiendo tomar Python para todos y Python para ciencias genómicas. Te preparará bien con herramientas para usar en el futuro.
  3. Concéntrese en python y codifique con la mayor frecuencia posible. Si no se siente cómodo con el entorno Unix, que es muy común en la programación, use Anaconda. Es gratis y funciona muy bien en entornos Windows y es muy fácil de usar. Descargar Anaconda ahora!
  4. Después de que te sientas cómodo con la programación después de seguir los pasos anteriores. Pase a la especialización Coursera de Bioinformática por UCSD. Tienen un gran contenido y un entorno extremadamente solidario. Puede descubrir a muchos como usted en los foros de discusión.
  5. Tome una clase basada en proyectos en biología computacional si todavía está en la universidad. Esto realmente te ayudará a obtener una experiencia manos libres de calidad.
  6. ¡Práctica! Utilice ROSALIND | Problemas | Lugares para practicar problemas en bioinformática. Tienen una gran colección de problemas que van desde principiantes hasta avanzados.

¡Espero que tengas éxito en tu esfuerzo! ¡La mejor de las suertes!

Mis recomendaciones se basan en mis propias experiencias. Hice mi maestría en Química Medicinal donde trabajé en síntesis, pero durante ese tiempo también me interesé en la bioinformática farmacéutica. Actualmente soy doctoranda en el grupo de Bioinformática Farmacéutica en la Universidad de Friburgo, Alemania.

Creo que trabajó en un laboratorio húmedo y que a estas alturas podría haber tenido algunas ideas de que con la biología computacional puede resolver este y este problema que no podría hacer a través de experimentos de laboratorio húmedo. Por ejemplo, desea ilustrar el mecanismo de las interacciones de proteínas de tal y tal y es difícil con los experimentos de laboratorio húmedo. Ahora que desea resolver este problema, hay muchas maneras de seguir adelante con las herramientas y técnicas computacionales disponibles actualmente.

Recomendaré identificar primero su problema de prueba y leer sobre la forma en que puede resolverlo. Luego aprende y prueba ese método. Esto le dará experiencia práctica con herramientas y tecnología e intentará completar algunos proyectos pequeños.

Si bien esto le dará perspectivas más amplias y lo ayudará a decidir si realmente desea continuar en este campo. También se agregará a su CV y ​​lo ayudará a llamar la atención de su supervisor potencial para el doctorado.

¡Espero que esto ayude!

Podría buscar una posición de doctorado en un grupo mixto para investigar biología. Solo tiene que saber que hay tantas cosas que necesita aprender de donde sea que pueda y aprender todo durante un doctorado es algo así como “la forma difícil”. Sin embargo, muchos lo han hecho antes que tú.

Si ingresa a la academia, debe elegir un campo, conocer los protocolos de alto rendimiento, aprender métodos de análisis de datos y leer documentos en el campo. Sea muy cuidadoso con el aprendizaje de los enfoques computacionales básicos, los métodos estadísticos más importantes y aprenda algunos lenguajes de programación. No puede simplemente presionar Intro como la gente de laboratorio húmedo a veces espera, el trabajo computacional es intelectualmente extremadamente intenso, pero definitivamente no es aburrido y mucho más rápido de la idea al resultado. Sin embargo, creo que lleva más intentos y la interpretación de los resultados puede ser extremadamente difícil. Cuando tenga resultados, necesitará personal de laboratorio húmedo para validarlos y generar datos, también necesitará personal de laboratorio húmedo. Entonces es interdisciplinario y muy colaborativo. Probablemente tomará años antes de que pueda hacer una investigación computacional seria e independiente, por lo que necesita buenas personas a su alrededor.

Te puedo decir cómo lo hice.

Aprendí programación por primera vez en BASIC cuando tenía ~ 10 años, pero nunca la aprendí. Solo a los 18 años tomé dos clases de C / C ++ como asignaturas optativas en la universidad (otras opciones no son demasiado interesantes).

Hice mi BSc en Bioquímica y MSc en Oncología.

En este momento, aunque mi parte experimental era bastante sólida, paso mucho tiempo aprendiendo sobre las técnicas que existen en biología computacional. Por lo general, paso la mitad del tiempo leyendo la sección de Materiales y métodos para esto.

Hice mi doctorado puramente computacional y mi supervisor me entrenaba uno a uno casi a diario. Por lo general, teníamos 2–3 reuniones por día para que yo aprendiera todo de la manera correcta.

Leí sobre algoritmos básicos y uso stackoverflow ampliamente. Por supuesto, trabajé duro. Lo que me ayudó en ese momento fue en realidad las lecciones de C / C ++ que tuve hace años, ya que me ayudó a escribir código estructurado.

Y tuve suerte de haberlo disfrutado. No sobreviviré si lo odiara.

Es factible pero hay que amarlo. ¡Buena suerte!