¿Cómo y por qué hizo la transición de la tecnología de consumo a la investigación médica? La Ciencia y la Tecnología mejoran el futuro

Cuando era niño, estaba bastante interesado en cómo funciona el cerebro y me gustaba leer libros de texto, así que en realidad sabía bastante de biología molecular y celular y neurociencia cuando iba a la universidad. De hecho, una de las razones por las que elegí asistir a Harvard fue su programa Mind Brain Behavior, aunque terminé concentrándome en Matemáticas. En la universidad, tomé un curso de neurociencia computacional [1] y me di cuenta de que las herramientas para medir el cerebro eran bastante primitivas, por lo que la acción era realmente estadística, no neurociencia. Supuse que algún día volvería a la neurociencia cuando las herramientas mejoraron [2].

En realidad intenté volver a la neurociencia dos veces.

La primera vez fue cuando estaba en Facebook. Una de las principales razones por las que me uní a Facebook fue para obtener la residencia en California para poder pagar la tarifa estatal para el programa de posgrado en estadísticas de Berkeley, Stanford o UCLA. Entonces, solicité los programas de estadísticas unos meses después de mi trabajo en Facebook y hablé sobre bioinformática en mi ensayo de admisión [3]. Afortunadamente, Adam D’Angelo decidió regresar a Facebook aproximadamente al mismo tiempo que me iba a ir a un programa de estadísticas; Adam fue la primera persona que conocí en Facebook que entendió lo que estaba sucediendo con los datos y me convenció de quedarme por unos años. Además, Stanford me rechazó.

La segunda vez fue cuando salía de Facebook en 2008. Conocí a Sebastian Seung en SciFoo y él me invitó a visitar su laboratorio en el MIT. Tuve una visita maravillosa, asistí al segundo “Día de Connectome” [4] y aprendí a reconstruir un diagrama de cableado a nivel de sinapsis del cerebro a partir de imágenes en serie de caras de bloque. Decidí que podría trabajar en este problema en una fecha posterior y que era crítico iniciar Cloudera en ese momento.

Casi al mismo tiempo que conocí a Sebastian, conocí a Stephen Friend y Eric Schadt. Estaban en el proceso de dejar a Merck y convertir a su equipo en una organización precompetitiva de modelado de enfermedades sin fines de lucro llamada Sage Bionetworks. Stephen me pidió que diera un discurso de apertura [5] en su primera conferencia; luego, me pidió que me uniera a la Junta de Directores. A través de Sage comencé a aprender más sobre los desafíos de gestión de datos en genómica.

Luego pasé de la tecnología de consumo (Facebook) a la tecnología empresarial (Cloudera). En Cloudera, tenemos muchos clientes en el sector de la atención médica [6], por lo que pude aprender un poco sobre la investigación médica de nuestros primeros clientes de atención médica y ciencias de la vida.

En 2012, hice la transición de mis tareas operativas en Cloudera a Quora User y Josh Wills y estaba interesado en hacer algo de ciencia de datos nuevamente. Eric había sido nombrado recientemente para un gran puesto en Mount Sinai en Nueva York y me entusiasmó el potencial de su trabajo allí para reducir la carga global de la enfermedad. Los líderes de Cloudera y Mount Sinai tuvieron la amabilidad de llegar a un acuerdo en el que pudiera conservar mi empleo en Cloudera mientras construía un laboratorio en Mount Sinai [7].

Ese primer año permanecí bastante ocupado con Cloudera, ya que estábamos buscando un CEO para llevar a la compañía al siguiente nivel. Contratamos a Tom en el verano de 2013 [8]. Una vez que Tom se instaló, contraté a mi primer miembro del laboratorio en septiembre de 2013 y pasé mi primer año visitando a investigadores y médicos en Mount Sinai, leyendo libros y revisando documentos, y experimentando con software de código abierto. Después de explorar algunas direcciones de investigación diferentes, recientemente hemos elegido centrarnos principalmente en la inmunoterapia contra el cáncer.

Intentaré escribir mis lecciones aprendidas sobre biomedicina desde septiembre de 2013 en otra respuesta.

[1] Aquí está mi proyecto final de ese curso: El paradigma espacio-estatal

[2] Cómo el cerebro calcula la mente

[3] Texto completo de mi ensayo de admisión:

Estoy profundamente interesado en la extracción de información utilizable de grandes volúmenes de datos. Mi trabajo escolar se centró en técnicas geométricas y estadísticas en el análisis de datos, con un énfasis particular en la neurociencia computacional y la teoría del aprendizaje estadístico. Mi trabajo profesional ha implicado la aplicación de técnicas computacionales para el análisis de datos a gran escala en los campos de las finanzas e internet. Me gustaría obtener un título de maestría terminal para consolidar mi conocimiento teórico y aplicado de estadística, al tiempo que amplío mi rango de experiencia para incluir bioinformática. Creo que los conocimientos alcanzados al estudiar técnicas teóricas y aplicadas en las disciplinas de finanzas, internet y bioinformática me prepararán bien para una carrera profesional en el campo que elija.

Estoy financiera, profesional y académicamente preparada para estudios de posgrado en Estadística en Stanford.

Antes de la universidad, trabajé con un profesor de nuestra universidad local en varios problemas de teoría de grafos sin resolver y asistí a una conferencia sobre el tema. Mientras estudiaba en Harvard, tomé varios cursos de posgrado en geometría, probabilidad y estadística. Pasé dos veranos en Harvard asistiendo a seminarios en el departamento de matemáticas, produciendo un artículo sobre teoría de grafos topológicos y otro sobre el uso de la geometría diferencial en la teoría del aprendizaje estadístico. Serví como CA para un curso sobre probabilidad (Math 191) y para un curso sobre análisis funcional y optimización (Math 116). Completé varios trabajos como proyectos finales para cursos de posgrado, sobre temas como máquinas de vectores de soporte, problemas inversos, curvas y superficies principales y procesamiento de señales neuronales. Participé en un pequeño seminario en el que construimos un reconocedor de voz funcional. Pude hacer una contribución novedosa a nuestro modelo de reconocimiento de voz que resultó en mejoras significativas en la velocidad y precisión de nuestro reconocedor. Escribí una tesis sobre teoría del aprendizaje estadístico bajo la supervisión de Tomaso Poggio, un destacado investigador del MIT. Trabajar con los estudiantes de posgrado y posdoctorados del Prof. Poggio fue una experiencia académica increíble y muchos de mis intereses de investigación actuales provienen de mi trabajo en el MIT. Solicité y asistí a un taller SAMSI para estadísticos de pregrado. Después de graduarme, asistí a una conferencia en Israel sobre las conexiones entre la geometría y el análisis funcional, donde muchos de los autores que cité en mi tesis impartían talleres (incluidos Michel Talagrand y Michel Ledoux). Asistí a las reuniones estadísticas conjuntas de la ASA en Seattle este año. Soy miembro de la ASA.

Si bien la mayor parte de mi trabajo de pregrado fue teórico, mi trabajo profesional se ha centrado en aplicaciones de estadísticas. He estado programando regularmente desde los ocho años, y aunque no seguí muchos cursos de ciencias de la computación en la universidad, trabajé como ingeniero de software y analista de seguridad de redes mientras estaba en la universidad. Mi primer puesto después de la universidad fue con Bear Stearns, una firma financiera. Implementé algoritmos de fijación de precios para derivados financieros complejos para sus oficinas de intercambio de divisas e hipotecas. También mantuve y mejoré sus modelos para pronosticar las tasas de interés. Se requirió una comprensión profunda de los procesos estocásticos, las ecuaciones diferenciales estocásticas, la solución numérica de las ecuaciones diferenciales y las estadísticas para mi trabajo en Bear, así como la capacidad de implementar los modelos en C, C ++, VBA y Python. Comencé mi trabajo en Bear como pasante de verano, pero después de implementar un algoritmo de fijación de precios en el que el tipo de cambio subyacente se modeló con dos procesos Levy, me ofrecieron un puesto de tiempo completo en la empresa. Fui la primera persona en ocho años en recibir un puesto de tiempo completo en el grupo cuantitativo directamente de un programa de pregrado. Mis compañeros de trabajo eran principalmente ex profesores de quienes aprendí mucho sobre la investigación en un entorno corporativo. También construí y mantuve una wiki para la difusión del conocimiento entre los quants en Bear.

La primavera pasada, me mudé a Facebook, una empresa de redes sociales en línea. En Facebook, he usado C ++ y Python para construir la infraestructura de datos requerida para mover cientos de gigabytes de datos todas las noches y procesarlos para usarlos en el análisis. Utilizo R para hacer un análisis estadístico de los datos una vez que se han eliminado adecuadamente. Recientemente fui ascendido a Director de Data Insight y ahora lidero un equipo de seis analistas de datos. Nuestro trabajo abarca todo el campo de la estadística. Utilizamos análisis semántico latente probabilístico y técnicas bayesianas para la segmentación de usuarios. Utilizamos una variedad de técnicas desde la teoría de gráficos y el análisis de redes sociales para analizar las estructuras de gráficos subyacentes a nuestro sitio web. Diseñamos experimentos para mejorar nuestra orientación de anuncios y retención de usuarios, y realizamos pruebas de importancia en los resultados. Creamos visualizaciones únicas de los datos que recopilamos. Mi trabajo en Facebook es menos teóricamente exigente que mi trabajo en Bear, pero requiere facilidad en una gama más amplia de herramientas estadísticas. También tuve que lidiar con los desafíos de realizar análisis en varios terabytes de datos. Traje el proyecto de código abierto Hadoop a Facebook. Administro un clúster de 50 computadoras que ejecuta el sistema de archivos distribuido de Hadoop y uso las capacidades de MapReduce de Hadoop para distribuir tareas de análisis de datos en muchas computadoras. Podemos realizar análisis complejos en varios terabytes de datos en minutos con el marco que he construido.

Mi carrera profesional me ha expuesto a las finanzas y a Internet, dos de las principales áreas donde las estadísticas se aplicarán en el futuro. Antes de comprometerme con cualquiera de los dos campos, me gustaría asistir a Stanford para aprender más sobre el campo de la bioinformática y evaluar cuál de los tres me gustaría profundizar más. También me gustaría fortalecer mi formación teórica para permitirme seguir aplicaciones de estadísticas aún más sofisticadas en entornos de datos cada vez más grandes.

[4] Aquí hay una foto de los asistentes ese día. Estoy detrás del cabello de Sebastian.

[5] Mi charla todavía está en línea en Sage Commons: Jeff Hammerbacher, Cloudera

[6] De hecho, si disfrutas el argot de relaciones públicas, emitimos hoy un “comunicado de prensa de ímpetu” sobre nuestro progreso en el cuidado de la salud: la adopción prevalente de Cloudera Enterprise Data Hub en la atención médica y las ciencias de la vida refleja la transformación de la industria. Algunos clientes a los que podemos hacer referencia incluyen el Broad Institute, Cerner, Children’s Healthcare of Atlanta, Premera Blue Cross, Premier y RelayHealth (una compañía de McKesson).

[7] Hadoop se encuentra con la asistencia sanitaria en una nueva asociación

[8] Cloudera nombra nuevo CEO; Mike Olson ahora presidente y director de estrategia

investigación médicapregunta de la encuestaTransiciones profesionales