¿Cómo puede un físico entrar en la ciencia de datos? Leí sobre puestos bien remunerados que quedan sin cubrir. ¿Pagará bien mientras me pongo al día? ¿Podría estar aportando algoritmos útiles, visualizaciones de datos o resolviendo problemas importantes de inmediato?

Tengo algunas sugerencias, según mi experiencia:

  1. Si tiene o está terminando un doctorado, considere hacer el Programa Insight Data Science Fellows. Este es esencialmente un programa de trabajo en red / colocación de trabajo que podría hacer que su carrera cambie muy fácilmente, pero obtener un puesto en este programa es competitivo.
  2. Si no puede entrar (o no quiere hacerlo) en el Programa Insight, use la lista de compañías para las que reclutan como punto de partida para su búsqueda de empleo. Si su currículum es menos que estelar, busque puestos en empresas más pequeñas y menos prestigiosas. No hay escasez de científicos de datos que se aplican a empresas de renombre como Google o Facebook.
  3. Haga una pasantía (pagada). Es mucho más fácil poner el pie en la puerta durante unos meses que recibir una oferta de trabajo a tiempo completo. La pasantía también muestra que has invertido un esfuerzo real en tu carrera profesional.
  4. Red. Este es bastante obvio, pero la mejor manera de obtener una oferta de trabajo es a través de una referencia. También es una excelente manera de conocer trabajos de los que de otro modo no se enteraría.
  5. Si la búsqueda de un lugar para aprender en el trabajo no funciona, es posible que deba aprender las habilidades por su cuenta para probar sus habilidades de programación y estadísticas. Tome el curso sobre aprendizaje automático. Hazlo bien en una competencia de Kaggle. Haga una demostración interesante de big data (enlace a Hacker News). Poner un código en GitHub. Contribuir a un proyecto de código abierto.

Hice una pasantía en una empresa de tecnología avanzada en mi último año de posgrado y ahora elijo entre varias ofertas de trabajo.

Ahora es un buen momento para hacer la transición de la física a la ciencia de datos. El Programa Insight Data Science Fellows parece agradable, pero no cuente con ello. Es altamente selectivo, ya que casi todos los becarios provienen de las escuelas de la Ivy League (o cercanas), y mi temor es que los científicos de datos potenciales soliciten ese programa y esperen en lugar de trabajar en formas más seguras para convertirse en científicos de datos.

Mi consejo para hacer la transición de la física a la ciencia de datos:

  1. Probablemente su experiencia esté más cerca de Data Science de lo que cree, con las habilidades que ha aprendido cubriendo muchas de las competencias básicas que necesitará.
  2. Cada campo de Física y cada proyecto tiene sus propias fortalezas y experiencias para ofrecer. A medida que aprenda más sobre Data Science, y los detalles de las habilidades y experiencias que se valoran, podrá ajustar su currículum en algo que le permitirá obtener múltiples entrevistas.
  3. Repase su programación. Esto incluye regresar y aprender más sobre los fundamentos, y trabajar a través de problemas de práctica. Tendrá una sección de programación (o varias) durante cada proceso de entrevista, y debe tener la mentalidad para abordar tanto los problemas para llevar a casa como el pseudocódigo de pizarra.
  4. Red. Habla con tus compañeros de clase y compañeros de trabajo. Averigüe si alguien de su escuela ha hecho la transición e intente obtener consejos de ellos o posibles conexiones. Las redes de antiguos alumnos son más grandes de lo que piensas, y las asociadas con los principales experimentos Astro o HEP son aún más grandes, y las de los laboratorios nacionales aún más grandes.
  5. Aprende las herramientas del oficio. Descargar R o Julia. Juega con los paquetes Pandas y scikit-learn en Python. Trabaje a través de un problema de Hadoop Streaming de muestra para que al menos conozca los conceptos básicos de Map / Reduce. Un poco de retoques ayuda mucho a hablar y hablar.
  6. Compite en una competición de Kaggle. Una buena presentación se ve maravillosa en el currículum, pero incluso si sus resultados no son competitivos, le brindará una experiencia valiosa y le ayudará a tener una perspectiva sobre algunos de los tipos de problemas y procesos de datos que puede enfrentar en una carrera de Ciencia de datos.
  7. Si tiene un doctorado en Física o está progresando hacia uno, entonces no creo que sea necesaria una pasantía. Si vienes directamente de pregrado, una pasantía será muy valiosa.
  8. Regístrese en GitHub y contribuya a proyectos o publique su propio trabajo. Su cuenta de GitHub es equivalente a la cartera de un artista, diseñador o escritor.
  9. Hay muchos trabajos de Data Science que son buenos para un físico, y cualquiera puede obtener una oferta en algún lugar si se esfuerza lo suficiente, pero eso no significa que pueda flotar sin hacer su debida diligencia. Aprenda sobre el trabajo, el campo, la compañía y sepa cómo su extensa investigación lo califica para ese trabajo específico.

Fui A2A-ed aquí, pero esta pregunta ya tiene varias respuestas geniales. De las recomendaciones ya dadas, me gustaría destacar especialmente una: ensuciarse las manos con algunos proyectos de ciencia de datos . Idealmente, lo haría utilizando herramientas comunes del comercio como Python / R y SQL. Creo que esto tendría el ROI más alto para manejar entrevistas de ciencia de datos, al tiempo que le daría algo a lo que señalar como evidencia de su capacidad para generar resultados.

Intentaré agregar algunas sugerencias que no he visto enfatizadas en las otras respuestas:

  • Explore el aprendizaje automático: en contraste con otros fundamentos de la ciencia de datos (por ejemplo, estadísticas básicas, diseño experimental, programación), el aprendizaje automático no aparece con tanta frecuencia en la investigación física. Debe familiarizarse con las clases comunes de modelos, diversas métricas de tasa de error, procedimientos de validación cruzada y posibles dificultades (p. Ej., Sobreajuste y falta de ajuste). Stephan Hoyer ya aludió a esto en su (excelente) respuesta, pero el curso Coursera de Andrew Ng es un excelente lugar para comenzar.
  • Comprenda por qué está haciendo la transición a la ciencia de datos: es casi seguro que se le preguntará por qué está cambiando de campo, y ayuda tener una razón convincente y sincera. Debería poder explicar esa razón claramente.
  • Estar familiarizado y entusiasmado con el producto en el que estará trabajando: a las empresas les gusta cuando saben algo sobre ellos y su misión. Además, si usa un producto, tendrá intuiciones más fuertes al respecto; Estas intuiciones guiarán su trabajo y, en consecuencia, será más valioso para la empresa.
  • Comprenda los tipos de métricas que a las personas les interesan en su industria objetivo: las métricas en las que paso mis días pensando ahora son naturalmente muy diferentes de las que importaban para estudiar la localización de Anderson. No hice suficiente de esto antes de la entrevista, pero habría sido útil leer sobre las métricas que las empresas usan para rastrear su progreso y los tipos de factores que pueden impulsar las fluctuaciones en estas métricas.
  • No se desanime por el rechazo: hay muchas oportunidades en este campo en este momento, pero la ciencia de datos significa cosas muy diferentes en diferentes compañías, y no todas las oportunidades coincidirán con su conjunto de habilidades. Por ejemplo, algunas empresas muy pequeñas podrían no tener el tiempo para invertir en ayudar a un físico a hacer la transición a un nuevo campo. Es posible que necesiten personas con experiencia que requieran poco o ningún tiempo de aceleración. Sin embargo, si está atento a las oportunidades, persiste en buscarlas y aprende del proceso de la entrevista en sí, existe una muy buena posibilidad de que llegue a un lugar emocionante.

En primer lugar, iría con lo que mencionaron Stephan Hoyer y Jessica Kirkpatrick. Brindan consejos claros y sólidos: aprenda idiomas estándar, aprenda sobre bases de datos / infraestructura de datos, repase las estadísticas, obtenga tanta experiencia como sea posible a través de pasantías o becas, y más. Mi sugerencia, que fácilmente podría ser otra viñeta en la lista de Stephan, sería unirse a una gran empresa que tenga un equipo de análisis de datos.

He leído de algunas fuentes, me olvido de dónde, pero en general estoy de acuerdo con esto, que aprenderás mucho más como novato en una gran empresa que ya tiene un equipo de análisis de datos en lugar de en una pequeña startup donde estás El jefe científico de datos / experto. Con un equipo de análisis de datos en el lugar, no solo habrá muchos datos con los que luchar, sino también muchos socios con los que puede “etiquetar” los datos para forzar su envío.

Puedes probar suerte en las competiciones de http://Kaggle.com en tu tiempo libre (aunque he oído que las tablas de clasificación actualizadas regularmente de las competiciones tienen una manera de involucrar mucho más a los competidores, especialmente si a uno le va razonablemente bien).

Hacer un buen trabajo consistentemente podría abrir puertas.

Mucha prensa en Kaggle en los últimos 1-2 años le permitirá obtener más antecedentes sobre sus competiciones.

He escrito algunas publicaciones de blog sobre este tema. Fui astrofísico y pasé a la ciencia de datos en el último año:

Astrónomo a Científico de Datos
Astronomía vs. Ciencia de datos

Espero que estos sean útiles!
Jessica

¡Tienes todas las excelentes respuestas anteriores! Pero también puede consultar otra experiencia aquí en esta página y las referencias en ella. Espero que sea útil. ¡Buena suerte!

Espacio reservado hasta el año que viene