¿Cuáles son los prerrequisitos matemáticos para estudiar el aprendizaje automático?

En lugar de preguntar QUÉ, creo que también es importante saber POR QUÉ.

QUÉ: Álgebra lineal POR QUÉ: la mayor parte del aprendizaje automático que hacemos, trata con escalares y vectores y matrices : vectores de características, matrices de pesos, etc. Haces multiplicaciones de matrices de vectores como, por ejemplo, en regresión logística, redes neuronales … O haces matrices transponer primero y luego multiplicar (por ejemplo, por error, propagación hacia atrás en redes neuronales). A veces es necesario agrupar datos de entrada, tal vez utilizando técnicas de agrupación espectral, lo que requiere que sepa cuáles son los valores propios , los vectores propios son. A veces necesita tomar inversas de matrices, por ejemplo, al calcular la inversa de la matriz de covarianza para ajustar un gaussiano distribución. Así que ahora sabes POR QUÉ necesitas Álgebra Lineal.

QUÉ: Teoría de la optimización POR QUÉ: ¿Cómo entrenas los pesos de tu modelo para minimizar el error de entrenamiento? Respuesta: optimización. Es posible que necesite saber cómo tomar derivadas de la función de pérdida con respecto a algún parámetro para poder llevar a cabo la optimización del descenso de gradiente . Es posible que necesite saber qué significan los gradientes . ¿Qué son los hessianos si estás haciendo una optimización de segundo orden como LBFGS ? Es posible que necesite aprender cuáles son los pasos de Newton, tal vez para resolver búsquedas de líneas . Deberá comprender las derivadas funcionales para comprender mejor los árboles de decisión potenciados por gradiente. Deberá comprender las propiedades de convergencia de varios métodos de optimización para tener una idea de qué tan rápido o lento se ejecutará su algoritmo.

QUÉ: Probabilidad y estadística POR QUÉ: Cuando estás haciendo aprendizaje automático, buscas principalmente algún tipo de distribución. ¿Cuál es la probabilidad de una salida dada mi entrada? ¿Por qué necesito esto? Cuando su modelo de aprendizaje automático predice (asigna probabilidades) lo suficientemente alto para la observación conocida, sabe que tiene un buen modelo a mano. Es un criterio de bondad. Las estadísticas le ayudan a contar bien, normalizar bien, obtener distribuciones , averiguar la media de su función de entrada, su desviación estándar . ¿Por qué necesitas estas cosas? Necesita medios y variaciones para normalizar mejor sus datos de entrada antes de introducirlos en su sistema de aprendizaje automático. Esto ayuda a una convergencia más rápida (concepto de teoría de optimización).

QUÉ: Procesamiento de señal POR QUÉ: Por lo general, no alimenta la entrada sin formato a sus sistemas de aprendizaje automático. Haces algún tipo de preprocesamiento. Por ejemplo, le gustaría extraer algunas características de la señal de voz de entrada o una imagen. Ahora, para extraer estas características necesita conocer las propiedades de estas señales subyacentes. El procesamiento de señales digitales o el procesamiento de imágenes lo ayudarán a adquirir experiencia. Estaría en una mejor situación para saber qué función de extracción funciona y qué no. Desea aprender qué es una transformación de Fourier porque tal vez le gustaría aplicar eso a la señal de voz o tal vez aplicar una transformación de coseno discreta a las imágenes antes de usarlas como características para su sistema de aprendizaje automático.

Es posible que también desee leer esto como respuesta a la pregunta: “¿Cómo aprendo el aprendizaje automático, la inteligencia artificial y el procesamiento del lenguaje natural”?

¿Cómo se consideran los institutos de investigación individuales de la Sociedad Max Planck en todo el mundo? ¿En los Estados Unidos?

¿Cómo difieren los métodos de investigación de la metodología de investigación?

¿Cuáles son los temas actuales y actuales para el trabajo de investigación en algoritmos?

¿Dónde encontraré las mejores oportunidades de investigación para la investigación biotecnológica a nivel mundial?

Si los vehículos de hidrógeno van a ser una realidad en los próximos 10 años, ¿qué compañías están trabajando en la infraestructura para almacenar hidrógeno para alimentarlos / reabastecerlos?

¿Dónde puedo obtener un resumen de las principales leyes federales de EE. UU. Aprobadas por año?

TL; DR: Sí, es posible llegar a aplicaciones útiles sin “mucha” matemática. Pero hay limitaciones.

La respuesta de Tom Seward es genial. Intentaré agregar un poco:

Los problemas de la ciencia de datos vienen en varias formas y tamaños. Estoy diciendo “ciencia de datos” porque pediste “aplicaciones útiles”. Para manejar un problema de ciencia de datos, debe realizar las siguientes etapas:

Defina su negocio / pregunta de investigación.
Recopilar y combinar datos adecuados.
Limpia los datos.
Modele los datos utilizando el aprendizaje automático.
Integre la parte de aprendizaje automático en la producción.
Comunicar los resultados.

Como puede ver, hay una gran parte del proyecto antes de llegar al aprendizaje automático, y otra parte importante después del aprendizaje automático.

Ahora, cuando use el aprendizaje automático en este contexto, debe saber de antemano lo que está tratando de lograr, por ejemplo, poner una instancia en una de varias clases predefinidas (clasificación), agrupar datos en instancias similares (agrupación) u otra tarea. Algunos libros que ayudan a enmarcar un problema de aprendizaje automático son http://www.amazon.com/Programmin … y
http://www.cs.waikato.ac.nz/ml/w …
Ambos libros pueden entenderse utilizando principalmente matemáticas elementales.

Las siguientes herramientas de código abierto le permiten ejecutar muchos algoritmos de aprendizaje automático sobre su problema y comparar los resultados.
No se necesitan matemáticas, en algunos casos ni siquiera se necesita programación:
http://scikit-learn.org/stable/ (en Python)
http://topepo.github.io/caret/in… (en R)
http://www.cs.waikato.ac.nz/ml/w… (en Java)
https://www.knime.org/
https://rapidminer.com/

Como dijo Tom, cuando un algoritmo se comporta mal o no se cumplen los supuestos, es cuando necesitas profundizar más en los detalles sangrientos. En orden relativo de importancia, IMO, estos son:
a. probabilidad.
si. álgebra lineal.
C. Estadísticas.
re. Precálculo.
mi. mejoramiento.

La teoría de gráficos es útil cuando su objeto de estudio es un gráfico (por ejemplo, una red social) o su modelo de ML es un gráfico (por ejemplo, una red bayesiana, HMM, LDA o CRF). En otros casos, está exento de esta parte de las matemáticas.

Yuval Feinstein

More Interesting

¿Cuáles son las desventajas de la investigación con métodos mixtos?

Pregrado en ingenio final sobre investigación, estropeo algo todos los días, estoy perdiendo la moral. ¿Qué hacer? ¿A alguien más le pasa esto?

¿Cómo puede ser un asistente de investigación con un profesor en un colegio comunitario ayudarlo a ingresar a una mejor universidad al final de sus dos años de CC?

¿Qué tan interesante es la investigación fotónica en términos de pensamiento 'duro'?

¿Cuál es la investigación más interesante en Yale?

¿Cuáles son las principales instituciones de investigación en biología en la India?

¿Cuáles son las limitaciones potenciales de la investigación de mercado en línea?

¿Por qué Manu Saale se convirtió en el CEO de Mercedes-Benz Research and Development India?

¿Por qué hay tantos países interesados en realizar investigaciones en la Antártida?

¿Puede proporcionar algunas sugerencias para temas de proyectos de investigación en finanzas?