Dos razones principales:
- Con un polinomio tiene que pensar explícitamente y codificar todos los términos e interacciones de orden superior, mientras que con una red neuronal, es una representación mucho más compacta y concisa donde “todo” en lo que tiene que pensar es el tipo de funciones de activación en cada capa y la topología de la red, que generalmente está codificada por algunas variables significativas como la cantidad de capas ocultas, la cantidad de nodos por capa, etc.
- Los polinomios de alto orden son generalmente menos confiables cuando se extrapolan e interpolan que las redes neuronales. Esto puede ser problemático cuando no tienes suficientes datos de entrenamiento en relación con tu número de términos polinómicos.
Para un ejemplo de (1), digamos que tiene tres variables de entrada o regresores [matemática] x_1, x_2, x_3. [/ Matemática] Con la regresión polinómica, necesita codificar explícitamente cada uno de los términos de orden superior, algunos de los cuales pueden Ni siquiera estar presente en la función. Por ejemplo, incluso para representar un polinomio arbitrario de segundo orden, deberá codificar explícitamente [matemática] x_1, x_2, x_3, x_1 ^ 2, x_2 ^ 2, x_3 ^ 2, x_1 x_2, x_1 x_3, x_2 x_3 [/ matemáticas]
Crece rápidamente a medida que aumenta el grado.
- ¿Es posible ingresar a Oxford para la informática y las matemáticas sin una pasantía pero excelentes calificaciones?
- ¿Qué es un fractal?
- ¿Cuál es una explicación intuitiva de por qué la función de castor ocupado crece tan rápido?
- ¿Qué es la interpolación numérica?
- Cómo escribir un argumento en forma simbólica
Dicho esto, hay argumentos en contra de ambos, y hay momentos en los que desearía utilizar polinomios en redes neuronales. Por ejemplo, si desea comprender los tipos de relaciones de las variables de entrada con las variables de destino. Pero incluso eso está nublado con el hecho de que la colinealidad múltiple a menudo puede hacer que los coeficientes que salen de la regresión sean difíciles de interpretar.
Otro argumento en contra es que, dependiendo de la función de pérdida que utilice, la regresión polinómica es típicamente convexa y las redes neuronales no lo son. Por lo tanto, evitar los mínimos locales no es un problema con la regresión polinómica como lo es con las redes neuronales, lo que hace que la optimización de la función sea parte del problema más confiable con los polinomios. Sin embargo, esto ha sido un problema menor ya que la optimización de la red neuronal se ha vuelto más madura.
Por supuesto, use lo que funcione mejor después de hacer la validación adecuada.