¿Cuál es la prueba matemática de que el método de mínimos cuadrados penaliza / magnifica errores más grandes?

No estoy seguro de si esto es lo que está buscando, pero la forma más sencilla de verlo es utilizando los derivados de las funciones de costo. Veamos una función realmente simple, la distancia al cuadrado a un punto objetivo [matemática] c [/ matemática]

[Matemáticas] f_2 (x) = (x – c) ^ 2 \ implica \ frac {df_2} {dx} (x) = 2 (x – c) [/ matemáticas]

La derivada crece linealmente con la distancia al objetivo, por lo que los puntos más alejados del objetivo tienen un efecto mayor cuando se trata de minimizarlo. Compare esto con la norma L1:

[matemáticas] f_1 (x) = | x – c | \ implica \ frac {df_1} {dx} (x) = \ mathrm {sign} (xc) [/ math]

Entonces la derivada es constante con respecto a la distancia al objetivo. Por lo tanto, los errores más grandes tienen el mismo efecto en el costo que los más pequeños. Es por eso que la gente considera que el L1 es más ‘robusto’. También se puede hacer con los objetivos de los errores más grandes han disminuyendo efecto sobre el costo, pero entonces se obtiene funciones no convexas y los que son más de un dolor de optimizar.

MatemáticasPruebas

Related Content

Si ejecuta un camino a una velocidad constante de 3.5 millas por hora. ¿Qué tan lejos viajas en 3.2 horas?

¿Hay algo malo con esta prueba de que 0 = 1? 0 = 1; 0 ^ 0 = 1 ^ 0

¿Qué le puedo hacer a mi cerebro para poder ser un buen matemático?

Si [matemática] x ^ 2 = x-1 [/ matemática], entonces ¿qué es [matemática] x [/ matemática] que no sea [matemática] x = \ sqrt {x-1} [/ matemática] ¿Tiene alguna solución? ?

¿Cuál es la diferencia entre una calculadora gráfica CAS y una calculadora gráfica no CAS?

¿Cuál es la derivada de arcsin (x / a)?

¿Saltar los problemas más difíciles en mi libro de texto de matemáticas va a volver y morderme en el futuro?

More Interesting

¿El PageRank nunca puede converger para algunas entradas (después de un punto hay el mismo conjunto de vértices activos / programados)? En caso afirmativo, ¿cómo debería determinarse la convergencia?

Cómo demostrar que la complejidad del espacio es en la mayoría de los casos complejidad

¿Por qué son importantes los homeomorfismos?

¿Cuáles son los detalles sobre el modo matemático en Quora?

¿Qué es un ábaco?

¿Cómo se representa la cantidad escalar como una cantidad vectorial?

¿Qué son los números de teléfono virtuales (DDI)?

¿Qué características distinguen a un grupo de monstruos de otros grupos? ¿Están los grupos de monstruos relacionados con números primos?

Teoría del juego: ¿Cuál es la diferencia entre un equilibrio de separación y agrupación?

¿Por qué podemos usar la transformación de Laplace para convertir un sistema no lineal en expresión lineal?

¿La función zeta de Riemann solo funciona si [math] s \ in \ N [/ math]?

¿Cuál es la diferencia entre conjugar y racionalizar?

¿Cómo probaría lo siguiente? Sea (X, T) un espacio topológico y (xn) una secuencia de elementos de X. 1. Si la topología en X es más fuerte, es más difícil que converja (xn). 2. Si X está equipado con una topología discreta, ¿solo convergen las secuencias que se vuelven constantes?

¿Cuáles son algunos buenos ejemplos de axiomas?

¿Alguien puede tener éxito en concursos de matemáticas con suficiente práctica?

Web Analytics