¿Por qué, cuando aumenta el número de variables, el cuadrado R también aumenta en la regresión lineal?

Consideremos el siguiente modelo de regresión:

[matemática] y_i = \ beta_0 + \ beta_1 x_ {1i} + \ dots + \ beta_k x_ {ki} + \ varepsilon_i, [/ math]

o en su forma matricial:

[matemáticas] Y = X \ beta + \ varepsilon, [/ matemáticas]

donde [matemáticas] i = 1, \ puntos, n [/ matemáticas].

La [matemática] R ^ 2 [/ matemática] representa la proporción de la varianza capturada (o explicada) por sus variables explicativas [matemática] k [/ matemática]. Su definición formal es:

[matemáticas] R ^ 2 = \ frac {ESS} {TSS} = \ frac {\ sum_ {i = 1} ^ n (\ hat y_i – \ bar {\ hat {y}}) ^ 2} {\ sum_ { i = 1} ^ n (y_i – \ bar y) ^ 2} [/ math]

donde [math] \ hat y_i = y_i – \ hat \ varepsilon [/ math]. (ESS y TSS representan respectivamente la suma explicada de cuadrados y la suma total de cuadrados).

Ahora, para comprender por qué la [matemática] R ^ 2 [/ matemática] se infla cuando aumenta el valor de [matemática] k [/ matemática], debe recordar que una regresión minimiza la suma de los errores al cuadrado, resolviendo

[matemáticas] \ min_ \ beta \ sum_ {i = 1} ^ n \ varepsilon_i ^ 2 = \ min_ \ beta \ sum_ {i = 1} ^ n (y_i-X_i \ beta) ^ 2 [/ matemática].

La ecuación anterior resuelve los valores de los coeficientes de manera que los errores al cuadrado se minimizan, o de manera equivalente, los valores de los coeficientes de tal manera que lo que puede explicar, es decir, [matemática] R ^ 2 [/ matemática], es maximizado

Por lo tanto, siempre que agregue una variable a su modelo, el valor de su coeficiente estimado puede ser cero, en cuyo caso la proporción de la varianza explicada ([matemática] R ^ 2 [/ matemática]) permanece sin cambios o toma un valor distinto de cero porque mejora la calidad del ajuste . Por construcción, su [matemática] R ^ 2 [/ matemática] no puede ser más pequeña después de agregar una variable.

Debido a que todo está relacionado con todo lo demás, incluso aunque sea un poco, y cuando agrega una nueva variable, la [matemática] R ^ 2 [/ matemática] aumenta, reflejando eso.

Debido a cómo R al cuadrado se calcula matemáticamente, no puede no aumentar. R cuadrado ajustado es mejor ir. En la práctica, nunca consigo que ninguno valga nada.

R cuadrado ajustado incluye un descuento por el número de variables. La idea es mantener controlados a los bastardos locos y con exceso de equipamiento. Sin embargo, es solo un número.

Use una tabla de elevación para asegurarse de que el modelo no se sobreajuste. Si los datos de validación no están ahí con los datos de entrenamiento, entonces su modelo está sobreajustado. Debería estar bastante cerca.

R al cuadrado es la proporción de la varianza del resultado que puede explicarse por las variables explicativas. Como era de esperar, cuantas más variables incluya, más varianza puede explicar el modelo.

More Interesting

¿Cuál es la fórmula utilizada para calcular la presión del aire a cierta altitud?

¿Tiene un cohete un movimiento acelerado o uniforme?

¿Cómo logran las luces LED matices como el blanco neutro y el blanco cálido? ¿Se colocan estos filtros de color sobre LED blancos originalmente fríos?

Cómo crear una colisión perfectamente elástica con un golpe o una patada

Si amo el cálculo, ¿me gustaría la física?

¿Por qué el hecho de que la masa de un objeto disminuye a medida que libera energía no refuta la ley de conservación de la masa?

¿Cómo funciona la condensación a nivel atómico?

¿Por qué todo tiene una frecuencia de resonancia natural?

¿Qué significa que el tiempo sea relativo? ¿Es el tiempo relativo al observador, en lugar de ser absoluto?

¿Cuáles son algunos de los efectos de la física cuántica que podemos observar en la vida cotidiana (por ejemplo, el transistor moderno)?

¿Que es el tiempo? ¿Existe? Solo existen relojes para medirlo. ¿Es una ilusión?

En la teoría de cuerdas, ¿cuál es la cuerda más pequeña que se ha observado hasta ahora? ¿Cuántas de las nuevas dimensiones de la teoría M se han encontrado?

¿Podemos demostrar que todo en el universo debe seguir las leyes de la física? ¿Es posible que algo pueda desobedecer las leyes de la física?

¿Cuánta energía se libera cuando una masa de 10 kg que se mueve con una velocidad de 2 m / s desaparece repentinamente?

¿El aire caliente que se expande rápidamente lo enfría?