¿Cuál es una explicación intuitiva del teorema de Mercer?

El teorema de Mercer es en realidad un análogo de un valor propio o de descomposición de valor singular. La única diferencia aquí es que el núcleo ahora es un objeto contenido en un espacio de dimensiones infinitas.

Comencemos con la declaración más simple del Teorema de Mercer:

Teorema (Mercer): Sea [math] K: [a, b] ^ 2 \ rightarrow \ mathbb {R} [/ math] sea una función continua simétrica, no negativa y definida. Allí existe una secuencia contable de funciones [matemáticas] \ {\ phi_i \} _ {i \ in \ mathbb {N}} [/ matemáticas] y una secuencia de números reales positivos [matemáticas] \ {\ lambda_i \} _ { i \ mathbb {N}} [/ math] tal que,
[matemáticas]
K (s, t) = \ sum_ {i = 1} ^ {\ infty} \ lambda_i \ phi_i (s) \ phi_i (t)
[/matemáticas]

Entonces, ¿por qué comparo esto con una descomposición de matriz? Suponga que [math] K_n \ in \ mathcal {S} _n ^ + [/ math] es una matriz simétrica [math] n \ times n [/ math] no negativa definida y simétrica. Según el teorema espectral, existe una base ortonormal [matemática] \ {\ mathbf {e} _i \} _ {i = 1} ^ n [/ matemática] tal que [matemática] K_n [/ matemática] es diagonal en esta base . Pero, ¿qué significa esto exactamente? Genéricamente, esto significa que existe una matriz unitaria, [math] U = \ left [\ mathbf {e} _1, \ mathbf {e} _2, \ cdots \ mathbf {e} _n \ right] [/ math] [0 ] y una matriz diagonal, [math] \ Lambda = \ text {diag} (\ lambda_1, \ ldots, \ lambda_n) [/ math] tal que [math] K_n = U \ Lambda U ^ T [/ math]. Pero si multiplicamos esto, esto simplemente dice que [math] K_n = \ sum_ {i = 1} ^ {n} \ lambda_i \ mathbf {e} _i \ mathbf {e} _i ^ T [/ math], que es exactamente como el teorema de Mercer.

La única diferencia aquí es que nuestros ‘vectores propios’ son simplemente funciones [math] \ phi_i (s) [/ math] en lugar de vectores simples [math] \ mathbf {e} _i [/ ​​math]. Sin embargo, el espacio [matemáticas] [a, b] ^ 2 [/ matemáticas] es un espacio compacto, Hausdorff, contractible y, por lo tanto, el conjunto de funciones integrables al cuadrado, [matemáticas] L ^ 2 ([a, b] ^ 2 ) [/ math] tiene una base contable, ortonormal.

Un ejemplo simple de esto es cuando [matemáticas] a = 0, b = 1 [/ matemáticas]. Entonces una base contable, ortonormal para [matemática] L ^ 2 ([0,1] ^ 2) [/ matemática] es simplemente los sinusoides, [matemática] \ phi_ {n, m} (x, y) = \ exp ( i \ pi (nx + my)) [/ math]. En esta situación, tenga en cuenta que la condición de simetría adicional en el núcleo en el Teorema de Mercer nos obliga a expandirnos solo en la base [matemáticas] \ phi_ {n} (x): = \ phi_ {nn} (x) = \ exp (i \ pi n (x + y)) [/ math].

[0] Esta es una matriz con [math] i [/ math] th columna igual a [math] \ mathbf {e} _i [/ ​​math]; La implementación del modo matemático LaTeX de Quora es realmente bastante mala con las matrices y no pude escribir esto correctamente.