¿Cuál es la forma más fácil para que yo ‘pruebe’ el teorema fundamental del álgebra?

La prueba en el Apéndice II de “Un curso de matemática pura” de Hardy es muy esclarecedora. En esencia dice lo siguiente. Queremos demostrar que cada polinomio P (z) de grado uno o más debe tener una raíz. Podemos suponer que el término constante de P no es cero, de lo contrario z = 0 es una raíz. Ahora piense en el circuito creado por P (z) cuando z varía alrededor de un círculo muy pequeño centrado en el origen. Al hacer que el círculo sea lo suficientemente pequeño, todos los términos que involucran potencias de z son insignificantes en comparación con la constante, por lo que vemos que la imagen del círculo está contenida en un círculo alrededor de la constante que no puede enrollarse alrededor del origen (esto se deduce de la definición de continuidad, tome epsilon = | constante | / 2, por ejemplo). Por otro lado, para un círculo muy grande domina la potencia más alta de z y la imagen se enrollará alrededor del origen (n veces, donde n es el grado de P). Por continuidad, a medida que el radio del círculo crece, debe haber algún punto en el medio donde la imagen pasa a través del origen, es decir, una raíz del polinomio.

Aquí hay un par de ilustraciones para ayudar a explicar. Comience con [matemáticas] z ^ 5 – 10 = 0 [/ matemáticas]. La raíz real [matemáticas] 10 ^ {1/5} = 1.585 … [/ matemáticas], y todas las raíces tienen el mismo valor absoluto 1.585. El siguiente gráfico muestra la imagen de círculos alrededor del origen del radio 1.55 (rojo) y 1.60 (azul). Imagine que el círculo rojo se expande hasta que es el círculo azul. En algún punto intermedio cruza el origen dando una raíz del polinomio.

Ese es un ejemplo aburrido porque la imagen del círculo es simplemente circular alrededor de un círculo cinco veces, pero podemos ver la respuesta. Un ejemplo más interesante (seleccionado al azar) es [matemática] P (z) = -10 + z ^ 2 – 3z ^ 3 + z ^ 5 [/ matemática]. Las raíces de esta ecuación tienen valores absolutos 1.3669 …, 1.6542 … y 1.9558 … Veamos las imágenes de círculos de radio 1.25 (rojo) y 1.5 (azul):

Como era de esperar, la imagen del círculo más pequeño (en rojo) no se enrolla alrededor del origen, mientras que el círculo más grande (azul) sí, dos veces, de hecho, hay dos ceros, un par conjugado complejo, con un valor absoluto entre 1.25 y 1.5 .

Continuando, si trazamos 1.5 (rojo) y 1.75 (azul), vemos que la línea azul se ajusta cuatro veces alrededor del origen, correspondiente a los siguientes dos ceros:

y finalmente 1.75 (rojo) y 2.0 (azul) muestran los cinco ceros, porque la línea azul se ajusta cinco veces alrededor del origen.

No importa qué prueba use, en algún momento necesitará la fórmula de Euler:

[matemáticas] z = re ^ {i \ theta} = r [\ cos (\ theta) + i \ sin (\ theta)] [/ matemáticas]

Las enésimas potencias funcionan convenientemente con la notación exponencial:

[matemáticas] z ^ n = r ^ ne ^ {in \ theta} = r [\ cos (n \ theta) + i \ sin (n \ theta)] [/ math]

La enésima potencia de z corre n círculos alrededor del origen. Multiplicar por una constante [matemáticas] a_n [/ matemáticas] solo dilata el círculo y gira el punto de partida, por lo que el comportamiento esencial es el mismo: [matemáticas] | P (z) | \ to \ infty [/ matemáticas] debido a término principal siendo dominante.

Sabemos que en un rectángulo cerrado , [math] | P (z) | [/ math] tiene que alcanzar un mínimo absoluto en ese rectángulo debido a la continuidad de [math] | P (z) | [/ math] (a la función continua de un rectángulo abierto podría tener un rango no cerrado como (2,17], por ejemplo). Si es un rectángulo grande, entonces sabemos que [math] | P (z) | [/ math] es grande en el límite, de modo que este mínimo esté en un punto [math] z_0 [/ math] en el interior, en lugar de en el límite, por lo que, en particular, es un mínimo local . Tenemos que demostrar que este valor mínimo es en realidad cero , así que asume lo contrario y busca una contradicción.

Puedes hacer algunos pasos simplificadores.

1. Suponga que [matemática] P (z_0) = 1 [/ matemática]: Supusimos que [matemática] P (z_0) \ neq 0 [/ matemática], así que simplemente divida por el valor si es algo diferente. [math] \ frac {1} {P (z_0)} \ cdot P (z) [/ math] toma el lugar de [math] P [/ math].

2. Suponga que [matemática] z_0 = 0 [/ matemática]: defina [matemática] Q (z) = P (z + z_0) [/ matemática]. Expanda muchos binomios para ver que [math] Q [/ math] también es un polinomio. También tiene un mínimo local (en valor absoluto), pero su mínimo local ocurre en 0.

Esto es conveniente, porque podemos escribir

[matemáticas] Q (z) = 1 + a \ cdot z ^ k (1 + R (z)) [/ matemáticas]

Donde [math] a \ neq 0 [/ math], [math] k [/ math] es un entero positivo, y [math] R (z) [/ math] es la constante 0 o es un polinomio de grado en al menos 1 sin ningún término constante. Queremos llevar [math] | Q (z) | [/ math] solo un pequeño paso por debajo de 1 para obtener nuestra contradicción. Para las pequeñas [matemáticas] z [/ matemáticas], el término [matemáticas] az ^ k [/ matemáticas] es dominante, y el resto [matemáticas] R (z) [/ matemáticas] es insignificante. Solo tenemos que señalar el término dominante en la dirección correcta y demostrar que el resto es solo la mitad de grande (o menos).

Escriba [math] a = \ rho e ^ {i \ alpha} [/ math], y deje que [math] z = re ^ {i (\ pi- \ alpha) / k} [/ math]

Entonces [matemáticas] Q (z) = 1+ \ rho r ^ ke ^ {i \ pi} (1 + R (z)) = 1- \ rho r ^ k – \ rho r ^ k R (z) [/ matemáticas]

Técnicamente, necesitamos la desigualdad del triángulo de alguna forma para terminar. Algo como

[matemáticas] | Q (z) | \ leq | 1 – \ rho r ^ k | + | \ rho r ^ k R (z) | \ leq (1- \ varepsilon) + \ frac {\ varepsilon} {2} \ leq 1- \ frac {\ varepsilon} {2} <1 [/ math]

Pero eso es un poco de tecnicismo. Desea estimar [matemáticas] | R (z) | [/ matemáticas] desde arriba: [matemáticas] | R (z) | \ leq grado (R) \ cdot M \ cdot r \ leq \ frac {1} {2 } [/ math], donde [math] M [/ math] es el mayor valor absoluto de sus coeficientes, o algo así. Simplemente haga que [math] r [/ math] sea lo suficientemente pequeño y deje que [math] \ varepsilon = \ rho r ^ k [/ math] y eso debería envolverlo. Como [math] r [/ math] es arbitrariamente pequeño, [math] | Q | [/ math] no puede tener un valor mínimo local igual a 1, por lo que la función original [math] | P | [/ math] no tener el valor mínimo local propuesto distinto de cero.

——————————–

(El argumento del “número de cuerda” dado en otra respuesta es quizás más intuitivo, pero este no es horrible y necesita menos maquinaria si quiere ser preciso con él. Necesita integrales de topología o Cauchy para probar rigurosamente cualquier cosa con el argumento “reducir los bucles grandes”.)

Aquí hay una prueba simple (pero no elemental) del teorema. Sea [matemática] P (z) [/ matemática] un polinomio arbitrario de grado distinto de cero. Defina la función [matemáticas] f (z) = 1 / P (z) [/ matemáticas]. Deje [math] i = \ inf_ {z \ in C} | P (z) | [/ math]. Suponiendo que [matemática] P (z) [/ matemática] no tiene ceros, tenemos que [matemática] i> 0 [/ matemática]. Por lo tanto, [matemática] 1 / i [/ matemática] está bien definida y tenemos [matemática] 0 <| f (z) | \ leq 1 / i [/ math]. Por otro lado, si [math] P (z) [/ math] no tiene ceros complejos, entonces la función [math] f (z) [/ math] no tiene polos, lo que significa que es una función completa (holomórfica sobre todo el plano complejo.) Entonces, el teorema de Liouville implica que [matemáticas] f (z) [/ matemáticas] debe ser constante, lo que contradice nuestra suposición inicial de que [matemáticas] P (z) [/ matemáticas] era un polinomio de grado distinto de cero . Por lo tanto, cada polinomio [matemático] P (z) [/ matemático] debe tener al menos un cero complejo.

Existen otras pruebas, pero todas ellas (hasta donde yo sé) se basan en un resultado fundamental en un análisis complejo, que puede ser difícil de visualizar ya que las gráficas de funciones complejas existen en cuatro dimensiones. Sin embargo, es posible una comprensión intuitiva del teorema de Liouville.

Una propiedad fundamental de las funciones complejas holomórficas es que satisfacen la fórmula integral de Cauchy, que permite calcular las derivadas de la función en un punto mediante la integración del contorno a lo largo de una ruta circular alrededor de ese punto. Sabemos que las funciones holomórficas son analíticas, lo que significa que sus series de Taylor convergen con el valor de la función en cada punto del plano complejo. Recordemos la definición de la serie Taylor a partir del cálculo de variable única:

[matemáticas] \ displaystyle f (x) = \ displaystyle \ sum_ {k = 0} ^ {\ infty} c_ {k} (x – a) ^ k [/ math]

[matemáticas] \ displaystyle c_ {k} = \ frac {f ^ {(k)} (a)} {k!} [/ matemáticas]

La fórmula de diferenciación de Cauchy viene dada por

[matemáticas] \ displaystyle f ^ {(k)} (a) = \ frac {k!} {2 \ pi i} \ oint_ {C_ {r}} \ frac {f (z)} {(za) ^ { k + 1}} dz [/ matemáticas]

Si f está acotada, esta relación implica que [matemáticas] | c_n | \ leq Mr ^ {- n} [/ math] donde [math] M = \ sup_ {z \ in C} | f (z) | [/ math] (¿por qué?) Como la elección del radio es arbitraria, puede dejar que tenga tendencia al infinito para obtener [matemáticas] c_n = 0 [/ matemáticas] para todas [matemáticas] n \ neq 0 [/ matemáticas]. El resultado de que [math] f (z) [/ math] es constante sigue inmediatamente, en particular, tenemos [math] f (z) = c_0 [/ math].

La idea básica de la prueba es que el módulo de una integral de contorno tomada sobre una curva no puede exceder el valor máximo del módulo del integrando multiplicado por la longitud de la curva. Este resultado se conoce como lema de estimación.

Si desea una manera fácil (pero nada rigurosa) de entenderlo, considere que un polinomio con n raíces se puede escribir como [matemáticas] (x – n_1) (x – n_2) … = 0 [/ matemáticas]. Si hubiera más raíces que el grado del polinomio, terminaría multiplicando más términos x, lo que le daría un polinomio de mayor grado. Si tuviera menos raíces (incluyendo raíces repetitivas, irracionales e imaginarias), tendría que multiplicar menos x términos y terminaría con un polinomio de menor grado.

Eso puede no haber sido muy claro, así que haré un ejemplo:

[matemáticas] x ^ 2 + hacha + b = 0 [/ matemáticas]

[matemáticas] (x – c) (x – d) (x – e) = 0 [/ matemáticas]

Cuando multiplicas los términos x en la segunda ecuación, terminas con [matemáticas] x ^ 3 [/ matemáticas] como tu primer término. No hay forma de que pueda multiplicar tres términos así y no tener una [matemática] x ^ 3 [/ matemática] en su respuesta. De manera similar, si la única raíz fuera [matemática] (x – c) [/ matemática] no multiplicada por sí misma, solo tendría una ecuación lineal. Por lo tanto, debe haber exactamente dos raíces (incluidas las raíces repetidas, etc.) para una ecuación cuadrática. Siguiendo la misma lógica, cualquier polinomio de n grados no puede tener más o menos de n raíces.

“Fácil” es un concepto relativo, dependiendo de sus antecedentes.

En cuanto a “ver” la prueba, la primera prueba de Gauss es fácil de visualizar. Sin embargo, contiene algunas brechas topológicas sutiles pero profundas. El profesor Daniel J. Velleman y yo modificamos recientemente la primera prueba de Gauss para evitar cualquier argumento topológico involucrado (utilizamos solo el principio de límite superior mínimo para números reales).

Aquí hay un enlace a nuestro artículo.