¿Qué es el rigor matemático formal?

El rigor matemático formal es:

  • Razonamiento a partir de axiomas ; y
  • Indicar explícitamente qué reglas de inferencia se aplican en cada paso

para derivar un teorema .

Muy poca matemática se hace rigurosamente, excepto en los fundamentos de la lógica y la teoría de conjuntos. El resto generalmente supone que un montón de lemas han sido rigurosamente probados por otra persona y, muy a menudo, se asume un conjunto fundamental de axiomas y teoremas y lemas asociados llamados ZFC (para la teoría de conjuntos de Zermelo-Frankel con el axioma de elección).

La matemática en sí misma no adoptó este nivel de rigor hasta fines del siglo XIX, cuando Cantor, Dedekind, Russell, Herbert y otros intentaron resolver paradojas en una teoría ingenua de conjuntos que amenazaban con socavar todo el edificio matemático. Las matemáticas anteriores a este período tuvieron que ser reexaminadas, y el nuevo estándar de rigor descubrió que gran parte de ellas no eran rigurosas.

El ejemplo clásico es el de integración, o el ” área bajo una curva “, introducida por primera vez por Newton y Leibniz. Cuando se llega al meollo de lo que significa ” área bajo la curva ” para algunas funciones que no se comportan bien, precisamente cómo define las cuestiones integrales. Hoy tenemos dos definiciones rigurosas de integración comúnmente utilizadas y diferentes, originadas por Riemann y Lebesgue. Intuitivamente (y no rigurosamente), la Integral de Riemann se aproxima al área bajo la curva como una suma de rectángulos verticales estrechos, mientras que la Integral de Lebesgue es como sumar una serie de rectángulos horizontales estrechos. Resulta que este último generaliza mejor y más funciones son integrables en Lebesgue que integrables en Riemann. En cualquier caso, si desea utilizar la integración en su teoría y quiere ser riguroso, debe demostrar que su función es integrable.

La mayoría de las funciones en física, por supuesto, se comportan muy bien y suelen ser continuas y suaves, por lo que rara vez debe preocuparse. Sin embargo, cuando se trata de funciones de onda cuántica o singularidades en la relatividad general, y desea hacer un análisis sofisticado que involucre transformadas de Fourier (que pueden verse como sumas infinitas) vale la pena ser riguroso si desea asegurarse de que los resultados tienen algún significado en lugar de ser simplemente un artefacto de las matemáticas no rigurosas.

La integración está muy lejos de los axiomas de ZFC, pero las pruebas, al menos en principio, pueden reducirse a estos fundamentos junto con las definiciones relevantes de conceptos de nivel superior.

Tengo A2A’d Alon Amit, quien sospecho que tiene algunas ideas geniales para ofrecer aquí, pero tengo un ejemplo personal.

Fui un poco arrogante a veces como estudiante de física de pregrado, y decidí que el curso de cálculo que había tomado era lo suficientemente exhaustivo como para no tener que tomar Real Analysis. En cambio, salté directamente al curso de Análisis Complejo diseñado para estudiantes de matemáticas. En un departamento de matemáticas que es conocido por destruir despiadadamente a los indignos.

Sospecho que varias caras conocidas simplemente golpearon las palmas. Sí, fui tan tonto.

La clase fue difícil, pero también fue realmente interesante, y pensé que estaba manteniendo el ritmo. El TA no devolvió el primer conjunto de problemas hasta que ya habíamos entregado el tercero, lo que significa que una gran parte de mi calificación ya estaba decidida antes de recibir cualquier tipo de retroalimentación.

Chico, esas fueron malas noticias.

Siempre me he enorgullecido de poder expresar el razonamiento de una manera clara, inequívoca y hermética ; en resumen, mi capacidad de ser “riguroso”. Tendería a evitar los argumentos de tipo “esto tiene sentido porque [analogía]”, y en su lugar mostraré explícitamente por qué las cosas deben ser ciertas. Pero, nunca había oído hablar de la convergencia uniforme . Sabía lo que significaba “convergencia”, por supuesto, y pensé que lo entendía, pero nunca había pensado en la posibilidad de que la convergencia puntual no fuera suficiente en algunos casos.

Como resultado, algunas de mis “pruebas”, bueno, no lo fueron . Esta clase fue bastante despiadada; sin crédito parcial, incluso para errores que fueron relativamente menores. No hace falta decir que esos primeros tres conjuntos de problemas no me fueron particularmente bien . (Para agregar insulto a la lesión, fue bastante fácil mostrar una convergencia uniforme en estos casos, esa no era la parte difícil de la prueba, simplemente no lo había hecho. Sin embargo, debido a mi supervisión, mis pruebas no eran válidas ).

Entonces, creo que la noción misma de convergencia uniforme es un buen ejemplo de lo que significa ser “matemáticamente riguroso”. Intuitivamente, si cada punto en una curva se acerca al punto correspondiente en otra curva (con épsilons y deltas y todo eso), entonces claramente esa curva es el límite de la otra (secuencia de curvas). Pero, si lo deja en “claramente este debería ser el caso”, obtendrá la respuesta incorrecta en algunos casos ; la convergencia puntual simplemente no es lo suficientemente buena.

El rigor matemático significa nunca decir “eso parece suficientemente claro”. Significa escribir una prueba tal que, en cada paso, es lógicamente imposible que la conclusión declarada no siga, en lugar de que el argumento sea convincente.

No es que las pruebas no rigurosas no puedan obtener la respuesta correcta; es que las pruebas rigurosas no pueden obtener la incorrecta.

O una prueba es una prueba o no lo es. Dicho esto, a veces un autor dirá “para una prueba rigurosa ver …”. Lo que realmente quieren decir es que la prueba en parte requiere maquinaria matemática que el lector aún no puede tener. Buen ejemplo: solución a ecuaciones diferenciales parciales utilizando expansiones en serie. Probar formalmente la convergencia puede volverse desordenado. Otro ejemplo es la optimización de funciones; realmente necesita definir el espacio de funciones en el que está operando, pero a menudo un autor “simulará” que los espacios infinitos son finitos e ignorará sutilezas y demás. La información a menudo es tan importante como las pruebas, y a veces se presentan pruebas incompletas para generar ideas. En todos los casos, el autor puede y debe articular cuáles son las piezas que faltan. Algo así como “suponiendo que las cosas se comporten correctamente, podemos permutar el orden de …”

Un último artículo; a veces se prueba un teorema usando computadoras para inspeccionar exhaustivamente todos los casos especiales. Por supuesto, esto solo funciona para la inspección finita.

Algunos dirían que esto NO es una prueba formal ya que ningún ser humano ha pensado explícitamente en todo el argumento.

Le daré un breve ejemplo de una prueba formal (será el teorema de Loewenheim-Skolem).
Lo formularemos de la siguiente manera:
Deje que [math] \ mathcal {L} [/ math] sea un lenguaje estandarizado de primer orden, [math] \ Gamma [/ math] – conjunto de fórmulas en ese idioma. Entonces, si [math] \ Gamma [/ math] tiene un modelo, tiene un modelo contable.

  1. [matemáticas] \ Gamma [/ matemáticas] tiene un modelo – supuesto
  2. [math] \ Gamma [/ math] es un conjunto de fórmulas – desde la condición
  3. [math] \ Gamma [/ math] no es [math] Cl _ {\ mathcal {L}} [/ math] -inconsistente – de la condición, 1., 2. y lema de inexistencia de modelo para [math] Cl _ {\ mathcal {L}} [/ math] -conjuntos inconsistentes [aquí [math] Cl _ {\ mathcal {L}} [/ math] es un cálculo al estilo de Hilbert]
  4. [math] \ neg (\ Gamma \ text {es un subconjunto de fórmulas en} \ mathcal {L} [/ math] [math] \ dot {\ &} [/ math] [math] \ existe C (C \ text {es la fórmula en} \ mathcal {L} [/ math] [math] \ dot {\ &} (\ Gamma \ underset {Cl _ {\ mathcal {L}}} {\ vdash} C \ dot {{\ &} } \ Gamma \ underset {Cl _ {\ mathcal {L}}} {\ vdash} (\ neg C)))) [/ math] – de 3. por definición de [math] Cl _ {\ mathcal {L}} [ / math] -conjunto inconsistente
  5. [matemáticas] \ neg \ existe C (C \ text {es la fórmula en} \ mathcal {L} [/ math] [math] \ dot {\ &} (\ Gamma \ underset {Cl _ {\ mathcal {L}}} {\ vdash} C \ dot {{\ &}} \ Gamma \ underset {Cl _ {\ mathcal {L}}} {\ vdash} (\ neg C))) [/ math] – de 4. por condición
  6. [math] \ Gamma [/ math] es un [math] Cl _ {\ mathcal {L}} [/ math] conjunto consistente – de 5. por definición de [math] Cl _ {\ mathcal {L}} [/ math ] conjunto consistente
  7. [math] \ Gamma [/ math] tiene un modelo contable, desde 6. por condición y lema de existencia de un modelo contable.
  8. Eliminando la suposición, obtenemos que si [math] \ Gamma [/ math] tiene un modelo, tiene un modelo contable.

QED

Me gustaría explicar esto a través de un ejemplo.

P: Demuestre que el vector cero en un espacio vectorial es único.

A: Un vector cero [math] \ mathbf {0} [/ math] del espacio vectorial [math] \ mathbb {V} [/ math] tendrá la siguiente propiedad:

[math] \ mathbf {0} + \ mathbf {a} = \ mathbf {a} + \ mathbf {0} = \ mathbf {a} [/ math]

para cualquier vector [math] \ mathbf {a} \ in \ mathbb {V} [/ math]. Suponga que el vector cero no es único y que hay dos vectores cero, [math] \ mathbf {0_1} [/ math] y [math] \ mathbf {0_2} [/ math]. Entonces, por definición,

[math] \ mathbf {0_1} + \ mathbf {0_2} = \ mathbf {0_1} [/ math]

Además, por definición,

[math] \ mathbf {0_1} + \ mathbf {0_2} = \ mathbf {0_2} [/ math]

Así,

[math] \ mathbf {0_1} = \ mathbf {0_2} [/ math]

En otras palabras, el vector cero es único.

El rigor es cuando ya tienes un resultado pero asumes la menor cantidad de cosas posible para llegar allí.

Por supuesto, la prueba rigurosa no es tan importante para cosas obvias, como que la derivada de una función seno es un coseno exacto.

Pero calcular la derivada de una función en un punto donde su valor no es obvio, por ejemplo, sin (x) / x para x = 0, es otra cuestión.
No soy un experto en “pruebas rigurosas”, pero esperaría necesitarlo en tal caso.

¿Algún matemático “estricto” entre ustedes que pueda decir más sobre esto?

More Interesting

¿Qué asignatura es la mejor: física, química o matemáticas?

¿Es la razón de Poisson una cantidad escalar o vectorial?

Digamos que enfrento un problema de física con una oda o pde que no tiene soluciones únicas. ¿Cómo puedo saber cuál es la solución real?

Si dos estrellas tienen una separación de 2.2 segundos de arco, ¿eso significa que el ángulo formado por la línea de visión del observador es igual a 2.2 segundos de arco?

¿Qué significa cuando decimos que la luz está polarizada circular o elípticamente?

Si las matemáticas son el lenguaje del universo, ¿hay algún fenómeno natural en nuestro universo que demuestre división por cero?

¿Cuáles son los requisitos previos para un curso de pregrado en Relatividad general?

Ingeniería de control: ¿Cómo se calcula el ángulo de partida de [matemáticas] G (s) = \ frac {1} {s ^ 3 + 4s ^ 2 + 5s} [/ matemáticas] para la gráfica del lugar de las raíces?

¿Por qué el segundo momento de área se llama momento de inercia de área?

En un sentido físico y matemático, ¿cómo cruzamos la línea de meta en una carrera?

Si conduces un automóvil que pesa 3000 libras y el zombi promedio pesa 150 libras, ¿qué tan grande podría ser una multitud de zombis? ¿Tiene un sedán promedio con tracción normal, espacio para subir hasta 40 mph?

Considere un gas con ecuación fundamental [matemática] G = -aT (\ log (T) - b \ log (P)) [/ matemática]. ¿Cuáles son las condiciones de estabilidad térmica y mecánica?

¿Cómo entendió Fourier que puede convertir una onda de un dominio de tiempo a un dominio de frecuencia?

¿Qué significa cuando hay dos números debajo de la flecha en una máquina finita determinista?

En cualquier sistema con un número finito de estados y sin equilibrios, dado un tiempo infinito, ¿se repite cada estado?