¿Qué es una explicación intuitiva de la inducción transfinita?

Supongo que está familiarizado con los números ordinales (http://en.wikipedia.org/wiki/Ord…), el espacio en el que generalmente se aplica la inducción transfinita.

La inducción simple funciona así: si puedo probar P0 y puedo probar Pn -> P (n + 1) para todos los n, entonces probé Pn para todos los n. Esto se debe a que se puede alcanzar cada número natural dando pasos uno a la vez desde 0. El supuesto central aquí que no es cierto para los números ordinales es que cada elemento tiene un predecesor inmediato.

Para evitar esto, usamos “inducción fuerte”, que en el caso de los números naturales resulta ser equivalente. Dice así:

[matemáticas] (P (0) \ wedge \ forall x ((\ forall y <x (Py)) \ to Px)) \ to \ forall x (Px). [/ math]

En otras palabras, en lugar de probar Pn -> P (n + 1), supongo Py para todo y <x e intento probar Px. Suena como una suposición más fuerte, pero resulta que es más ampliamente aplicable. En realidad puede saltar por encima del infinito. Supongamos que hemos demostrado lo anterior para una propiedad P. Es intuitivamente claro (y probablemente demostrable) que Pn es demostrable para todo n. Pero luego tenemos que [math] \ forall x \ in \ omega Px [/ math]; es decir, [math] \ forall x <\ omega Px [/ math], por lo que se deduce que [math] P \ omega [/ math] es válido. Y así, para [matemáticas] P (\ omega + 1) [/ matemáticas], y así sucesivamente …

El que generalmente atrae a las personas es el salto de la inducción transfinita a la recursión transfinita. La inducción transfinita es un medio para probar, y la recursión transfinita es un medio para definir funciones. Por ejemplo, podemos definir la secuencia de Fibonacci de forma recursiva con tres reglas: [matemática] a_0 = 1 [/ matemática], [matemática] a_1 = 1 [/ matemática] y [matemática] a_ {n + 2} = a_ {n +1} + a_n [/ matemáticas]. Esta es una función de los números naturales (los índices en los subíndices) a sí mismo (los propios números de Fibonacci).

Algo similar puede suceder con los ordinales generales. La razón por la que esto es complicado es, lamentablemente, de notación. Cuando intentamos definir algo de forma recursiva en un ordinal arbitrario, nos encontramos con el incómodo problema de que el codominio de la función que estamos tratando de definir puede no ser, de hecho, un conjunto. No se garantiza que sea un set hasta que lo hayamos demostrado. De hecho, para que el teorema de recursividad transfinita funcione, tenemos que suspender nuestra incredulidad de notación por un momento y usar “propiedades similares a funciones” (declaraciones sobre dos conjuntos que funcionan como funciones similares), hasta que podamos restringir el dominio a un conjunto razonable y obtener una función.

Dejando a un lado toda esa tontería, el teorema de recursión transfinita es el siguiente: comienza con un conjunto bien ordenado y una “definición recursiva” de una función. Reclama la existencia y la unicidad de una función que satisface la “definición recursiva”. Lo que queremos decir con una “definición recursiva” es esto:

– Tengo una regla que me dice qué es f (0).
– Para cualquier x, si sé cómo se comporta f en todo antes de x, entonces sé cómo se comporta f en x.

Lea esa segunda declaración nuevamente y vea cómo podríamos codificar eso matemáticamente. Básicamente, dado [math] f | _ {\ text {seg} x} [/ math], tenemos que saber f (x). (aquí ‘seg x’ es el conjunto de todas las cosas en A que son estrictamente menores que x)

Es un poco intuitivo, pero esto puede ser codificado por un mapa que toma una función cuyo dominio es un segmento inicial de A (como f restringido a seg x), y le da un elemento en A (como f (x)), anotado muy confusamente como:

[matemáticas] G: (A ^ {\ text {seg}} \ a A) \ a A [/ matemáticas]

Este conjunto [math] (A ^ {\ text {seg}} \ to A) [/ math] es el conjunto de todos los mapas desde los segmentos iniciales de A hasta A. El teorema de recursividad transfinita garantiza entonces que hay una función que satisface esta “definición recursiva”; es decir, si le dice a G cómo se comporta f en todo antes de x, G escupirá mágicamente f (x). Ese es el significado de esta (imo bella) pieza de truco de notación:

[matemáticas] f (x) = G (f | _ {\ text {seg} x}) [/ matemáticas]

Cuando estudié esto en el contexto de la teoría de conjuntos, me resultó difícil. Cuando lo volví a ver después de aprender algo de Informática, lo encontré mucho más fácil.

Supongamos que está procesando recursivamente nodos en una estructura de datos de árbol de algún tipo. Entonces a menudo tiene esta situación: procesa un nodo de árbol procesando primero sus hijos y luego procesando el nodo en sí. Esto le permite procesar todo el árbol comenzando en el nodo raíz y luego utilizando recursivamente su algoritmo para cada uno de los hijos. (Es posible que también deba implementar un código de caso especial para manejar nodos hoja que no tienen hijos).

Entonces tenemos este principio: si tiene un algoritmo que, dada una forma de procesar sus hijos, le permite procesar un nodo, entonces puede procesar cada nodo en cualquier árbol de ese tipo.

“Proceso” es una palabra muy general y podría aplicarse para probar una propiedad. Entonces también tenemos este principio: dada una propiedad P, si tiene una manera de demostrar que un nodo tiene la propiedad dado que sus hijos la tienen, puede probar que cada nodo en cada árbol tiene esta propiedad.

Ahora damos un salto. Un conjunto es una estructura de árbol con elementos como elementos secundarios. La inducción transfinita dice que podemos usar el principio de prueba anterior como axioma para todos los conjuntos. Tenga en cuenta que este es un gran salto porque se aplica incluso si el conjunto es demasiado grande para procesar en una computadora. Sin embargo, intuitivamente es lo mismo y algunas técnicas utilizadas para razonar sobre los programas recursivos se transfieren a los sets.

Inducción para conjuntos que no sean [math] \ mathbb N [/ math], siempre que el principio de ordenamiento funcione (cf [math] \ mathbb R [/ math].

Ver también la respuesta de Sameer Gupta a ¿Cuál es el propósito de los axiomas de Peano?

More Interesting

Me siento triste por no poder recordar ningún cálculo 20 años después de graduarme de la universidad, a pesar de que obtuve la calificación de A. ¿Eso es normal?

¿Cómo podemos distribuir rs 2496 entre Ali y Ahmad para que Ali obtenga rs.3 si ahmad obtiene rs.1?

¿Es posible hacer ecuaciones diferenciales en tu cabeza?

¿Cuáles son x e y si (x ^ y) = (y ^ x), donde x e y son enteros positivos yx y?

Quiero entrenar mi mente con las matemáticas como lo hago con mi cuerpo en el gimnasio. ¿Qué recursos debo adquirir para hacerlo?

Si se demostró el teorema de Pitágoras, ¿por qué lo llamamos teorema?

¿Por qué contamos en incrementos de 10?

Cómo escribir funciones matemáticas o preguntas de integración en Quora

¿Qué tecnologías surgieron de la investigación de defensa que impactaron a la sociedad? ¿Qué tecnologías surgieron de los servicios financieros que impactaron a la sociedad fuera de las finanzas?

Realmente disfruto las matemáticas y la gente no entiende. ¿Cómo puedo explicar que esto puede ser un pasatiempo?

¿Cuál es el campo vectorial, F (x, y) = x ^ ex ^ 2 (2ti + xj?

En India, ¿cuáles son las mejores universidades para las matemáticas?

Cómo representar el siguiente número binario en notación exponencial (23,415)

¿Cuál es la diferencia entre parámetro y variable?

Cómo simplificar [matemáticas] \ log_ {b} 4 + 3 [\ log_ {b} (1 + x) - \ frac {1} {2} \ log_ {b} (1-x)] [/ matemáticas] así que está escrito como un solo logaritmo con un coeficiente de 1