¿Cómo se explica el concepto de coordenadas homogéneas en palabras simples?

Supongo que el público está familiarizado con las coordenadas cartesianas ordinarias, al menos en el plano, por lo que usar un par de números [matemática] (x, y) [/ matemática] para designar un punto es una idea con la que se sienten cómodos . De lo contrario, comenzaría con eso antes de pasar a coordenadas homogéneas.
A continuación, me centraré en el caso de 2 dimensiones: el plano ordinario y su extensión al plano proyectivo. También estoy ignorando las extensiones súper interesantes pero probablemente irrelevantes en este punto a otros campos más allá de los números reales.

Primero debemos explicar la imagen geométrica del plano proyectivo. Esto todavía no tiene coordenadas, pero es útil entender cómo las coordenadas homogéneas realmente describen puntos en el espacio proyectivo.

Geometría

Cada dos puntos distintos definen una línea: la línea única que los atraviesa. Cada dos líneas distintas definen un punto: el punto único en el que se cruzan. ¡Uy! La segunda oración no es realmente cierta. Las líneas podrían ser paralelas, en cuyo caso su punto de intersección se ha desmayado. Esto no solo es estéticamente desagradable, sino que resulta ser un verdadero punto ciego cuando comienzas a estudiar profundamente objetos geométricos.

¿Cómo podemos remediar esto? La idea clave es que en geometría, trabajamos con “puntos” y “líneas” que pueden ser “incidentes” entre sí, y satisfacen todo tipo de reglas familiares (“axiomas”), como la que dice que hay Un incidente de línea único con dos puntos dados. Realmente no nos importa cuáles son realmente esos “puntos” y “líneas”, y podemos, si nos apetece, redefinirlos a voluntad.

El truco es este: muevamos una dimensión hacia arriba y consideremos el espacio tridimensional, un objeto bastante familiar. En 3d vamos a arreglar un punto especial, el “origen”. Ahora, redefiniremos “Punto” para que sea “Una línea recta en el espacio que pasa a través del origen”, y redefiniremos “Línea” para que sea un plano “A (bidimensional) que pase por el origen”. Deben ser bastante fáciles de visualizar, y también es bastante obvio cómo redefinir la “incidencia”: un “Punto” se encuentra en una “Línea” si la línea correspondiente (ordinaria) en 3 espacios se encuentra en el plano correspondiente (ordinario) en 3 espacios.

De ahora en adelante, dejaré las comillas de miedo alrededor de “Punto” y “Línea” y me referiré a ellas como Puntos y Líneas en mayúscula.

¿Sigue siendo cierto que cada dos Puntos distintos definen una Línea única que los atraviesa? Sí, ya que cada dos líneas a través del origen definen un plano único que las contiene, y también pasa por el origen.

¿Es ahora cierto que cada dos líneas distintas se encuentran en un punto único? Si. Es intuitivamente obvio, y no es difícil de probar, que cada dos planos a través del origen se encuentran en una línea única.

¿Podemos volver a descubrir los puntos y líneas de la vieja escuela entre los nuevos Puntos y Líneas? Seguro. Imagine un plano fijo que no pasa por nuestro origen. Es bueno imaginar un plano horizontal que se sitúa a 1 pie (o 1 m en Europa) sobre el origen. Llamaremos a este avión “el papel”. Es como el papel ordinario con el que trabajamos cuando hacemos geometría, solo que es realmente grande, infinito en todas las direcciones.

Ahora, la mayoría de los Puntos se encuentran con este documento en un solo punto, y la mayoría de las Líneas se encuentran con el papel en una sola línea. Me resulta útil imaginar una línea dinámica y tambaleante en el espacio a través del origen (recuerde, ese es un Punto) que corta el papel a medida que se mueve, excepto cuando se encuentra plano, paralelo al papel, en cuyo caso no logra cumplirlo.

Entonces, la mayoría de los Puntos corresponden a puntos en el papel. Y la mayoría de las líneas corresponden a líneas en el papel. Pero algunos Puntos no: esos son los nuevos Puntos (llamados “Puntos en el infinito”) que introdujo nuestro truco, y que hacen que incluso las líneas paralelas se encuentren. También hay una sola línea que no toca el papel: es la línea, que es el plano horizontal a través del origen. Se llama la Línea en el infinito, y contiene todos los Puntos en el infinito (ya que contiene todas las líneas horizontales a través del origen).

Debería poder observar que las líneas paralelas en el papel corresponden a las líneas que se encuentran en un punto en el infinito. De hecho, todas las líneas paralelas a una sola línea dada se encuentran en el mismo Punto, pero una familia diferente de líneas paralelas orientadas en alguna otra dirección se encontrará en un Punto diferente en el infinito. Toda la colección de puntos y líneas se llama plano proyectivo.

No estoy seguro de si es fácil imaginar el modelo mental que estoy sugiriendo, pero con un poco de esfuerzo y preguntas y respuestas debería quedar bastante claro. Es una idea muy hermosa de concretar los puntos faltantes en el infinito donde las líneas paralelas deberían encontrarse.

Álgebra

Sabemos que un punto puede ser representado por un par de números [matemática] (x, y) [/ matemática]. Agreguemos otra coordenada, solo por diversión, y llamemos a este punto [matemáticas] [x: y: 1] [/ matemáticas]. ¿Qué podemos hacer con este extra 1? Bueno, podemos permitir que sea otra cosa, como en [matemáticas] [X: Y: Z] [/ matemáticas], pero dado que lo único que realmente nos importa son los puntos en el plano, vamos a estar de acuerdo en que [matemáticas] [X: Y: Z] [/ math] significa (cuando [math] Z \ neq 0 [/ math]) exactamente lo mismo que [math] [\ frac {X} {Z}: \ frac {Y} { Z}: 1] [/ matemáticas]. Dicho de otra manera, el triple [matemático] [X: Y: Z] [/ matemático] significa lo mismo que el triple [matemático] [kX: kY: kZ] [/ matemático] para cualquier elección de cero [matemático] k [ / math], ya que lo único que nos importa es la relación entre el primer / segundo número y el tercero.

Entonces, cada punto anterior [matemática] (x, y) [/ matemática] corresponde al nuevo Punto [matemática] [x: y: 1] [/ matemática], y este nuevo punto tiene muchos nombres como [matemática] [2x: 2y : 2] [/ math] o [math] [- x: -y: -1] [/ math] pero esos son nombres diferentes para el mismo punto.

¿Cada nuevo punto proviene de un viejo punto? Bueno, casi. Si [matemática] Z \ neq 0 [/ matemática] entonces [matemática] [X: Y: Z] [/ matemática] proviene de [matemática] (\ frac {X} {Z}, \ frac {Y} {Z} )[/matemáticas]. Pero, ¿qué pasa con los puntos [matemáticas] [X: Y: 0] [/ matemáticas]? Esos no parecen corresponder a ningún punto antiguo, y de hecho no lo hacen. Son nuevos. Todavía obedecen la convención de múltiples nombres, así que [matemáticas] [3: 4: 0] [/ matemáticas] es exactamente el mismo Punto que [matemáticas] [9: 12: 0] [/ matemáticas].

Para resumir: estamos considerando un conjunto de tripletes [matemática] [X: Y: Z] [/ matemática] con la extraña convención de que multiplicar todos los números en la triple constante por la misma constante no cambia el Punto abstracto nombrado por ese triplete Hay un Punto [matemáticas] [1: 2: 3] [/ matemáticas] y hay un Punto [matemáticas] [3: 2: 1] [/ matemáticas] y son diferentes, pero el segundo es el mismo que [ matemáticas] [6: 4: 2] [/ matemáticas] y también es lo mismo que el punto simple de la vieja escuela [matemáticas] (3,2) [/ matemáticas].

Ah, y [matemáticas] [0: 0: 0] [/ matemáticas]? Este es, por definición, ilegal. No es un punto.

¿Cómo hacemos álgebra real con esas nuevas coordenadas? El truco principal es la homogeneización. Suponga que está viendo una ecuación lineal [matemática] 3x + 4y = 5 [/ matemática]. Puede resolverlo y encontrar el conjunto de soluciones en [matemáticas] x [/ matemáticas] y [matemáticas] y [/ matemáticas]. Pero estamos interesados ​​en encontrar soluciones proyectivas extendidas en coordenadas homogéneas [matemáticas] [X: Y: Z] [/ matemáticas]. Por lo tanto, multiplicamos cada término de la ecuación original por tantos [matemáticos] Z [/ matemáticos] como sea necesario para que todos esos términos tengan el mismo grado total. En este caso nos movemos a [matemáticas] 3X + 4Y = 5Z [/ matemáticas].

Esta nueva ecuación es mejor: incluye todas las soluciones a la ecuación anterior (solo establezca [matemática] Z = 1 [/ matemática]), pero incluye más cuando [matemática] Z = 0 [/ matemática]. Obedece a nuestra regla de “nomenclatura” ya que si [math] [X: Y: Z] [/ math] es una solución, entonces también lo es [math] [kX: kY: kZ] [/ math] para cualquier [math] k [ / math] – por lo tanto, se nos permite hablar de las soluciones proyectivas en coordenadas homogéneas [math] [X: Y: Z] [/ math].

Lo mismo funciona para grados superiores. Por ejemplo, [matemática] y ^ 2 = x ^ 3 + x + 1 [/ matemática] se convierte en [matemática] Y ^ 2Z = X ^ 3 + XZ ^ 2 + Z ^ 3 [/ matemática]. Observe cómo hicimos que todos los términos tuvieran un grado 3 al multiplicarlo con cierta potencia de [matemáticas] Z [/ matemáticas]. Además de las soluciones ordinarias, esta nueva ecuación tiene una nueva y única, a saber, [matemática] [0: 1: 0] [/ matemática]: este es su Punto en el infinito.

Finalmente, puede ver que el dispositivo algebraico de coordenadas homogéneas corresponde muy bien con la vista geométrica con la que comenzamos. Este es un buen ejercicio para comprender estos conceptos, pero si no está claro, editaré la respuesta para incluirla también (la respuesta ya es demasiado larga).

Escribí un artículo explicando eso hace un tiempo. La verdad detrás de las coordenadas homogéneas. No puedo ponerlo en línea aquí, porque la explicación necesita bastantes dibujos para ser fácilmente comprensible. Espero eso ayude.

Bueno, si quieres decir con “explicar” para dar una comprensión conceptual en lugar de las matemáticas reales …

Si miramos una imagen, podemos ver que las cosas se vuelven más pequeñas y más cercanas al centro, ya que queremos que se vean más “lejos”.

“Ausente” está representado por una coordenada Z. Las coordenadas homogéneas son una forma de tomar la Z y usarla para cambiar las coordenadas X e Y para lograr ese efecto visual.