¿Por qué se utilizan derivados para el cambio de coordenadas en la Relatividad general y por qué se ven como vectores?

De hecho, esto puede ser un poco misterioso para los principiantes de la relatividad general, y la razón no es obvia.

Permítanme responder su segunda pregunta primero: ¿por qué los derivados se ven como vectores? Recordemos primero cómo hicimos esto en el cálculo de primer año:

Ejemplo : ([math] \ mathbb {S} ^ 2 [/ math] en [math] \ mathbb {R} ^ 3 [/ math])

Una esfera 2D [matemática] (x, y, \ sqrt {1-x ^ 2-y ^ 2}) [/ matemática] en el espacio euclidiano [matemática] \ mathbb {R} ^ 3. [/ Matemática] El vector tangente se elige de modo que [math] \ langle v, (x, y, \ sqrt {1-x ^ 2-y ^ 2}) \ rangle _ {\ mathbb {R} ^ 3} = 0, [/ math] donde [ math] \ langle \ cdot, \ cdot \ rangle [/ math] es un producto interno de [math] \ mathbb {R} ^ 3 [/ math]. Por ejemplo, [math] v = (-y, x, 0) [/ math] es un vector tangente en la esfera como se puede verificar fácilmente.

Sin embargo, observe que de hecho estamos usando la coordenada de [math] \ mathbb {R} ^ 3 [/ math] para describir el vector tangente [math] v [/ math] en [math] \ mathbb {S} ^ 2 [/matemáticas]. ¿Qué sucede si le dicen que no use la coordenada en (espacio ambiente) [math] \ mathbb {R} ^ 3 [/ math] para describir una tangente?

(fin de ejemplo)

La geometría riemanniana se desarrolla intrínsecamente , con esto queremos decir una superficie de alta dimensión (llamada múltiple ) [matemática] M [/ matemática] que no necesita un espacio ambiental, como [matemática] \ mathbb {R} ^ 3 [/ matemática ] en el ejemplo. Entonces, los matemáticos se enfrentan a la pregunta de describir un vector tangente en [matemáticas] M [/ matemáticas] correctamente sin perforar en un espacio exterior. Una idea inteligente (pero no obvia) es usar un operador diferencial [matemático] \ parcial / \ parcial x ^ i [/ matemático] como una equivalencia para reemplazar la idea clásica del vector tangente [matemático] \ mathbf {v} [/ matemático ] sin utilizar ninguna noción de espacio ambiental (algunos teoremas y pruebas detallados pueden verse, por ejemplo, Introducción a los manifiestos, Loring Tu).

También hay otras formas equivalentes de describir un vector tangente, como derivaciones (gérmenes de funciones), … etc. Esta es la razón histórica de su segunda pregunta.

En cuanto a su primera pregunta: ¿por qué se utilizan derivados para el cambio de coordenadas en la relatividad general?

Yo diría que no lo es. Nosotros (en geometría riemanniana) utilizamos derivados como vectores tangentes, pero no como cambio de coordenadas. Puede confundirse por la similitud de las dos notaciones:

[matemática] \ parcial / \ parcial x ^ {\ alpha} [/ matemática] y [matemática] \ parcial y ^ {\ beta} / \ parcial x ^ {\ alpha}. [/ matemática]

El primero es un derivado y el segundo es una matriz jacobiana. Digamos que tenemos dos sistemas de coordenadas [matemática] x ^ {\ alpha} [/ matemática] y [matemática] y ^ {\ beta} [/ matemática] y, por lo tanto, dos bases correspondientes [matemática] \ parcial / \ parcial x ^ {\ alfa} [/ matemática], [matemática] \ parcial / \ parcial y ^ {\ beta} [/ matemática]. Naturalmente, le gustaría encontrar la transformación [matemática] A ^ {\ beta} _ {\ alpha} [/ matemática] entre las dos bases vectoriales, es decir, [matemática] \ parcial / \ parcial y ^ {\ beta} = A ^ {\ alpha} _ {\ beta} \, [/ math] [math] \ partial / \ partial x ^ {\ alpha}. [/ math] Pero, ¿qué significa esto [math] A _ {\ beta} ^ {\ alfa} [/ math] parece?

Sucede que [math] A _ {\ beta} ^ {\ alpha} = \ partial x ^ {\ alpha} / \ partial y ^ {\ beta}, [/ math] que requiere algo de trabajo para demostrarlo. Pero esa cantidad se llama jacobiana, por lo general no la llamamos derivada (operador). Es simplemente la transformación entre bases de coordenadas.

Por lo tanto, no usamos derivados como cambios de coordenadas, en su lugar usamos Jacobian. Espero que sus dos preguntas puedan ser respondidas.

Si estamos pensando en el mismo fenómeno, la respuesta no es tan complicada. De hecho, es solo la regla de la cadena familiar del cálculo, pero disfrazado un poco hace un contexto de múltiples variables.

Piense en un caso muy simple con el que probablemente esté familiarizado: el cambio de coordenadas rectangulares a polares:

[matemáticas] x = r \ cos \ theta [/ matemáticas]

[matemáticas] y = r \ sin \ theta [/ matemáticas]

Frio. ¿Qué pasa si quieres integrar algo? Si se está integrando en algún área U, entonces

[matemáticas] \ iint_U f (x, y) \; dxdy = \ iint_U f (r \ cos \ theta, r \ sin \ theta) rdrd \ theta [/ math]

¿De dónde viene ese extra [math] r [/ math] en la fórmula? Dependiendo del nivel de detalle que desee, puede decir que proviene de la regla de la cadena, o de la matriz jacobiana de la transformación, o incluso podría responder de una manera más detallada que básicamente equivale a volver a probar la regla de la cadena en el contexto de esta transformación de coordenadas particular.

Pero de ahí provienen esos derivados. Recomiendo estudiar el ejemplo simple de una transformación de coordenadas hasta el punto en que realmente lo entiendes, y luego ver si eso no ilumina lo que está sucediendo con las transformaciones en las que estás pensando en el caso GR / múltiple.

Imagine en algún lugar de Singapur (piense en el ecuador) dos personas, Alice y Bob, cada una toma una hoja de papel y, usando una brújula, dibuja una flecha que apunta hacia el norte en cada hoja. Luego acuerdan el siguiente experimento: donde sea que vayan, tomarán estas hojas de papel y nunca dejarán que sus flechas cambien su dirección, por lo que en cada momento la flecha apuntará en la misma dirección que en el momento anterior. Entonces Alice se mueve directamente hacia el norte hasta el poste. Simplemente se mueve en la dirección de su flecha que apunta hacia el norte y llega al poste, ahora su flecha apunta a alguna dirección específica a lo largo de la línea de su camino. Mientras tanto, Bob se muda de Singapur hacia el oeste hasta llegar a África. Durante su viaje, mantiene la dirección de la flecha paralela a sí misma, por lo que cuando llega a África la flecha todavía apunta hacia el norte. Luego se mueve hacia el norte hasta el poste y se encuentra con Alice allí. ¡Miran sus flechas y las ven apuntando en direcciones muy diferentes, casi perpendiculares! Pero ambos hicieron todo lo posible para preservar la dirección, ¿cómo es que terminaron con direcciones tan diferentes al final? Este es el efecto del espacio curvo en el que viajaron. No existe una única forma correcta de transformar vectores (traducir sus coordenadas) al saltar del punto A al punto B. El resultado de la transformación depende de la ruta tomada. Entonces, la única forma significativa de transformar vectores / coordenadas es hacerlo moviéndose en pasos minúsculos, lo que significa usar derivados.

La respuesta de Viktor T. Toth es la más relevante y la más correcta. Solo intentaré decir algo similar de una manera más simple.

En el espacio euclidiano, imaginamos un vector como una flecha desde el punto A al punto B. En el caso del espacio euclidiano (digamos, plano), tanto el punto A como B se encuentran en el plano y el vector los conecta.

Si el espacio es curvo, no funciona. Imagine una esfera y elija un punto A. Luego, si dibuja un vector que sea tangente a la esfera y comience en el punto A, su punto final estará fuera de la esfera. Entonces, el punto final ya no es un punto del espacio.

Por lo tanto, no puede definir un vector como segmento de línea orientado, porque el punto final del vector ya está en un espacio diferente. Entonces, necesitamos otra definición de un vector que sea consistente con nuestra comprensión intuitiva de qué vector es.

Ahora, puede imaginar que si calcula una derivada parcial de una función, por ejemplo

[matemáticas] \ dfrac {\ parcial f} {\ parcial x} [/ matemática]

en realidad tiene un significado geométrico: es una tasa de cambio de función f cuando te mueves en la dirección del eje x , o, en otras palabras, en la dirección del vector unitario que apunta en la dirección x .

Usualmente haces geometría diferencial (¡y relatividad general!) En el espacio llamado múltiple que es, en términos generales, un conjunto en el que puedes introducir coordenadas. En el múltiple curvado general no puede introducir coordenadas cartesianas (es decir, coordenadas donde los ejes son líneas rectas con el ángulo recto entre ellos), pero puede introducir muchos otros tipos de coordenadas (cualquier sistema de coordenadas que respete el grado de diferenciabilidad del múltiple, pero Esa es otra historia).

Aunque no puede introducir un segmento de línea en tal múltiple y llamarlo un vector, todavía tiene algunas coordenadas y puede tomar derivadas parciales con respecto a ellas. Entonces, si tienes un conjunto de coordenadas

[matemáticas] x ^ i \ equiv (x ^ 1, x ^ 2, \ puntos x ^ n), [/ matemáticas]

puedes definir operadores

[math] \ partial_i \ equiv \ dfrac {\ partial} {\ partial x ^ i} [/ math]

que, cuando actúa sobre una función f , le da las derivadas direccionales correspondientes de la función f . Desde el punto de vista algebraico, estos operadores forman un espacio vectorial (puede hacer combinaciones lineales de ellos) y tienen todas las propiedades de los vectores. Por lo tanto, puede usar esto como una definición de un vector: es un operador diferencial que actúa sobre una función f y devuelve su derivada en una dirección dada. La regla de transformación para los componentes de los vectores se sigue de la regla de la cadena para la diferenciación.

De manera similar, la base de los vectores duales se puede identificar con los “diferenciales” [math] \ mathrm {d} x ^ i. [/ Math]

En un lenguaje más abstracto, los vectores se definen como secciones de paquetes apropiados, que es una definición que también se generaliza a los hiladores.

En realidad es un malentendido. La notación principal se usa de dos maneras diferentes.

El cálculo fue desarrollado independientemente por dos contemporáneos, Gottfried Leibnitz y Sir Isaac Newton. Leibnitz creó y usó la notación [math] df (x) / dx [/ math] para reflejar el límite de [math] Δf (x) / Δx [/ math]; Newton empleó el primo para denotar una función “derivada” de otra función. La convención se atascó.

En la teoría de la relatividad, el primo se usa para denotar un segundo marco de referencia. Un cambio coordinado entre un marco de referencia [matemática] K (x, y, z, t) [/ matemática] y un segundo marco de referencia [matemática] K ‘(x’, y ‘, z’, t ‘) [/ matemática ] no es una derivada en absoluto. Es solo una forma de poder distinguir a los dos mientras se puede ver qué corresponde a qué. Podría haberse hecho con la misma facilidad con los subíndices, pero Einstein eligió usar el prime en su lugar. La convención se atascó.

Puede ser discordante para principiantes. Si ayuda, recuerde que muchas palabras en inglés se ven y suenan similares, pero significan cosas diferentes. Mientras tenga su contexto claro, puede evitar confundirse entre los dos significados.

EDITAR:

En los comentarios, alguien sugirió que el OP pregunta por la transformación del tensor. Si es así, el usuario dio una respuesta mucho mejor. Pero tomé la declaración del OP de que él es “un principiante” al pie de la letra. Quizás el OP pueda aclarar la pregunta.

Yo diría que la razón principal es la conveniencia. Déjame mostrarte un ejemplo sencillo.

Las transformaciones de coordenadas en la relatividad general son, bueno, generales, entre sistemas de coordenadas arbitrarias (curvas).

Déjame hacer esto por simplicidad en dos dimensiones. Digamos, tengo un sistema de coordenadas [matemáticas] (x ^ 1, x ^ 2) [/ matemáticas], y un nuevo sistema de coordenadas [matemáticas] (y ^ 1, y ^ 2) [/ matemáticas]. En general, tanto [matemática] y ^ 1 [/ matemática] como [matemática] y ^ 2 [/ matemática] son ​​funciones de [matemática] x ^ 1 [/ matemática] y [matemática] x ^ 2 [/ matemática]: [matemáticas] y ^ 1 (x ^ 1, x ^ 2) [/ matemáticas] y [matemáticas] y ^ 2 (x ^ 1, x ^ 2) [/ matemáticas]. Pero esta forma funcional de las transformaciones de coordenadas no siempre se proporciona convenientemente, ni siempre es conveniente usarla.

En particular, piense en la definición del elemento de línea:

[matemáticas] ds ^ 2 = g ^ {(x)} _ {ij} dx ^ idx ^ j = g ^ {(y)} _ {ij} dy ^ idy ^ j, [/ matemáticas]

donde utilicé [math] g ^ {(x)} _ {ij} [/ math] y [math] g ^ {(y)} _ {ij} [/ math] para denotar las formas de la métrica que corresponden a el [math] x [/ math] vs. el sistema de coordenadas [math] y [/ math].

De ninguna manera es evidente a partir de la forma funcional de las coordenadas [matemáticas] y [/ matemáticas] cómo se transforma la métrica. Estoy seguro de que puede resolverlo, pero no es fácil.

Por otro lado … déjame tomar algunas derivadas parciales. De hecho, déjame formar la matriz

[matemáticas] J_i ^ j = \ begin {pmatrix} \ dfrac {\ partial y ^ 1} {\ partial x ^ 1} & \ dfrac {\ partial y ^ 2} {\ partial x ^ 1} \\ \ dfrac { \ partial y ^ 1} {\ partial x ^ 2} & \ dfrac {\ partial y ^ 2} {\ partial x ^ 2} \ end {pmatrix}. [/ math]

Esta matriz se llama matriz jacobiana. Volviendo al elemento lineal invariante, tengo, desde la regla de la cadena de diferenciación parcial,

[matemáticas] ds ^ 2 = g ^ {(x)} _ {ij} dx ^ idx ^ j = g ^ {(x)} _ {ij} \ dfrac {\ parcial x ^ i} {\ parcial y ^ k } dy ^ k \ dfrac {\ partial x ^ j} {\ partial y ^ l} ​​dy ^ l, [/ math]

del cual el tensor métrico transformado se puede leer fácilmente:

[matemáticas] g ^ {(y)} _ {kl} = g ^ {(x)} _ {ij} \ dfrac {\ parcial x ^ i} {\ parcial y ^ k} \ dfrac {\ parcial x ^ j } {\ partial y ^ l} ​​= J ^ i_kJ ^ j_lg ^ {(x)} _ {ij}. [/ math]

¿Ver? Es fácil. Si tengo la transformación de coordenadas dada en forma de matriz jacobiana, puedo aplicarla fácilmente para transformar los tensores. Además, la matriz jacobiana tiene otros usos; por ejemplo, si su determinante (como era de esperar, el determinante jacobiano) es cero, sé que mi transformación de coordenadas es degenerada. Nuevamente, esto no es algo que se pueda determinar trivialmente a partir de la forma funcional.

Este es un vector en dos dimensiones en coordenadas cartesianas.

[matemática] V = V ^ x \ frac {\ parcial} {\ parcial x} + V ^ y \ frac {\ parcial} {\ parcial y} [/ matemática]

¿Cómo lo expresamos en coordenadas cartesianas preparadas?

[matemáticas] V ‘= V ^ {x’} \ frac {\ partial} {\ partial x ‘} + V ^ {y’} \ frac {\ partial} {\ partial y ‘} [/ matemática]

[matemática] V ^ {x ‘} = \ frac {\ partial x’} {\ partial x} V ^ x + \ frac {\ partial x ‘} {\ partial y} V ^ y [/ matemática]

[matemáticas] V ^ {y ‘} = \ frac {\ partial y’} {\ partial x} V_x + \ frac {\ partial y ‘} {\ partial y} [/ math]

Ahora los vectores base.

[mates] \ frac {\ partial} {\ partial x ‘} = \ frac {\ partial x} {\ partial x’} \ frac {\ partial} {\ partial x} + \ frac {\ partial y} {\ parcial y ‘} \ frac {\ partial} {\ partial y} [/ math]

[matemáticas] \ frac {\ partial} {\ partial y ‘} = \ frac {\ partial x} {\ partial y’} \ frac {\ partial} {\ partial x} + \ frac {\ partial y} {\ parcial y ‘} \ frac {\ partial} {\ partial y} [/ math].

Ahora, si supiera que esta pregunta tenía 20 años y ya tenía dos docenas de respuestas …

Su pregunta no está clara, cuál es la coordenada de cambio que desea hacer y qué escalar, vector, tensor desea diferenciar