¿Cómo la multiplicación de un vector 4 con la métrica de Minkowski en relatividad especial lo convierte de un vector contravariante a un vector covariante?

Este es en realidad un resultado muy general aplicable mucho más allá del caso de la métrica de Minkowski y las transformaciones de Lorentz. Entonces, para aclarar el significado esencial detrás de ‘bajar un índice’, trabajaré en un entorno bastante general.

Comenzamos con un espacio vectorial (dimensiones finitas) [matemática] V [/ matemática] sobre cierto campo, tomemos cuál es [matemática] \ mathbb R [/ matemática]. El espacio de los mapas lineales de [math] V [/ math] a [math] \ mathbb R [/ math] también es un espacio vectorial (ya que las combinaciones lineales de mapas lineales también son lineales). Se dice que este espacio [matemática] V ^ \ estrella [/ matemática] es dual a [matemática] V [/ matemática], y es lo que un físico de materia condensada llamaría espacio vectorial recíproco.

Ahora, suponga que tiene un mapa lineal [math] \ phi: V \ rightarrow W [/ math], donde [math] V [/ math] y [math] W [/ math] son ​​espacios vectoriales. Esto canónicamente induce un mapa [matemático] \ phi ^ t: W ^ \ star \ rightarrow V ^ \ star [/ math] entre los respectivos espacios duales en la dirección opuesta . Aquí es cómo. Digamos que comienza con un mapa lineal [math] g: W \ rightarrow \ mathbb R [/ math] que por definición es un elemento de [math] W ^ \ star [/ math]. Este mapa [math] g [/ math] envía vectores [math] w \ en W [/ math] a números reales. Ahora, digamos que tenemos un vector [math] v \ en V [/ math]. Podemos usar [math] \ phi [/ math] para llevarlo a un vector [math] w = \ phi (v) \ en W [/ math] y luego componerlo con [math] g [/ math] para obtener un mapa [math] f: V \ rightarrow \ mathbb R [/ math] dado por [math] f = g \ circ \ phi [/ math] (las composiciones deben leerse de derecha a izquierda). En otras palabras, podemos usar [math] \ phi [/ math] para enviar elementos en [math] W ^ \ star [/ math] a elementos en [math] V ^ \ star [/ math]. Esta asignación es precisamente el mapa de transposición [math] \ phi ^ t [/ math]. Como ejercicio, es posible que desee ver que si toma los vectores en [math] V [/ math] para ser vectores de columna y aquellos en [math] V ^ \ star [/ math] para dejar la multiplicación por vectores de fila, La noción de transposición introducida aquí es equivalente a la noción de transposición familiar de las matrices.

A continuación, consideramos la cuestión de cuál es la dimensión de [matemáticas] V ^ \ star [/ matemáticas]. Un pequeño pensamiento debería convencerlo de que es lo mismo que [math] V [/ math]. Aquí está la idea básica. Usted comienza con una base [matemática] v_i [/ ​​matemática] de [matemática] V [/ matemática] y considera los mapas [matemática] f ^ j \ en V ^ \ star [/ matemática] tal que [matemática] f ^ j (v_i) = \ delta ^ j_i [/ ​​math]. Entonces, [matemáticas] f ^ 1 [/ matemáticas] envía [matemáticas] v_1 [/ matemáticas] a [matemáticas] 1 [/ matemáticas] y todo lo demás a [matemáticas] 0 [/ matemáticas], [matemáticas] f ^ 2 [ / math] envía [math] v_2 [/ math] a [math] 1 [/ math] y todo lo demás a [math] 0 [/ math], y así sucesivamente. Evidentemente, estos [math] f ^ j [/ math] forman una base para [math] V ^ \ star [/ math] y se deduce de inmediato que [math] \ mathrm {dim} \, V = \ mathrm { dim} \, V ^ \ star [/ math].

Sabemos que dos espacios vectoriales de la misma dimensión son isomorfos, y de hecho [matemática] V [/ matemática] y [matemática] V ^ \ star [/ matemática] son isomorfas. Sin embargo, no son canónicamente isomórficos, lo que significa que no existe un isomorfismo natural para distinguir en medio de la gran cantidad de isomorfismos disponibles. Pero, ¿qué pasa con la receta que describimos en el párrafo anterior que tomó elementos básicos en [matemáticas] V [/ matemáticas] a elementos básicos en [matemáticas] V ^ \ estrella [/ matemáticas]? Seguramente, parece una elección natural. En realidad no. Esa elección es sensible a la elección de base que hacemos. Para ver esto, tenga en cuenta que si hubiéramos elegido una base diferente dada por [math] \ phi (v_i) [/ math] donde [math] \ phi [/ math] es un mapa lineal invertible de [math] V [/ math ] para sí mismo, es decir, un automorfismo, la base correspondiente en [matemáticas] V ^ \ star [/ matemáticas] sería [matemáticas] (\ phi ^ t) ^ {- 1} (f ^ j) [/ matemáticas] en lugar de [matemática] \ phi (f ^ j) [/ matemática] (*) (solo repita los argumentos en el tercer párrafo con [matemática] V = W [/ matemática]). En esencia, los dos espacios vectoriales [matemática] V [/ matemática] y [matemática] V ^ \ estrella [/ matemática] no son canónicamente isomórficos porque se transforman de manera diferente.

Sin embargo, hay una manera de hacerlos canónicamente isomórficos agregando más estructura. A saber, presentamos un producto interno [math] \ langle \ cdot, \ cdot \ rangle: V \ times V \ rightarrow \ mathbb R [/ math]. Ahora, dado un vector [matemático] v \ en V [/ matemático], podemos elegir canónicamente el mapa [matemático] f = \ langle v, \ cdot \ rangle \ en V ^ \ star [/ matemático]. Por el contrario, si tenemos un isomorfismo canónico [math] \ flat: V \ rightarrow V ^ \ star [/ math], el producto interno [math] \ langle v, v ‘\ rangle [/ math] puede definirse simplemente como [ matemática] v ^ \ flat (v ‘) [/ math] (el mapa [math] \ flat [/ math] y su inverso [math] \ sharp [/ math] se llaman isomorfismos musicales y generalmente se escriben como superíndices para que [matemáticas] v ^ \ flat: = \ flat (v) [/ math] y [math] f ^ \ sharp = \ sharp (f) [/ math]). Las dos nociones son, por lo tanto, completamente equivalentes.

Usar el producto interno para mapear un vector en [matemática] V [/ matemática] a un vector dual en [matemática] V ^ \ estrella [/ matemática] es lo que esencialmente está haciendo cuando ‘multiplica el vector por la métrica’. Ya que [math] (V ^ \ star) ^ \ star [/ math] es canónicamente isomorfo a [math] V [/ math] sin la necesidad de ninguna estructura adicional como productos internos (¡muestre esto!), Puede llamar al elementos de [math] V [/ math] o [math] V ^ \ star [/ math] como contravariante y la otra covariante (tenga en cuenta el hecho de que la matriz métrica para uno es la inversa de la del otro). Los físicos generalmente se refieren a los vectores tangentes en una variedad como contravariantes y sus dobles, los vectores cotangentes, como covariantes. Esta elección de terminología es bastante curiosa si está familiarizado con la teoría de categorías, en la que los functores que preservan las direcciones de los morfismos, como el functor de espacio tangente (definido en múltiples lisos con un punto distinguido) se denominan covariantes y functores que invierten Las direcciones de los morfismos como el functor espacial cotangente (nuevamente definido en múltiples lisos con un punto distinguido) se denominan contravariantes. ¿Pero qué hay en un nombre?

(*) Hablando estrictamente, [math] \ phi (f ^ j) [/ math] ni siquiera tiene sentido ya que el dominio de [math] \ phi [/ math] es [math] V [/ math], no [matemáticas] V ^ \ estrella [/ matemáticas]. Pero lo que quiero decir es lo siguiente. Digamos, por ejemplo, que tiene una base [matemática] \ {v_1, v_2 \} [/ matemática] de [matemática] V [/ matemática], y tiene [matemática] \ phi (v_1) = av_1 + bv_2 [/ matemática] y [math] \ phi (v_2) = cv_1 + dv_2 [/ math]. La nueva base para [math] V ^ \ star [/ math] no viene dada por [math] af ^ 1 + bf ^ 2 [/ math] y [math] cf ^ 1 + df ^ 2 [/ math], sino que

[matemáticas] (\ phi ^ t) ^ {- 1} (f ^ 1) = \ frac {df ^ 1-cf ^ 2} {ad-bc}, [/ math] [matemáticas] (\ phi ^ t) ^ {- 1} (f ^ 2) = \ frac {-bf ^ 1 + af ^ 2} {ad-bc}. [/ Math]

El papel especial que desempeña la métrica aquí es que proporciona una identificación de un espacio vectorial [matemático] V [/ matemático] con su espacio dual [matemático] V ^ * [/ matemático] de formas únicas o vectores cotangentes. Esto se debe a que la métrica proporciona una forma natural de multiplicar dos vectores tangentes, a través del producto interno inducido o producto de puntos, mientras que sin la métrica solo se sabe cómo evaluar un vector cotangente como un funcional lineal en un vector tangente.

En otras palabras, dado un vector tangente [math] v [/ math], la función curry [math] \ langle v, \ cdot \ rangle [/ math] ahora es una función lineal en vectores tangentes, es decir, un vector cotangente. Al mismo tiempo, si [math] f [/ math] es un vector cotangente, entonces existe un vector tangente [math] v [/ math] tal que [math] f (w) = \ langle v, w \ rangle [/matemáticas].

Entonces, ¿con qué precisión se relaciona esto con la multiplicación por la métrica? Dado un vector tangente [matemático] v ^ i [/ matemático], la contracción [matemática] g_ {ij} v ^ j [/ matemático] es evidentemente un tensor con un solo índice inferior: un vector cotangente. A menudo escribimos este vector cotangente usando el mismo símbolo que usamos para el vector tangente original, en este caso como [math] v_i [/ ​​math]. Entonces, la multiplicación con la métrica nos ha dado un vector cotangente de un vector tangente, que luego podemos usar para calcular un producto interno con otro vector tangente, como se indicó anteriormente.

Para que esto sea más explícito, considere que podemos definir un producto interno entre los vectores [matemática] v ^ j [/ matemática] y [matemática] w ^ i [/ matemática] a través de [matemática] g_ {ij} v ^ jw ^ yo [/ matemáticas]. Esto se reduce a las expresiones familiares cuando se usan las métricas Euclidiana o Minkowski, ya que muchas de las entradas de la forma matricial de la métrica son cero. Pero ahora encontramos que [matemáticas] g_ {ij} v ^ jw ^ i = v_i w ^ i [/ matemáticas] – en otras palabras, el vector cotangente [matemáticas] v_i [/ ​​matemáticas] que obtuvimos mediante la multiplicación por la métrica ahora está desempeñando el papel de la función de producto interno al curry mencionada anteriormente.

Este es un caso especial de la operación más general de bajar un índice en un tensor. Esta frase se refiere exactamente a lo que hicimos anteriormente: contraer con el tensor métrico para obtener un nuevo tensor donde uno de los índices superiores ahora aparece como un índice inferior. Es convencional usar siempre el mismo símbolo base para el nuevo tensor. También se puede elevar un índice multiplicando por la métrica inversa [matemática] g ^ {ij} [/ matemática].

Gracias por el A2A.

Esto se puede entender mejor en términos de matrices. Un vector contravariante (también llamado 4-vector) [matemática] b [/ matemática] se define para transformarse bajo una transformación de Lorentz como
[matemáticas]
b \ to \ Lambda b
[/matemáticas]
donde [matemáticas] \ Lambda [/ matemáticas] satisface
[matemáticas]
\ Lambda ^ T \ eta \ Lambda = \ eta \ implica \ eta \ Lambda = \ left (\ Lambda ^ {- 1} \ right) ^ T \ eta ………. (1)
[/matemáticas]
Un vector covariante [matemática] a [/ matemática] se define para transformar como
[matemáticas]
a \ to \ left (\ Lambda ^ {- 1} \ right) ^ T a
[/matemáticas]
Esta definición se usa para que la cantidad [matemática] a ^ T b [/ matemática] (conocida como producto interno) sea invariante de Lorentz. Podemos comprobar esto
[matemáticas]
a ^ T b \ to \ left (\ left (\ Lambda ^ {- 1} \ right) ^ T a \ right) ^ T \ left (\ Lambda b \ right) = a ^ T \ Lambda ^ {- 1} \ Lambda b = a ^ T b
[/matemáticas]
según sea necesario.

Ahora, para responder a su pregunta que es: Si [math] b [/ math] es un vector contravariante, ¿por qué es [math] \ eta b [/ math] un vector covariante? Para responder a esta pregunta, consideremos la transformación de Lorentz de [math] \ eta b [/ math]. Esto es
[matemáticas]
\ eta b \ to \ eta \ left (\ Lambda b \ right) = \ left (\ Lambda ^ {- 1} \ right) ^ T \ left (\ eta b \ right)
[/matemáticas]
donde hemos usado la propiedad (1) de [math] \ Lambda [/ math]. Por lo tanto, vemos que [math] \ eta b [/ math] se transforma como un vector covariante. Dado que esta es precisamente la definición de un vector covariante, concluimos que [math] \ eta b [/ math] es un vector covariante.

QED

More Interesting

¿En qué circunstancias la velocidad inicial de un proyectil lanzado desde la superficie de una esfera del tamaño de la Tierra será menor que su velocidad final?

Si dos objetos se mueven en ángulo recto a cada uno a la velocidad de la velocidad de la luz, ¿cuál es la velocidad relativa entre ellos?

¿Tardaría mucho tiempo incluso con la velocidad de la luz en llegar a otra galaxia?

¿Es real la dilatación del tiempo? En caso afirmativo, entonces, ¿cómo es posible que la longitud quede atrapada solo debido al movimiento? ¿O es solo un resultado matemático?

¿Por qué se toma el movimiento de un reloj como prueba de dilatación del tiempo?

¿Qué pasaría si los pedos viajaran a la velocidad de la luz?

¿Puede un tren contratado cerrar un circuito?

¿Qué es más correcto "la velocidad de la luz es constante" o "todas las mediciones de luz dan un valor constante"?

¿Qué planeta es considerado como el gemelo de la tierra?

¿Las Ecuaciones de Maxwell predicen el valor real de la velocidad de la luz o simplemente que es el mismo valor para todas las ondas EM en el vacío?

Si un electrón pudiera viajar más rápido que la velocidad de la luz, ¿eso explicaría propiedades extrañas como cómo puede estar en dos lugares al mismo tiempo?

¿Qué problemas podrían encontrar los humanos si la luz fuera más rápido que ahora?

¿Bhagvad Gita tiene textos sobre diferentes planos de existencia y dilatación del tiempo? ¿Eso significa que los antiguos indios tenían conocimiento de la dilatación del tiempo?

¿Qué sugiere realmente la teoría de la dilatación del tiempo?

¿Hay alguna diferencia en términos de relatividad general entre el vacío y un medio diferente si la luz se mueve más lentamente en un medio diferente?