Recibo muchas solicitudes de respuestas a preguntas sobre relatividad y me encuentro refiriéndome a enlaces a mis respuestas anteriores varias veces. Para evitar este inconveniente, tanto para mí como para el lector, mi respuesta será en forma de un mini curso sobre Relatividad Especial. Esto será lo más básico posible, pero a veces requerirá algunas matemáticas de nivel universitario. La discusión se organizará en secciones para la conveniencia del lector y para que, al hacer referencia a esta respuesta en otras publicaciones, pueda citar una sección relevante para temas específicos.
Antecedentes históricos
En el siglo XVI, Nicolaus Copernicus introdujo la teoría heliocéntrica del movimiento planetario, eliminando la Tierra del centro del sistema solar y relegándola al estado de un planeta que orbita el sol, junto con los otros cinco planetas conocidos en ese momento. La idea del sol como el centro del sistema solar se encontró con mucha oposición, y quienes optaron por la razón en lugar del dogma religioso en sus ataques presentaron argumentos en contra del modelo. Un argumento que se utilizó fue que el movimiento de la Tierra sería detectable a través de simples experimentos mecánicos, si de hecho la Tierra se moviera. Algunos argumentaron que una piedra caída no caería hacia abajo sino que adquiriría algo de movimiento en una dirección opuesta a la dirección del movimiento de la Tierra en su órbita.
Galileo Galilea, quien fue uno de los primeros defensores del sistema copernicano, respondió a las objeciones a una Tierra en movimiento con experimentos de pensamiento en su Diálogo sobre los dos sistemas mundiales principales . Galileo imaginó un barco navegando suavemente en línea recta en un mar completamente tranquilo, lo que hoy llamaríamos un marco de referencia inercial. Debajo de la cubierta, uno no podía discernir el movimiento del barco con experimentos como el balanceo de un péndulo, el agua que gotea de un contenedor, los marineros caminando o cualquier otro medio mecánico. Un recipiente arrojado por el cocinero del barco caería directamente al suelo y no adquiriría un componente de velocidad hacia atrás. Las observaciones de Galileo se pueden resumir en la declaración del principio de relatividad galileano:
Las leyes de la mecánica son las mismas en todos los marcos de referencia inerciales .
Isaac Newton incorporó el principio de relatividad galileano en sus leyes de mecánica expuestas en su gran trabajo Philosophiae Naturalis Principia Mathematica , que incluía su teoría de la gravitación, la invención del cálculo (desarrollada independientemente por Gottfried Leibniz aproximadamente al mismo tiempo) y la óptica . La teoría de la luz de Newton, como se establece en Principia, era que la luz consistía en una corriente de partículas llamadas corpúsculos. Newton pudo derivar la ley de refracción con su modelo de luz al suponer que los corpúsculos experimentaron una fuerza de aceleración cuando entraron en un medio más denso, como el vidrio, de modo que la luz viajaba más rápido en el vidrio que en el aire. Por supuesto, la ley de la reflexión se explicaba fácilmente por la teoría corpuscular como un rebote de partículas que inciden en una superficie.
El físico holandés Christiaan Huygens propuso una teoría competitiva de la luz; Una teoría de que la luz se propaga como ondas. En la teoría de Huygens, las ondas de luz viajaban más lentamente en un medio más denso que el aire. Usando lo que ahora se llama una construcción Huygens, Huygens también pudo derivar las leyes de refracción y reflexión. Al no haber experimentos en el momento capaces de decidir el asunto, la reputación de Newton llevó el día y la teoría corpuscular fue generalmente aceptada.
En la época en que Newton y Huygens desarrollaron sus teorías de la luz, el astrónomo danés Ole Rømer utilizó observaciones de la luna de Júpiter Io, en diferentes épocas del año, para mostrar que la luz tenía una velocidad finita y obtener una estimación de esa velocidad. de unos 300,000 kilómetros por segundo. La precisión de las mediciones de la velocidad de la luz mejoró enormemente en el siglo XIX a través de experimentos de Hippolyte Fizeau, Léon Foucault y Albert A. Michelson; este último continuó haciendo mediciones mejoradas hasta bien entrado el siglo veinte. La última medición de Michelson dio un valor de 299,774 ± 11 km / s, muy cerca del valor aceptado hoy.
Los fenómenos de difracción e interferencia, estudiados por Thomas Young y Augustin-Jean Fresnel a principios del siglo XIX, condujeron a la aceptación universal de la teoría ondulatoria de la luz. La propiedad de la luz de que se puede polarizar mostró que la luz es una onda transversal.
Mientras tanto, a medida que se establecían las propiedades de la luz, otros físicos experimentaban con la electricidad y el magnetismo, dos fenómenos que al principio parecían no estar relacionados. Charles-Augustin de Coulomb descubrió la ley del cuadrado inverso de la atracción y la repulsión de las cargas puntuales, que ahora llevan su nombre. Hans Christian Ørsted descubrió que una corriente eléctrica produce un campo magnético, y Jean-Baptiste Biot y Félix Savart descubrieron la fórmula matemática utilizada para calcular el campo magnético de un elemento de corriente. André-Marie Ampère descubrió su regla circuital, relacionando la integral de línea del campo magnético alrededor de una curva cerrada con la corriente que pasa a través de cualquier superficie que tenga la curva como límite. Se estableció que los polos magnéticos siempre se encontraban en pares opuestos, y Michael Faraday estableció la ley de la inducción electromagnética y los conceptos de campos eléctricos y magnéticos.
James Clerk Maxwell publicó un conjunto de ecuaciones que resumen todas las leyes de electricidad y magnetismo en los años 1861 a 1862, e incluyó una modificación de la ley de Ampère requerida para producir la ley de conservación de la carga eléctrica. Maxwell usó sus ecuaciones para mostrar que las ondas electromagnéticas deben existir, que deben ser ondas transversales, y demostró que deben viajar a través del vacío a la velocidad de la luz. Al comparar la ecuación satisfecha por las ondas electromagnéticas con la ecuación diferencial parcial estándar de ondas de todo tipo, Maxwell pudo demostrar que la velocidad de la luz en el vacío, ahora denotada por [math] c [/ math], está relacionada con la permitividad eléctrica del vacío, [math] \ epsilon_0 [/ math], y la permeabilidad magnética del vacío, [math] \ mu_0 [/ math], por
[matemática] c = \ dfrac {1} {\ sqrt {\ epsilon_ {0} \ mu_ {0}}} [/ matemática].
Se suponía que los campos eléctricos y magnéticos combinados, ahora llamados campos electromagnéticos, estaban soportados por un medio, llamado éter luminífero. Después de todo, otras ondas conocidas por los físicos en ese momento, ondas de sonido, ondas de agua, ondas en una cuerda, etc., necesitan un medio a través del cual viajar. ¡Uno no puede tener olas en una cuerda sin la cuerda! Tengo una publicación original de un libro sobre electromagnetismo del famoso físico Paul Drude, con el título Physik des Aethers (La traducción al inglés es Física del éter ). Menciono el libro de Drude para enfatizar que los físicos de la época tomaron en serio la existencia del éter luminífero.
El experimento de Michelson-Morley
Debido a su predicción de la independencia de la velocidad de la luz en la dirección de propagación, los físicos del siglo XIX asumieron que las ecuaciones de Maxwell eran ciertas exactamente, solo en un supuesto marco de referencia inercial del éter. Existe, por lo tanto, la cuestión natural de la velocidad de la Tierra a través del presunto éter, y hubo intentos de responder a esta pregunta, sobre todo por Albert A. Michelson, y luego por Michelson y Edward W. Morley. Tales experimentos se llaman experimentos de deriva de éter. La imagen a continuación es un esquema del interferómetro de Michelson utilizado en el experimento de deriva de éter de Michelson-Morley.
Si el interferómetro de Michelson se ajusta de manera que los haces de luz incidan en los espejos en A y B perpendicularmente, entonces la pantalla se iluminará de manera uniforme, con una intensidad que dependerá del grado en que los haces de retorno estén en fase. Las vigas que están exactamente en fase dan como resultado una intensidad máxima. Las vigas que están completamente desfasadas no producen iluminación. Sin embargo, si uno de los espejos está ligeramente inclinado con respecto al haz de luz, se mostrará una serie de franjas claras y oscuras en la pantalla, como en la ilustración. Cada franja clara ocurre donde los haces de retorno están en fase y cada franja oscura ocurre donde los haces están desfasados.
Cualquier cosa que aumente el tiempo de viaje de un haz sobre el otro causará un cambio en las franjas de interferencia. Tal aumento en el tiempo de viaje puede efectuarse dando al interferómetro una velocidad, [matemática] v [/ matemática], relativa al éter en la dirección de uno de los brazos del aparato, por ejemplo a lo largo de la dirección de desplazamiento desde el fuente al espejo B. Dado que la Tierra orbita alrededor del sol, debe haber algún tiempo durante el año en que la Tierra se mueva en relación con el marco de referencia del éter.
Si llamamos al tiempo de viaje de un haz de luz desde el divisor de haz al espejo B y viceversa [math] t_B [/ math], entonces
[matemática] t_B = \ dfrac {L} {c – v} + \ dfrac {L} {c + v} = \ dfrac {2cL} {c ^ 2 – v ^ 2} [/ math], que es equivalente algebraicamente a
[matemáticas] t_B = \ dfrac {2L} {c} \ left (1 – \ frac {v ^ 2} {c ^ 2} \ right) ^ {- 1} [/ math].
Suponiendo que [math] \ frac {v ^ 2} {c ^ 2} \ lt 1 [/ math], una expansión en serie da
[matemáticas] t_B = \ dfrac {2L} {c} \ left (1 + \ frac {v ^ 2} {c ^ 2} + \ frac {v ^ 4} {c ^ 4} + \ cdots \ right) [ /matemáticas].
Si [math] \ vec u [/ math] es la velocidad de un haz de luz, en relación con el interferómetro, a medida que viaja desde el divisor del haz hasta el espejo A, entonces
[matemáticas] \ vec c = \ vec u + \ vec v [/ matemáticas]. Como [math] \ vec u [/ math] es perpendicular a [math] \ vec v [/ math], uno tiene
[matemáticas] u \ equiv | \ vec u | = \ sqrt {c ^ 2 – v ^ 2} [/ math]. Por lo tanto, el tiempo, [math] t_A [/ math], para que el rayo viaje desde el divisor del rayo al espejo A y de regreso es
[matemáticas] t_A = \ dfrac {2L} {u} = \ dfrac {2L} {c} \ left (1 – \ frac {v ^ 2} {c ^ 2} \ right) ^ {- 1/2} [ /matemáticas].
Una expansión en serie da
[matemáticas] t_A = \ dfrac {2L} {c} \ left (1+ \ frac {1} {2} \ frac {v ^ 2} {c ^ 2} + \ frac {3} {8} \ frac { v ^ 4} {c ^ 4} + \ cdots \ right) [/ math].
Por lo tanto,
[matemática] \ Delta t \ equiv t_B – t_A \ gt 0 [/ matemática].
Si se observan las franjas y todo el aparato se gira [matemática] 90 ^ \ circ [/ matemática], cada haz experimenta un cambio en el tiempo de viaje igual a [matemática] \ Delta t [/ matemática]. Por lo tanto, la diferencia de tiempo entre los viajes de ida y vuelta para las vigas, generada por la rotación [matemática] 90 ^ \ circ [/ matemática] es [matemática] 2 \ Delta t [/ matemática]. Por lo tanto, el patrón de interferencia debería cambiar en varias franjas
[matemáticas] \ Delta N = \ dfrac {2c \ Delta t} {\ lambda} \ gt \ dfrac {2L} {\ lambda} \ dfrac {v ^ 2} {c ^ 2} [/ matemáticas],
donde [math] \ lambda [/ math] es la longitud de onda de la luz utilizada en el experimento.
La velocidad orbital de la Tierra alrededor del sol es aproximadamente [matemática] 3 \ veces 10 ^ 4 [/ matemática] metros por segundo. Por lo tanto, durante al menos la mitad del año, la velocidad [matemática] v [/ matemática] de la Tierra a través del éter debe ser al menos [matemática] 10 ^ {- 4} c [/ matemática]. Por lo tanto,
[matemáticas] \ Delta N \ gt \ dfrac {2L} {\ lambda} \ veces 10 ^ {- 4} [/ matemáticas],
durante al menos la mitad del año. La longitud de onda de la luz utilizada en el experimento de Michelson-Morley fue [math] \ lambda = 5.9 \ times 10 ^ {- 7} [/ math] metros, y la longitud efectiva de cada brazo de interferómetro fue de aproximadamente [math] 11 [/ math ] metros. Con este aparato, se esperaba un cambio marginal de al menos [math] \ Delta N = 0.37 [/ math]. Esto fue aproximadamente diez veces el mínimo detectable con el interferómetro utilizado por Michelson y Morley. Sin embargo, no se detectó ninguna franja. El experimento se repitió seis meses después, nuevamente con un resultado nulo.
Observaciones de estrellas dobles
El experimento de Michelson-Morley indica que la velocidad de la luz, en relación con su fuente, es independiente del movimiento de esa fuente. En 1913, Willem de Sitter argumentó que las observaciones de sistemas estelares dobles muestran que la velocidad de la luz es independiente de un movimiento relativo de la fuente y el observador. Experimento de doble estrella De Sitter – Wikipedia
La siguiente imagen muestra dos estrellas, [matemática] S_1 [/ matemática] y [matemática] S_2 [/ matemática] orbitando su centro de masa [matemática] cm [/ matemática]. Medio período después, las estrellas se encuentran en las ubicaciones [matemáticas] S_1 ^ {\ prime} [/ matemáticas] y [matemáticas] S_2 ^ {\ prime} [/ matemáticas]. La luz que salió de [matemáticas] S_1 [/ matemáticas] está etiquetada [matemáticas] l [/ matemáticas] y la luz que dejó [matemáticas] S_1 ^ {\ prime} [/ matemáticas] está etiquetada [matemáticas] l ^ {\ prime} [/ math], y el tiempo transcurrido entre emisiones es [math] \ dfrac {1} {2} T [/ math], donde [math] T [/ math] es el período de las órbitas. Si, como lo indica el experimento de Michelson-Morley, [matemática] l [/ matemática] y [matemática] l ^ {\ prime} [/ matemática] cada viaje a velocidad [matemática] c [/ matemática] en relación con [matemática] S_1 [/ math] y [math] S_1 ^ {\ prime} [/ math], respectivamente, luego la adición ordinaria de velocidades muestra que [math] l [/ math] viaja a la velocidad [math] c – v [/ math] y [math] l ^ {\ prime} [/ math] viaja a la velocidad [math] c + v [/ math] en relación con el centro de masa [math] cm [/ math], donde [math] v [/ math ] es la velocidad orbital de [matemáticas] S_1 [/ matemáticas] en relación con [matemáticas] cm [/ matemáticas]. Esto significará que [matemáticas] l ^ {\ prime} [/ matemáticas] superará a [matemáticas] l [/ matemáticas] después de un tiempo, [matemáticas] t [/ matemáticas], satisfaciendo la ecuación
[matemáticas] \ frac {1} {2} (c – v) T + (c – v) t = (c + v) t [/ matemáticas]. Resolver para [matemáticas] t [/ matemáticas] da
[matemáticas] t = \ frac {1} {4} \ dfrac {c – v} {v} [/ matemáticas]. Un observador a distancia,
[matemáticas] d = (c + v) t = \ frac {1} {4} (c ^ 2 – v ^ 2) T [/ matemáticas], desde el sistema estelar vería [matemáticas] S_1 [/ matemáticas] ubicado en puntos opuestos en su órbita al mismo tiempo! Para un sistema binario cercano con valores [matemática] v = 1.7 \ veces 10 ^ {- 4} c [/ matemática] y período [matemática] T = 70 [/ matemática] horas, uno tiene [matemática] d = 1.1 \ veces 10 ^ {17} [/ math] metros, o aproximadamente [math] 11 [/ math] años luz. Otros observadores también verían [matemáticas] S_1 [/ matemáticas] en dos ubicaciones al mismo tiempo, pero el efecto no sería tan extremo como este.
Relatividad especial – La transformación de Lorentz
Einstein publicó la Teoría especial de la relatividad en 1905, no específicamente para explicar los resultados nulos del experimento de Michelson-Morley, sino para conciliar la teoría electromagnética y la relatividad galileana. La respuesta de Dale Gray a ¿Cómo surgió Albert Einstein la idea de la teoría especial de la relatividad? En otras palabras, Einstein creía que, en lo que respecta a los marcos de referencia inerciales, no debe haber medios, mecánicos o electromagnéticos, para distinguir cuál se está moviendo y cuál está en reposo. Si Coulomb, Faraday y todos los demás hubieran hecho sus experimentos en algún planeta en un sistema planetario distante, los resultados deberían haber sido los mismos que obtuvieron en la Tierra, incluso si la Tierra y el otro planeta se movían a una fracción sustancial de La velocidad de la luz entre sí.
Pero los resultados de todos esos experimentos realizados sobre electricidad y magnetismo se resumen matemáticamente en las ecuaciones de Maxwell, y las ecuaciones de Maxwell dan un valor muy específico para la velocidad de la luz, el valor determinado por la primera ecuación en esta respuesta. Aceptar ese valor de [matemáticas] c [/ matemáticas] como el mismo medido en cualquier marco de referencia inercial, y extender el principio de relatividad galileano a todas las leyes físicas, requiere una modificación de la mecánica newtoniana. En particular, el espacio y el tiempo, tal como los experimentamos en el ámbito de los acontecimientos cotidianos, solo pueden estar de acuerdo con la naturaleza como una aproximación. Para ver por qué se requiere una desviación tan radical de las nociones de sentido común del espacio y el tiempo, imagine dos naves espaciales en el espacio interestelar que viajan en direcciones opuestas a velocidades constantes en relación con un tercer marco de referencia inercial.
En el momento en que pasan uno al lado del otro, se emite un destello esférico de luz a medio camino entre ellos. Para que las ecuaciones de Maxwell sean igualmente válidas en relación con los marcos inerciales de cada cohete, la luz del flash debe viajar hacia la parte trasera del cohete a la misma velocidad que viaja hacia el frente. Después de todo, las ecuaciones de Maxwell muestran que la velocidad de la luz es
[matemáticas] c = \ dfrac {1} {{\ sqrt {\ epsilon_ {0} \ mu_ {0}}}} [/ matemáticas],
Independiente de la dirección. Esto significa que, a medida que la luz se propaga hacia afuera, cada cohete debe ubicarse en el centro de la capa esférica de luz en expansión. ¡Pero los dos cohetes se están separando! La única forma en que ambos pueden estar en el centro de la capa de luz esférica en expansión es que la simultaneidad sea relativa, es decir, no absoluta.
Tome el cohete superior de la imagen como marco de referencia. El destello de luz ocurre a medio camino entre la cola del cohete y el punto donde se une el “cono de la nariz”. Si la luz viaja hacia el frente del cohete a la misma velocidad que viaja hacia la parte posterior, los sensores en los dos lugares registran la llegada de la luz del flash simultáneamente. Esos dos eventos de llegada no pueden ser simultáneos para un observador en el cohete inferior, porque eso requeriría que la luz viaje más rápido en su dirección hacia atrás que en su dirección hacia adelante. El detector en la parte delantera del cohete superior está más lejos de él cuando registra la luz del flash. El detector en la parte trasera del cohete superior se ha acercado a él cuando registra el destello. Por lo tanto, para el cohete inferior, la luz del flash viajó una distancia más corta (medida en su marco) para alcanzar el detector trasero, que viajó para alcanzar el detector frontal del cohete superior. Por lo tanto, medido desde el cohete inferior, el detector en la parte posterior del cohete superior registra la luz del flash antes del detector en la parte delantera del cohete superior. Entonces, dos eventos que son simultáneos para el cohete superior no son simultáneos para el cohete inferior. Por supuesto, también podríamos argumentar que los eventos simultáneos en el cohete inferior no son simultáneos en el cohete superior.
Los dos observadores están examinando la misma realidad, por lo tanto, debe haber una manera de calcular los resultados de las mediciones realizadas por uno a partir de las mediciones realizadas por el otro. Las fórmulas para hacer esto se llaman ecuaciones de transformación. Fueron descubiertos por Hendrik Antoon Lorentz en el contexto de la teoría del éter y se denominan transformación de Lorentz. La velocidad que ocurre en la transformación de Lorentz se interpreta como la velocidad relativa al éter.
Derivaré la transformación de Lorentz de los dos postulados de Einstein, que solo consideran el movimiento relativo de dos marcos de referencia inerciales y no se basan en el concepto de éter. Aunque Einstein declaró dos postulados en los comentarios introductorios de su artículo “Sobre la electrodinámica de los cuerpos en movimiento”, el segundo postulado es realmente un corolario del primero. Parafraseando a Einstein, los postulados son
1.) Las leyes de la física, incluidas las del electromagnetismo, son las mismas en todos los marcos de referencia inerciales.
2.) La velocidad de la luz en el vacío es la misma en relación con todos los marcos de referencia inerciales.
El primer paso para derivar la transformación de Lorentz es tener claro lo que significa configurar coordenadas y sincronizar relojes en un marco de referencia inercial. Un observador puede saber si es un observador inercial comprobando si la primera ley de Newton es obedecida o no por partículas libres. Comenzaré con la sincronización del reloj. Supongamos que un observador inercial, A, es elegido para estar en lo que luego se llamará el origen de las coordenadas. El observador A tiene un reloj y ha equipado a otro observador inercial, B, en reposo en relación con A con un reloj idéntico (A puede determinar que B está en reposo en relación con A enviando periódicamente una señal luminosa a B, que la refleja de nuevo a A con un espejo. Si el tiempo de ida y vuelta es siempre el mismo, entonces B está en reposo en relación con A.)
En la imagen, A envía una señal a B diciéndole a B la lectura en el reloj de A en el momento [math] t_0 [/ math]. Cuando B recibe el mensaje de A, B envía de inmediato una señal a A. Cuando A recibe la señal de B, A envía de inmediato una señal a B informando a B del tiempo [matemático] t_1 [/ matemático] de recepción de la señal de B. En la recepción de la segunda señal de A, B pone su reloj en
[matemáticas] t_0 + \ frac {3} {2} (t_ {1} – t_ {0}) [/ matemáticas]. Ahora los dos relojes están sincronizados y lo seguirán siendo si son de construcción idéntica y están configurados a la misma velocidad.
Para configurar coordenadas rectangulares para el marco de referencia inercial con A en el origen, primero configure las coordenadas esféricas. Desde el punto A envía un pulso de luz esférico. Si [math] t [/ math] es el tiempo transcurrido desde la emisión del pulso, entonces deje que la coordenada radial sea [math] r = ct [/ math] defina la coordenada radial, es decir, cada observador en reposo en relación con A , teniendo un reloj sincronizado con eso en A, se asigna a sí mismo la coordenada [matemática] r [/ matemática] si el pulso lo pasa en el momento [matemática] t [/ matemática]. Las siguientes tres direcciones perpendiculares entre sí se eligen en A y se designan [matemáticas] x [/ matemáticas], [matemáticas] y [/ matemáticas] y [matemáticas] z [/ matemáticas] de manera diestra. Deje que [math] \ vec r [/ math] sea el vector de posición de un punto relativo a A, es decir, el vector de desplazamiento de A al punto, y deje que [math] \ alpha [/ math], [math] \ beta [/ math] y [math] \ theta [/ math] son los ángulos entre [math] \ vec r [/ math] y [math] x [/ math], [math] y [/ math] y [ matemáticas] z [/ matemáticas], respectivamente. Entonces [math] \ theta [/ math] será el ángulo polar para el sistema de coordenadas esféricas en construcción. El ángulo azimutal estará definido por
[math] \ phi = \ cos ^ {- 1} \ left (\ dfrac {\ cos \ alpha} {\ sin \ theta} \ right) [/ math], [math] 0 \ le \ phi \ lt 2 \ pi [/ math], [math] \ theta \ ne n \ pi [/ math]. Las coordenadas rectangulares se obtienen de la transformación [math] x = r \ sin {\ theta} \ cos {\ phi} [/ math], [math] y = r \ sin {\ theta} \ cos {\ phi} [/ matemática] y [matemática] z = r \ cos {\ theta} [/ matemática].
Con los relojes sincronizados y las coordenadas rectangulares configuradas para un marco inercial, estamos listos para determinar las ecuaciones de transformación que permiten la comparación de coordenadas y medidas de tiempo en dos sistemas de coordenadas diferentes.
Por razones físicas, la transformación debe ser lineal. Por ejemplo, las partículas sin aceleración en relación con uno de los sistemas de coordenadas no deben tener aceleración en relación con el otro. Los caminos de tales partículas deben ser líneas rectas. La transformación lineal más general que relaciona las coordenadas [matemáticas] x [/ matemáticas], [matemáticas] y [/ matemáticas] y [matemáticas] z [/ matemáticas] y el tiempo [matemáticas] t [/ matemáticas] de un observador al coordenadas y tiempo [math] x ^ {\ prime} [/ math], [math] y ^ {\ prime} [/ math], [math] z ^ {\ prime} [/ math] y [math] t ^ {\ prime} [/ math], respectivamente, del otro observador se puede escribir como:
[matemáticas] \ begin {align} t ^ {\ prime} & = a_ {00} t + a_ {01} x + a_ {02} y + a_ {03} z \\ x ^ {\ prime} & = a_ {10} t + a_ {11} x + a_ {12} y + a_ {13} z \\ y ^ {\ prime} & = a_ {20} t + a_ {21} x + a_ {22} y + a_ {23} z \\ z ^ {\ prime} & = a_ {30} t + a_ {31} x + a_ {32} y + a_ {33} z \ end {align} [/ math]
La transformación galileana para dos marcos de referencia inerciales también está en esta forma, pero supone [matemática] a_ {00} = 1 [/ matemática] y [matemática] a_ {01} = a_ {02} = a_ {03} = 0 [/ math], que hemos visto es incompatible con el segundo postulado de la relatividad especial.
Por simplicidad, por ahora elegiremos nuestros dos cuadros de inercia, [matemática] S [/ matemática] y [matemática] S ^ {\ prime} [/ matemática], de modo que el movimiento relativo de [matemática] S [/ matemática] [math] S ^ {\ prime} [/ math] tiene un eje común [math] x [/ math] y supone que los orígenes coinciden en [math] t = t ^ {\ prime} = 0 [/ math ] Además, los ejes [math] y [/ math] y [math] y ^ {\ prime} [/ math] son paralelos, así como [math] z [/ math] y [math] z ^ {\ prime} [/ math] ejes. La configuración se muestra en la imagen a continuación, junto con las ecuaciones de transformación galileanas.
Se usará el mismo arreglo para determinar una forma simple de la transformación de Lorentz. Esto reduce las ecuaciones de transformación a
[matemáticas] \ begin {align} t ^ {\ prime} & = a_ {00} t + a_ {01} x \\ x ^ {\ prime} & = a_ {10} t + a_ {11} x \\ y ^ {\ prime} & = y \\ z ^ {\ prime} & = z, \ end {align} [/ math]
donde [matemática] a_ {00} [/ matemática], [matemática] a_ {01} [/ matemática], [matemática] a_ {10} [/ matemática] y [matemática] a_ {11} [/ matemática] estar determinado.
Las ecuaciones de movimiento del origen de [matemáticas] S ^ {\ prime} [/ matemáticas] en relación con [matemáticas] S [/ matemáticas] son [matemáticas] x = vt [/ matemáticas], [matemáticas] y = 0 [ / math] y [math] z = 0 [/ math]. Por lo tanto, [matemáticas] a_ {10} t + a_ {11} x = 0 [/ matemáticas], entonces
[matemáticas] \ dfrac {a_ {10}} {a_ {11}} = – v [/ matemáticas], o [matemáticas] a_ {10} = – a_ {11} v [/ matemáticas]. Sustituyendo en la ecuación de transformación [math] x ^ {\ prime} [/ math] da
[matemáticas] x ^ {\ prime} = a_ {11} (x – vt) [/ matemáticas]. El postulado 1.) implica que la transformación de [matemáticas] S ^ {\ prime} [/ matemáticas] a [matemáticas] S [/ matemáticas] debe tener la misma forma (con la velocidad invertida, por supuesto), entonces [matemáticas] x = a_ {11} (x ^ {\ prime} + vt ^ {\ prime}) [/ math].
Si en este momento los orígenes de [math] S [/ math] y [math] S ^ {\ prime} [/ math] coinciden, se emite un pulso de luz en la dirección positiva [math] x [/ math], la segundo postulado 2.) dice que debemos tener [matemáticas] x = ct [/ matemáticas] y [matemáticas] x ^ {\ prime} = ct ^ {\ prime} [/ matemáticas] como las ecuaciones que ubican este pulso en relación con [matemáticas] ] S [/ math] y [math] S ^ {\ prime} [/ math], respectivamente. Por lo tanto, usando la transformación y su inverso, obtenemos las dos ecuaciones
[matemáticas] ct ^ {\ prime} = a_ {11} (ct – vt) \ implica [/ matemáticas] [matemáticas] \ dfrac {t ^ {\ prime}} {t} = a_ {11} \ dfrac {c – v} {c} [/ matemáticas],
y
[matemáticas] ct = a_ {11} (ct ^ {\ prime} + vt ^ {\ prime}) \ implica \ dfrac {t} {t ^ {\ prime}} = a_ {11} \ dfrac {c + v } {c} [/ matemáticas].
Multiplicar estas dos ecuaciones juntas da
[matemáticas] 1 = a_ {11} ^ 2 \ dfrac {c ^ 2 – v ^ 2} {c ^ 2} = a_ {11} ^ 2 \ left (1 – \ dfrac {v ^ 2} {c ^ 2 } \ right) [/ math].
Resolver para [matemáticas] a_ {11} [/ matemáticas] da
[matemáticas] a_ {11} = \ dfrac {1} {\ sqrt {1 – \ frac {v ^ 2} {c ^ 2}}} [/ matemáticas].
Será útil para la discusión posterior hacer la definición
[matemáticas] \ gamma (v) = a_ {11} = \ dfrac {1} {\ sqrt {1 – \ frac {v ^ 2} {c ^ 2}}} [/ matemáticas],
y escribe la transformación como
[matemáticas] x ^ {\ prime} = \ gamma (v) (x – vt) [/ matemáticas].
Al resolver la ecuación anterior y la transformación inversa [math] x = \ gamma (v) (x ^ {\ prime} + vt ^ {\ prime}) [/ math] simultáneamente para [math] t ^ {\ prime} [ / matemáticas], uno encuentra
[matemáticas] t ^ {\ prime} = \ gamma (v) (t – \ frac {v} {c ^ 2} x) [/ matemáticas].
Reuniendo los resultados juntos tenemos la transformación de Lorentz
[matemáticas] \ begin {align} t ^ {\ prime} & = \ gamma (v) (t – \ frac {v} {c ^ 2} x) \\ x ^ {\ prime} & = \ gamma (v ) (x – vt) \\ y ^ {\ prime} & = y \\ z ^ {\ prime} & = z. \ end {align} [/ math]
Relatividad especial: dilatación del tiempo y contracción de la longitud
Antes de obtener las fórmulas para la contracción de la longitud y la dilatación del tiempo, me gustaría volver al tema de la relatividad de la simultaneidad y mostrar cómo es una consecuencia de la transformación de Lorentz.
Deje que dos eventos, (1) y (2), ocurran simultáneamente en relación con [math] S [/ math]. Llamaremos a [math] x [/ math] – coordenadas de los dos eventos [math] x_1 [/ math] y [math] x_2 [/ math] es [math] S [/ math] y los tiempos de ocurrencia [ matemática] t_1 [/ matemática] y [matemática] t_2 [/ matemática], con notación similar en [matemática] S ^ {\ prime} [/ matemática]. Desde el significado de simultaneidad, tenemos [matemáticas] t_1 = t_2 [/ matemáticas], o [matemáticas] \ Delta t \ equiv t_2 – t_1 = 0 [/ matemáticas]. De la transformación de Lorentz tenemos
[matemáticas] \ Delta t ^ {\ prime} = t_2 ^ {\ prime} – t_1 ^ {\ prime} = – \ frac {v} {c ^ 2} \ gamma (v) (x_2 – x_1) = – \ frac {v} {c ^ 2} \ gamma (v) \ Delta x [/ math]. Por lo tanto, si [math] x_1 \ ne x_2 [/ math], los dos eventos no son simultáneos en relación con [math] S ^ {\ prime} [/ math]. Observe el signo de [math] \ Delta t ^ {\ prime} [/ math]. Si [math] x_2 \ gt x_1 [/ math], entonces el evento (1) ocurrió después del evento (2) en relación con [math] S ^ {\ prime} [/ math]. Observe también que si la velocidad de [math] S ^ {\ prime} [/ math] hubiera estado en la dirección opuesta, el orden de los eventos se habría invertido en relación con [math] S ^ {\ prime} [/ math] . En otras palabras, el orden en que ocurren los eventos, simultáneos en [matemática] S [/ matemática] depende de la dirección del movimiento de [matemática] S ^ {\ prime} [/ matemática].
Para derivar la contracción de la longitud de la transformación de Lorentz, considere una barra de longitud [matemática] L_0 [/ matemática] en reposo en [matemática] S ^ {\ prime} [/ matemática]. Llamaremos a esta longitud la longitud adecuada de la barra. Deje que los extremos de la barra estén en [matemática] x_1 ^ {\ prime} [/ matemática] y [matemática] x_2 ^ {\ prime} [/ matemática], con [matemática] x_2 ^ {\ prime} \ gt x_1 ^ {\ prime} [/ math], entonces [math] L_0 = x_2 ^ {\ prime} – x_1 ^ {\ prime} [/ math]. Deje que [math] S [/ math] realice una medición simultánea de las posiciones de los extremos de la barra, y deje que estas posiciones sean [math] x_1 [/ math] y [math] x_2 [/ math].
Con [math] L \ equiv x_2 – x_1 [/ math], la transformación de Lorentz da [math] L_0 = \ gamma L [/ math]. Resolver para [matemáticas] L [/ matemáticas] da
[matemáticas] L = L_0 \ sqrt {1 – \ frac {v ^ 2} {c ^ 2}}. [/ matemáticas]
Esta es la fórmula de contracción de longitud. Observe que [math] L \ lt L_0 [/ math], cuando [math] v \ ne 0 [/ math].
Ahora considere un reloj en reposo en algún punto de [math] S ^ {\ prime} [/ math]. Si [math] t_1 ^ {\ prime} [/ math] es la hora leída en el reloj en algún momento y [math] t_2 ^ {\ prime} [/ math] es la lectura en algún momento posterior, en [math] S ^ {\ prime} [/ math], luego de la transformación inversa,
[matemáticas] \ Delta t \ equiv t_2 – t_1 = \ gamma (v) (t_2 ^ {\ prime} – t_1 ^ {\ prime}) = \ dfrac {\ Delta t ^ {\ prime}} {\ sqrt {1 – \ frac {v ^ 2} {c ^ 2}}} [/ math]. Esta es la fórmula de dilatación del tiempo. El tiempo [matemático] \ Delta \ tau \ equiv \ Delta t ^ {\ prime} [/ matemático] se llama tiempo propio, porque es el paso del tiempo medido en un solo reloj en su marco de descanso. Por lo tanto, podemos escribir la dilatación del tiempo en términos de tiempo apropiado como
[matemáticas] \ Delta t = \ dfrac {\ Delta \ tau} {\ sqrt {1 – \ frac {v ^ 2} {c ^ 2}}} [/ matemáticas].
Me gustaría enfatizar que el intervalo de tiempo [matemático] \ Delta t [/ matemático] no se lee en un solo reloj en reposo en [matemático] S [/ matemático], sino en relojes sincronizados separados ubicados en [matemático] S [/ math] en las posiciones donde llega el reloj en [math] S ^ {\ prime} [/ math] cuando lee [math] t_1 ^ {\ prime} [/ math] y [math] t_2 ^ {\ prime }[/matemáticas]. El intervalo de tiempo, [matemática] \ Delta t \ gt \ Delta \ tau [/ matemática], cuando [matemática] v \ gt 0 [/ matemática]. Esto a menudo se caracteriza por decir que el reloj en movimiento funciona lento, lo cual es algo engañoso y conduce a la confusión cuando se invoca el primer postulado (1) para revertir los roles de [matemáticas] S [/ matemáticas] y [matemáticas] S ^ {\ primo} [/ matemáticas].
Adición de velocidades
Con la misma configuración de los dos marcos de referencia inerciales que hemos estado utilizando, deje que una partícula se mueva con velocidad constante [matemática] \ vec u [/ matemática] en relación con [matemática] S [/ matemática]. La velocidad de esta partícula en relación con [math] S ^ {\ prime} [/ math] es [math] \ vec u ^ {\ prime} [/ math]. En un intervalo de tiempo [matemática] \ Delta t [/ matemática], medida en [matemática] S [/ matemática], los cambios de coordenadas de la partícula son [matemática] \ Delta x [/ matemática], [matemática] \ Delta y [/ math] y [math] \ Delta z [/ math]. Los componentes de la velocidad, en relación con [matemáticas] S [/ matemáticas], son
[matemáticas] \ begin {align} u_ {x} & = \ dfrac {\ Delta x} {\ Delta t} \\ u_ {y} & = \ dfrac {\ Delta y} {\ Delta t} \\ u_ { z} & = \ dfrac {\ Delta z} {\ Delta t} \ end {align} [/ math].
Del mismo modo, en relación con [math] S ^ {\ prime} [/ math], tenemos componentes de velocidad
[matemáticas] u_ {x} ^ {\ prime} = \ dfrac {\ Delta x ^ {\ prime}} {\ Delta t ^ {\ prime}} [/ matemáticas], etc.
Usar la transformación de Lorentz da
[matemáticas] u_ {x} ^ {\ prime} = \ dfrac {\ Delta x ^ {\ prime}} {\ Delta t ^ {\ prime}} = \ dfrac {\ gamma (v) (\ Delta x – v \ Delta t)} {\ gamma (v) (\ Delta t – \ frac {v} {c ^ 2} \ Delta x)} [/ math].
Factorizar [math] \ Delta t [/ math] en el numerador y el denominador y cancelar factores comunes da
[matemáticas] u_x ^ {\ prime} = \ dfrac {\ frac {\ Delta x} {\ Delta t} -v} {1- \ frac {v} {c ^ 2} \ frac {\ Delta x} {\ Delta t}} = \ dfrac {u_x-v} {1- \ frac {vu_x} {c ^ 2}} [/ math].
Cálculos similares para los otros componentes de [math] \ vec u ^ {\ prime} [/ math] dan
[matemáticas] u_y ^ {\ prime} = \ dfrac {u_y} {\ gamma (v) (1- \ frac {vu_x} {c ^ 2})} [/ math]
y
[matemáticas] u_z ^ {\ prime} = \ dfrac {u_z} {\ gamma (v) (1- \ frac {vu_x} {c ^ 2})} [/ math].
La velocidad inversa se obtiene intercambiando componentes de velocidad con y sin imprimación y cambiando el signo en [math] v [/ math].
Ímpetu Relativista
La transformación de la velocidad desarrollada solo requiere la redefinición del momento lineal de una partícula si el momento lineal se va a conservar en colisiones en todos los marcos inerciales. Consideraré una colisión elástica entre dos partículas y mostraré que, según la definición newtoniana de momento lineal, la ley de conservación no se cumple. Se mostrará una definición modificada para conservar el momento lineal.
La siguiente imagen muestra una colisión elástica entre partículas idénticas. Cada una de las partículas tiene masa, [matemática] m [/ matemática], medida en un marco donde cada una está en reposo. La colisión debe ser simétrica en el sentido de que, como se ve desde los marcos de inercia [math] S [/ math] y [math] S ^ {\ prime} [/ math], cada marco tiene una partícula moviéndose a lo largo de [math] y [/ math] -axis del marco y colisionando con una partícula que hace lo mismo en el otro marco de referencia. La velocidad de cada bola en el cuadro en el que solo tiene un componente de movimiento [matemático] y [/ matemático] es [matemático] u_0 [/ matemático].
En la imagen, la partícula número 1 inicialmente se mueve hacia abajo en el eje [math] y ^ {\ prime} [/ math] con velocidad [math] -u_0 [/ math] en [math] S ^ {\ prime} [/ math ] La partícula número 2 inicialmente sube el eje [matemático] y [/ matemático] con velocidad [matemática] u_0 [/ matemático] en [matemático] S [/ matemático]. El dibujo debajo de [math] S [/ math] y [math] S ^ {\ prime} [/ math] muestra la colisión como se ve en [math] S [/ math]. La colisión se analizará a partir de [matemática] S [/ matemática], primero con la definición newtoniana de momento lineal, luego con una definición relativista. Se verá que el componente [math] y [/ math] del momento lineal newtoniano no se conserva. Sin embargo, con la definición relativista, ambos componentes del momento lineal se conservan.
La definición newtoniana del momento lineal de una partícula de masa, [matemática] m [/ matemática] y velocidad, [matemática] \ vec w [/ matemática], es [matemática] \ vec p = m \ vec w [/ matemáticas]. El momento lineal de la partícula 1 se denotará con [math] \ vec p ^ {(1)} [/ math]. El de la partícula 2 por [math] \ vec p ^ {(2)} [/ math]. Los subíndices etiquetarán los componentes y los valores iniciales y finales; por ejemplo, [math] p_ {xi} ^ {(1)} [/ math] es el valor inicial del componente [math] x [/ math] del momento lineal de la partícula 1, es decir, antes de la colisión. Conservación del momento lineal significa
[matemáticas] \ vec p_i ^ {(1)} + \ vec p_i ^ {(2)} = \ vec p_f ^ {(1)} + \ vec p_f ^ {(2)} [/ matemáticas].
Como la partícula 1 permanece en el eje [math] y ^ {\ prime} [/ math], el componente [math] x [/ math] del momento de la partícula 1, en relación con [math] S [/ math] es [matemáticas] p_ {xi} ^ {(1)} = p_ {xf} ^ {(1)} = mv [/ matemáticas]. El componente [math] x [/ math] del momento de la partícula 2 es [math] p_ {xi} ^ {(2)} = p_ {xf} ^ {(2)} = 0 [/ math]. Por lo tanto, el componente [matemático] x [/ matemático] del momento newtoniano se ve trivialmente conservado. Suponiendo que el componente [matemático] y ^ {\ prime} [/ matemático] de la velocidad de la partícula 1 es inicialmente [matemático] -u_0 [/ matemático], el componente [matemático] y [/ matemático] ( en [matemáticas] S [/ matemáticas]) debe obtenerse de la transformación de velocidad inversa, y es
[matemáticas] – \ dfrac {u_0} {\ gamma (v)} [/ matemáticas].
Por lo tanto, el componente inicial [math] y [/ math] si el momento es
[matemáticas] p_ {yi} ^ {(1)} + p_ {yi} ^ {(2)} = – \ dfrac {mu_0} {\ gamma (v)} + mu_0 [/ matemáticas].
El componente final [math] y [/ math] del momento es
[matemáticas] p_ {yf} ^ {(1)} + p_ {yf} ^ {(2)} = \ dfrac {mu_0} {\ gamma (v)} -mu_0 [/ math].
Por lo tanto,
[matemáticas] p_ {yf} = p_ {yi} \ iff \ gamma = 1 [/ matemáticas]. Es decir, el componente [math] y [/ math] del momento lineal se conserva si y solo si [math] v = 0 [/ math].
La definición de momento lineal que da conservación del momento en colisiones es
[matemáticas] \ vec p = \ dfrac {m \ vec w} {\ sqrt {1- \ frac {w ^ 2} {c ^ 2}}} [/ matemáticas],
como se mostrará ahora.
Primero estableceré una identidad útil para el caso que tenemos aquí, donde la partícula en [math] S ^ {\ prime} [/ math] se mueve a lo largo del eje [math] y ^ {\ prime} [/ math], con velocidad [matemáticas] \ pm u_0 [/ matemáticas]. Llame a la velocidad de la partícula en relación con [matemáticas] S [/ matemáticas], [matemáticas] \ vec w [/ matemáticas]. Para determinar el momento relativista de la partícula, en relación con [math] S [/ math], necesitaremos determinar [math] \ gamma (w) [/ math]. De la transformación de velocidad inversa, tenemos
[matemáticas] w_x = v [/ matemáticas]
y
[matemáticas] w_y = \ dfrac {\ pm u_0} {\ gamma (v)} [/ matemáticas].
[Math] \ pm [/ math] se usa porque la partícula invierte su movimiento en la dirección [math] y [/ math] después de la colisión. Tenemos
[matemáticas] \ dfrac {1} {\ gamma ^ {2} (w)} = 1- \ frac {w ^ 2} {c ^ 2} [/ matemáticas],
donde [matemáticas] w ^ 2 = w_x ^ 2 + w_y ^ 2 [/ matemáticas]. Usando las expresiones anteriores para [math] w_x [/ math] y [math] w_y [/ math] y un poco de álgebra da
[matemáticas] \ dfrac {1} {\ gamma ^ {2} (w)} = \ dfrac {1} {\ gamma ^ {2} (v) \ gamma ^ {2} (u_0)} [/ math].
Resolver para [math] \ gamma (w) [/ math] da
[matemáticas] \ gamma (w) = \ gamma (v) \ gamma (u_0) [/ math].
Dado que los componentes [matemática] x [/ matemática] de las velocidades de las partículas no cambian por la colisión, automáticamente tenemos
[matemáticas] p_ {xf} = p_ {xi} [/ matemáticas].
Para el componente inicial de [math] y [/ math] del momento tenemos
[matemáticas] p_ {yi} = p_ {yi} ^ {(1)} + p_ {yi} ^ {(2)} = \ dfrac {-mu_0} {\ gamma (v)} \ gamma (w) + mu_0 \ gamma (u_0) [/ math].
El uso de la identidad desarrollada anteriormente da [math] p_ {yi} = 0 [/ math]. Del mismo modo, se muestra que [math] p_ {yf} = 0 [/ math]. Así tenemos conservación del momento lineal relativista.
Ahora volvamos nuestra atención a la energía total relativista. El primer paso será usar una forma de la segunda ley de Newton para calcular el trabajo realizado en una partícula de masa, [matemática] m [/ matemática], ya que se acelera desde el reposo hasta cierta velocidad final, [matemática] v [/ matemáticas]. El trabajo realizado por la fuerza de aceleración define la energía cinética de la partícula, al igual que en la mecánica newtoniana. La fuerza de aceleración es
[matemáticas] \ vec F = \ dfrac {d \ vec p} {dt} [/ matemáticas]. El incremento del trabajo realizado por [math] \ vec F [/ math] a medida que la partícula sufre un desplazamiento [math] d \ vec r [/ math] es [math] dW = \ vec F \ cdot d \ vec r [/ matemáticas]. La energía cinética es entonces,
[matemáticas] KE = \ displaystyle \ int_i ^ f \ vec F \ cdot d \ vec r [/ matemáticas],
donde los límites de integración son simbólicos de la posición inicial y las posiciones finales. De la definición de velocidad,
[matemáticas] \ vec v = \ dfrac {d \ vec r} {dt} [/ matemáticas],
uno puede escribir
[matemáticas] KE = \ displaystyle \ int_i ^ f \ vec v \ cdot d \ vec p [/ math].
Usando la definición del momento relativista de una partícula de velocidad, [math] \ vec v [/ math], y la identidad útil [math] dv ^ 2 = d (\ vec v \ cdot \ vec v) = 2 \ vec v \ cdot d \ vec v [/ math], uno puede integrarse para obtener la energía cinética
[matemáticas] KE = \ dfrac {mc ^ 2} {\ sqrt {1- \ frac {v ^ 2} {c ^ 2}}} – mc ^ 2 [/ matemáticas].
Por razones que se explicarán más adelante, el primer término en el lado derecho se llama energía total, [matemáticas] E [/ matemáticas], y el segundo término se llama energía en reposo, [matemáticas] E_0 [/ matemáticas], entonces
[matemáticas] E = \ dfrac {mc ^ 2} {\ sqrt {1- \ frac {v ^ 2} {c ^ 2}}} [/ matemáticas]
y
[matemáticas] E_0 = mc ^ 2 [/ matemáticas].
Espacio-tiempo y cuatro vectores
Después de que Einstein publicó el artículo sobre Relatividad Especial en 1905, su ex profesor de matemáticas, Hermann Minkowski, usó la transformación de Lorentz para mostrar que el espacio y el tiempo forman una geometría de cuatro dimensiones que ahora llamamos espacio-tiempo. Citando a Minkowski: “Los puntos de vista del espacio y el tiempo que deseo exponer ante ustedes han surgido del suelo de la física experimental, y allí radica su fuerza. Son radicales. En adelante, el espacio en sí mismo y el tiempo en sí mismo están condenados a desvanecerse lejos en meras sombras, y solo una especie de unión de los dos preservará una realidad independiente “.
La geometría del espacio-tiempo de la Relatividad Especial se llama espacio de Minkowski en honor al desarrollo pionero del concepto de Minkowski. Se acostumbra denotar coordinado en el espacio-tiempo con superíndices para que x [matemática] ^ 0 = ct [/ matemática], [matemática] x ^ 1 = x [/ matemática], [matemática] x ^ 2 = y [/ matemática] , y [math] x ^ 3 = z [/ math] en un marco de referencia inercial como [math] S [/ math]. Si también se considera un segundo marco de inercia, digamos [math] S ^ {\ prime} [/ math], las coordenadas se etiquetarán [math] x ^ {\ prime 0} = ct ^ {\ prime} [/ math] , [matemáticas] x ^ {\ prime 1} = x ^ {\ prime} [/ matemáticas], etc.
La transformación de Lorentz de [matemática] S [/ matemática] a [matemática] S ^ {\ prime} [/ matemática], como se desarrolló anteriormente, es entonces
[matemáticas] \ begin {align} x ^ {\ prime 0} & = \ gamma (v) (x ^ 0- \ beta x ^ 1) \\ x ^ {\ prime 1} & = \ gamma (v) ( x ^ 1- \ beta x ^ 0) \\ x ^ {\ prime 2} & = x ^ 2 \\ x ^ {\ prime 3} & = x ^ 3 \ end {align} [/ math],
dónde
[matemáticas] \ beta = \ dfrac {v} {c} [/ matemáticas].
Debido a la linealidad de la transformación de Lorentz, los incrementos de coordenadas para eventos vecinos transforman lo mismo que las coordenadas, es decir,
[matemáticas] \ begin {align} \ Delta x ^ {\ prime 0} & = \ gamma (v) (\ Delta x ^ 0- \ beta \ Delta x ^ 1) \\ \ Delta x ^ {\ prime 1} & = \ gamma (v) (\ Delta x ^ 1- \ beta \ Delta x ^ 0) \\ \ Delta x ^ {\ prime 2} & = \ Delta x ^ 2 \\\ Delta x ^ {\ prime 3 } & = \ Delta x ^ 3 \ end {align} [/ math].
Estas últimas ecuaciones se pueden usar para mostrar que el cuadrado del intervalo espacio-tiempo entre eventos vecinos, [math] (\ Delta s) ^ 2 [/ math], definido a continuación, es invariante, lo que significa que se calcula de la misma manera usando incrementos de coordenadas de cualquier inercia marco de referencia:
[matemáticas] (\ Delta s) ^ 2 = (\ Delta x ^ 0) ^ 2 – (\ Delta x ^ 1) ^ 2 – (\ Delta x ^ 2) ^ 2 – (\ Delta x ^ 3) ^ 2 = (\ Delta x ^ {\ prime 0}) ^ 2 – (\ Delta x ^ {\ prime 1}) ^ 2 – (\ Delta x ^ {\ prime 2}) ^ 2 – (\ Delta x ^ {\ primer 3}) ^ 2 [/ matemáticas].
El intervalo espacio-tiempo entre eventos vecinos es el primer ejemplo de lo que llamaremos invariante espacio-tiempo. Es la existencia de invariantes del espacio-tiempo lo que nos impulsa a ver el espacio-tiempo geométricamente y las coordenadas del espacio-tiempo en diferentes marcos inerciales como simplemente diferentes medios para describir un mundo de cuatro dimensiones.
Introducimos una matriz
[matemática] \ Lambda = \ begin {bmatrix} \ gamma & {- \ beta \ gamma} & 0 & 0 \\ – \ beta \ gamma & \ gamma & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \ end {bmatrix} [/ math],
donde [math] \ gamma (v) [/ math] ahora se escribe como [math] \ gamma [/ math] cuando no hay otras velocidades involucradas, aparte de la velocidad relativa de dos cuadros de referencia. La transformación de Lorentz ahora se puede escribir en forma de matriz,
[matemáticas] x ^ {\ prime} = \ Lambda x [/ matemáticas],
dónde
[matemáticas] x ^ {\ prime} = \ begin {bmatrix} x ^ {\ prime 0} \\ x ^ {\ prime 1} \\ x ^ {\ prime 2} \\ x ^ {\ prime 3} \ end {bmatrix} [/ math],
y
[matemáticas] x = \ begin {bmatrix} x ^ {0} \\ x ^ {1} \\ x ^ {2} \\ x ^ {3} \ end {bmatrix} [/ math].
Usando la convención de suma de Einstein, que los índices que se repiten, escritos una vez en la posición superior y otra en la posición inferior, deben sumarse, la transformación de Lorentz puede escribirse como
[matemáticas] x ^ {\ prime \ mu} = {\ Lambda ^ {\ mu}} _ {\ nu} x ^ {\ nu} [/ matemáticas],
donde los índices griegos toman valores [matemática] 0 [/ matemática], [matemática] 1 [/ matemática], [matemática] 2 [/ matemática] y [matemática] 3 [/ matemática], y donde [matemática] {\ Lambda ^ {\ mu}} _ {\ nu} [/ math] son las entradas en la matriz [math] \ Lambda [/ math]. Al escribir una matriz, el índice de la fila queda a la izquierda del índice de la columna.
Al introducir la matriz
[matemáticas] (\ eta _ {\ mu \ nu}) = \ begin {bmatrix} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \ end {bmatrix} [/ math],
llamado tensor métrico del espacio de Minkowski, el cuadrado del intervalo espacio-tiempo entre eventos vecinos puede escribirse como
[matemáticas] (\ Delta s) ^ 2 = \ eta _ {\ mu \ nu} \ Delta x ^ {\ mu} \ Delta x ^ {\ nu} [/ matemáticas].
Esta relación es crucial para definir transformaciones generales de Lorentz entre marcos de referencia inerciales de configuración arbitraria.
Para dos eventos vecinos, la transformación de Lorentz da
[matemáticas] \ Delta x ^ {\ prime \ mu} \ equiv x ^ {\ prime \ mu} _2-x ^ {\ prime \ mu} _1 = {\ Lambda ^ {\ mu}} _ {\ nu} x ^ {\ nu} _2 – {\ Lambda ^ \ mu} _ \ nu x ^ {\ nu} _1 = {\ Lambda ^ \ mu} _ \ nu \ Delta x ^ {\ nu} [/ math].
Por lo tanto, el cuadrado del intervalo espacio-tiempo es
[matemáticas] (\ Delta s) ^ 2 = \ eta _ {\ mu \ nu} \ Delta x ^ {\ prime \ mu} \ Delta x ^ {\ prime \ nu} = \ eta _ {\ mu \ nu} {\ Lambda ^ \ mu} _ \ alpha {\ Lambda ^ \ nu} _ \ beta \ Delta x ^ \ alpha \ Delta x ^ \ beta = \ eta _ {\ alpha \ beta} \ Delta x ^ \ alpha \ Delta x ^ \ beta [/ math],
de donde obtenemos
[matemáticas] (\ eta _ {\ mu \ nu} {\ Lambda ^ \ mu} _ \ alpha {\ Lambda ^ \ nu} _ \ beta – \ eta _ {\ alpha \ beta}) \ Delta x ^ \ alpha \ Delta x ^ \ beta = 0 [/ matemáticas].
Para que la última igualdad se mantenga para dos eventos arbitrarios, debemos tener
[matemáticas] \ eta _ {\ mu \ nu} {\ Lambda ^ \ mu} _ \ alpha {\ Lambda ^ \ nu} _ \ beta = \ eta _ {\ alpha \ beta} [/ matemáticas].
Cualquier matriz [matemática] ({\ Lambda ^ \ mu} _ \ nu) [/ matemática], que satisface la ecuación anterior se llama matriz de transformación de Lorentz. La colección de tales matrices forma un grupo algebraico llamado grupo homogéneo de Lorentz. Una transformación producida por un miembro del grupo se llama transformación homogénea de Lorentz.
La ecuación anterior se puede escribir en forma de matriz como
[matemáticas] \ Lambda ^ T \ eta \ Lambda = \ eta [/ matemáticas],
donde [math] \ Lambda ^ T [/ math] es la transposición matricial de [math] \ Lambda [/ math], y [math] \ eta [/ math] es el tensor métrico del espacio de Minkowski.
Considere una transformación de Lorentz homogénea entre dos marcos de referencia inerciales, [math] S [/ math] y [math] S ^ {\ prime} [/ math]. Si cuatro cantidades [matemáticas] (A ^ 0, A ^ 1, A ^ 2, A ^ 3) [/ matemáticas] dadas en [matemáticas] S [/ matemáticas] están relacionadas con cuatro cantidades [matemáticas] (A ^ {\ prime 0}, A ^ {\ prime 1}, A ^ {\ prime 2}, A ^ {\ prime 3}) [/ math] en [math] S ^ {\ prime} [/ math] por [math] A ^ {\ prime \ mu} = {\ Lambda ^ \ mu} _ \ nu A ^ {\ nu} [/ math], entonces se dice que los dos conjuntos de cantidades son componentes de un vector cuatro en los dos cuadros . La cantidad, [matemática] \ eta _ {\ mu \ nu} A ^ \ mu A ^ \ nu = \ eta _ {\ mu \ nu} A ^ {\ prime \ mu} A ^ {\ prime \ nu} [/ matemática ], se llama la pseudo norma del cuatro-vector. El producto interno de dos cuatro vectores, [matemática] A ^ \ mu [/ matemática] y [matemática] B ^ \ nu [/ matemática], se define como [matemática] \ eta _ {\ mu \ nu} A ^ \ mu B ^ \ nu [/ matemáticas].
Cuatro vectores se clasifican en tiempo, luz y espacio, según si su pseudo norma es positiva, cero o negativa, respectivamente. Un ejemplo de un vector cuatro que es importante en la relatividad es la velocidad cuatro. Una partícula se puede modelar como una curva en el espacio-tiempo, con las coordenadas en función de la coordenada del tiempo en un marco inercial, [matemática] x ^ \ mu = x ^ \ mu (t) [/ matemática], en notación paramétrica. Se requiere que la velocidad de la partícula sea menor que la velocidad de la luz para que las tres velocidades, [matemáticas] \ vec v = (v ^ 1, v ^ 2, v ^ 3) [/ matemáticas], satisfagan [matemáticas] | \ vec v | = \ sqrt {(v ^ 1) ^ 2 + (v ^ 2) ^ 2 + (v ^ 3) ^ 2} \ lt c [/ math]. La curva espacio-tiempo que representa una partícula se llama línea mundial de la partícula. El tiempo apropiado a lo largo de la línea mundial de una partícula, entre eventos en valores de parámetros de tiempo, [math] t_1 [/ math] y [math] t_2 [/ math], se define como
[matemáticas] \ tau_ {12} = \ displaystyle \ int_ {t_1} ^ {t_2} \ sqrt {\ eta _ {\ mu \ nu} \ dfrac {dx ^ \ mu} {dt} \ dfrac {dx ^ \ nu} {dt}} dt [/ math]. Este no es el tiempo apropiado entre los dos eventos calculados en un solo marco inercial; más bien es el tiempo transcurrido en un “reloj” transportado con la partícula, que no se supone que tenga velocidad constante. Si elegimos un evento de referencia en la línea mundial de la partícula, podemos parametrizar la línea mundial por el tiempo apropiado medido a lo largo de la línea mundial, como veremos a continuación.
Deje que [math] t_1 [/ math] sea la coordenada de tiempo de algún evento en la línea mundial de la partícula y deje que [math] t [/ math] sea una coordenada de tiempo arbitraria en el dominio de la línea mundial. Dejar
[matemáticas] \ tau = \ displaystyle \ int_ {t_1} ^ {t} \ sqrt {\ eta _ {\ mu \ nu} \ dfrac {dx ^ \ mu} {du} \ dfrac {dx ^ \ nu} {du} } du [/ math]. Por la segunda forma del teorema fundamental del cálculo,
[matemáticas] \ dfrac {d \ tau} {dt} = \ sqrt {\ eta _ {\ mu \ nu} \ dfrac {dx ^ \ mu} {dt} \ dfrac {dx ^ \ nu} {dt}} \ gt 0 [/ matemáticas].
Por lo tanto, [math] \ tau [/ math] es una función estrictamente creciente de [math] t [/ math]. Por lo tanto, [math] \ tau = \ tau (t) [/ math] es invertible para dar [math] t = t (\ tau) [/ math]. La sustitución en [matemáticas] x ^ \ mu = x ^ \ mu (t) [/ matemáticas] proporciona una parametrización de la línea mundial por [matemáticas] \ tau [/ matemáticas], [matemáticas] x ^ \ mu = x ^ \ mu (\ tau) [/ matemáticas].
La cuatro velocidades de la partícula se define por
[matemáticas] u ^ \ mu \ equiv \ dfrac {dx ^ \ mu} {d \ tau} [/ matemáticas].
Un ejemplo importante de un vector cuatro es el impulso de una partícula, definido por [math] p ^ \ mu = (p ^ 0, p ^ 1, p ^ 2, p ^ 3) [/ math], donde [matemática] p ^ 0 = E / c [/ matemática] ([matemática] E [/ matemática] es la energía total definida anteriormente) y [matemática] p ^ 1 [/ matemática], [matemática] p ^ 2 [/ matemática] y [matemática] p ^ 3 [/ matemática] son los componentes del momento lineal relativista. Es fácil mostrar que [math] p ^ \ mu = mu ^ \ mu [/ math]. La pseudo norma del impulso cuatro es
[matemáticas] \ eta _ {\ mu \ nu} p ^ \ mu p ^ \ nu = (p ^ 0) – (p ^ 1) – (p ^ 2) – (p ^ 3) = (E / c) ^ 2- \ vec p \ cdot \ vec p [/ math]. El uso de las definiciones de energía total y momento relativista da
[matemáticas] \ eta _ {\ mu \ nu} p ^ \ mu p ^ \ nu = \ gamma ^ 2m ^ 2c ^ 2- \ gamma ^ 2m ^ 2v ^ 2 = \ gamma ^ 2m ^ 2c ^ 4 \ left (1 – \ frac {v ^ 2} {c ^ 2} \ right) = m ^ 2c ^ 4 [/ math].
Esta ecuación muestra que cuando el momento de tres partículas de la partícula es cero, la energía total es la energía restante.
A continuación, me gustaría dar un ejemplo que respalde la afirmación de que [matemáticas] E [/ matemáticas] es, de hecho, la energía total de la partícula y no solo una etiqueta que le dimos. Este ejemplo también mostrará que la absorción de una cantidad de energía [matemática] E_0 [/ matemática] aumenta la masa en una cantidad [matemática] m_0 = E_0 / c ^ 2 [/ matemática].
Volviendo a nuestra configuración original de marcos inerciales [matemática] S [/ matemática] y [matemática] S ^ {\ prime} [/ matemática], considere un bloque de masa [matemática] M [/ matemática] en reposo en el origen de [math] S [/ math] y dos pulsos de luz, cada uno de energía [math] E_0 / 2 [/ math] acercándose al origen de [math] S [/ math] desde direcciones opuestas a lo largo de [math] y [ / math] -eje de [math] S [/ math]. Ver la imagen de abajo.
Desde el punto de vista de [math] S ^ {\ prime} [/ math] el bloque se mueve en la dirección negativa [math] x ^ {\ prime} [/ math] y tiene velocidad [math] – \ vec v [/ math] y momento lineal
[matemáticas] {\ vec p} ^ {\ prime} = – \ gamma (v) M \ vec v [/ matemáticas].
Los dos pulsos de luz son absorbidos por [math] M [/ math], que permanece en reposo en [math] S [/ math] después de que los pulsos de luz son absorbidos. El impulso total de cuatro del sistema (pulsos de bloque y luz) en [matemática] S [/ matemática] es [matemática] p ^ \ mu = (Mc + E_0 / c, 0,0,0) [/ matemática]. Hacer una transformación de Lorentz a [matemáticas] S ^ {\ prime} [/ matemáticas] da un impulso de cuatro
[matemáticas] p ^ {\ prime \ mu} = (\ gamma (v) (Mc + E_0 / c), – \ beta \ gamma (Mc + E_0 / c), 0,0) [/ matemáticas]. Observe que el componente [math] x ^ {\ prime} [/ math] de tres momentos ya no es [math] – \ gamma Mv [/ math], pero ahora es
[matemática] p ^ {\ prime 1} = – \ beta \ gamma (Mc + E_0 / c) v = – \ gamma (M + E_0 / c ^ 2) v [/ math].
Desde la perspectiva de [math] S ^ {\ prime} [/ math], la masa del bloque aumenta de [math] M [/ math] a [math] M + E_0 / c ^ 2 [/ math]. En otras palabras, la absorción de una cantidad de energía, [matemática] E_0 [/ matemática] por el bloque en [matemática] S [/ matemática] ha aumentado su masa en la cantidad [matemática] m_0 = E_0 / c ^ 2 [ /matemáticas]. Esto muestra que una cantidad de energía electromagnética absorbida por un cuerpo aumenta la masa del cuerpo. Como las formas de energía son interconvertibles, esto sugiere que hay una cantidad de masa asociada con cada cantidad de energía. Posteriormente, se ha demostrado que lo contrario también es cierto. Más notablemente en reacciones nucleares y aniquilación de partículas / antipartículas.