¿Cómo se descubrieron los operadores en mecánica cuántica? ¿Son derivables de otros principios?

Buena pregunta, una con la que luché mucho como principiante. Inicialmente no estaba completamente claro para mí por qué diferenciar la función de onda está de alguna manera relacionada con el impulso.

Para responder a su pregunta, hay dos tipos de operadores útiles en mecánica cuántica: operadores de transformación y observables. Supongo que su pregunta es sobre esto último. Algo en la línea de por qué deberíamos llamar a este impulso del operador, o esta otra energía del operador.

En la mecánica cuántica ordinaria, los observables básicos son solo posición y momento.

Todos los demás observables (como la energía o el momento angular) se construyen a partir de esto. Se considera que tienen las mismas funciones de posición e impulso que en la mecánica clásica. Esto asegura que estén de acuerdo con sus contrapartes clásicas en el límite clásico. Esa es una forma en que pueden ser ‘derivados’.

Por lo tanto, se trata de justificar el operador de impulso. Una forma de hacerlo es notar que a partir de la ecuación de Schrodinger se puede llegar a las ecuaciones de Ehrenfest que corresponden a las ecuaciones de Newton para sistemas clásicos. Entonces, definir el impulso de la forma en que lo hicimos nos devuelve las leyes clásicas en el límite correcto.

Más derivación axiomática / técnica sería insistir en la regla de conmutación para los operadores de posición y momento. Exigir esto define a los operadores. Esta demanda puede justificarse señalando que en el límite de la constante de Planck que va a 0, esto corresponde a una relación que es clásicamente verdadera.

Una derivación más limpia sería de las reglas de transformación. Esto es conceptualmente limpio, pero un poco técnico. La idea es que la mayoría de las variables importantes como el momento, la energía o el momento angular están conectadas a ciertas transformaciones: respectivamente traducciones en el espacio y el tiempo y rotaciones. Esto es cierto en la mecánica clásica. Al exigir la misma conexión para mantener la mecánica cuántica, podemos derivar los operadores cuánticos correspondientes.

Estas son algunas derivaciones / justificaciones que uno puede usar para definir observables sin referirse a los experimentos. Pero realmente, la mejor justificación de la teoría está en los experimentos. Como se supone que la mecánica clásica sigue lógicamente a la mecánica cuántica, uno no debería poder derivar la primera de la segunda. Hay operadores de mecánica cuántica como el spin que no tienen una contraparte clásica y solo pueden justificarse mediante mediciones.

Un comentario final sobre los observables en la mecánica cuántica que nunca se menciona en los textos. No es necesario que haya un experimento correspondiente a cada operador hermitiano (observable) que se pueda escribir. Por ejemplo, dentro del marco de QM, x ^ 3p + p ^ 3x es un ‘observable’ perfectamente válido cuyo valor de probabilidad / expectativa, etc. se puede calcular. Pero es muy probable que no haya forma de medir tal cantidad.

Jay está en el camino correcto. En su formulación original de la mecánica cuántica, tanto de Broglie como Schrodinger fueron influenciados en gran medida por la óptica geométrica. Me parece recordar que una de las objeciones originales a la teoría de ondas de De Broglie fue la falta de una ecuación de ondas. En el enfoque de De Broglie, la materia tiene una longitud de onda dada por

[matemáticas] \ lambda = h / p [/ matemáticas]

La conexión entre el momento y la función de onda se puede entender escribiendo la función de onda como

[matemáticas] \ psi = A \ exp (i W (x, t) / \ hbar) [/ matemáticas]

La función W debe satisfacer

[matemáticas] \ frac {\ partial W} {\ partial t} + \ frac {1} {2m} (\ nabla W) ^ 2 + V – \ frac {i \ hbar} {2m} \ nabla ^ 2W = 0 [/matemáticas]

que en el límite clásico [matemáticas] \ hbar \ a 0 [/ matemáticas] es la ecuación de Hamilton / Jacobi para la función principal (o acción).

[matemática] \ frac {\ parcial W} {\ parcial t} + H (p, x) = 0 [/ matemática]

Esto derivamos conociendo la ecuación de Schrodinger. Supongamos que no lo hicimos, y estamos buscando alguna conexión con la idea de la onda de materia de De Broglie. La óptica geométrica proporciona un buen punto de partida, especialmente dada su estrecha conexión con la mecánica clásica hamiltoniana. Si escribimos la onda óptica en la forma dada anteriormente, los contornos con constante constante [matemática] W (x, t) [/ matemática] definen los frentes de onda y las líneas normales a estas son líneas de rayos. Tangente a las líneas de rayos están dadas por

[matemáticas] p = \ nabla W [/ matemáticas]

En la mecánica hamiltoniana, inmediatamente reconocemos esto como el impulso.

Si tenemos ondas estacionarias con energía E, entonces [matemática] W = S – Et [/ matemática] y [matemática] S [/ matemática] satisface

[matemáticas] \ frac {1} {2m} (\ nabla S) ^ 2 – (EV) – \ frac {i \ hbar} {2m} \ nabla ^ 2S = 0 [/ matemáticas]

Tomando el límite clásico [math] \ hbar \ a 0 [/ math] y usando [math] p = \ nabla S [/ math]

[matemática] \ frac {1} {2m} p ^ 2 = E – V [/ matemática]

que permite definir la longitud de onda local de De Broglie (reducida) de

[matemáticas] \ lambda = \ hbar / \ sqrt {2m (EV)} [/ matemáticas]

La pregunta ahora es cómo escribo una ecuación de onda en la que la energía transportada por la onda solo depende de la longitud de la onda y es independiente de la amplitud. Estas son observaciones cruciales del efecto fotoeléctrico y los experimentos de dispersión de electrones. Además, necesito mi función de onda para reproducir el comportamiento clásico cuando llevo [math] \ hbar \ a 0 [/ math]. Si juega con varias ecuaciones de onda “candidatas”, pronto se dará cuenta de que debe ser de primer orden con respecto al tiempo y de segundo orden con respecto a las coordenadas. Entonces, si escribimos el impulso como un operador diferencial

[matemáticas] p \ to \ hat p = \ frac {\ hbar} {i} \ nabla [/ matemáticas]

y sustituir esto en Hamiltonian [math] H (p, x) [/ math], y usar [math] \ psi = Ae ^ {iW / \ hbar} [/ math] como mi función de onda, de hecho lo haré obtener una ecuación de onda que tenga las propiedades que necesito.

Esto no es tanto una “derivación” como una justificación para una forma específica de una ecuación de onda cuyas soluciones satisfacen un conjunto específico de requisitos físicos.

Esta es una excelente pregunta y la respuesta es No, no se pueden derivar.

La formulación de la mecánica cuántica tiene estados representados por rayos en un espacio de Hilbert y observables como operadores en ese espacio de Hilbert. Estos son los principios que intervienen en la formulación y no pueden derivarse de principios más fundamentales.

Recomiendo leer los primeros capítulos de los Principios de la mecánica cuántica de Dirac. No puedo decir si está en el dominio público o no, pero si lo buscas en Google, parece que hay muchos archivos PDF disponibles.

No vas a encontrar mucha más precisión escrita y matemática que por Dirac. Aunque la versión original se escribió en 1930 (y se actualizó cuatro veces hasta 1982), sigue siendo un libro clásico que se puede leer y obtener una perspectiva moderna en el campo.

El descubrimiento de esta formulación es otra historia. Se remonta al origen de la mecánica cuántica a principios de la década de 1910. No fue formulado adecuadamente por separado (y de manera diferente) por Heisenberg y Schroedinger en 1925.

Muy posiblemente, fueron introducidos desde el punto de vista hamiltoniano y lagrangiano. Pero no estoy seguro.