¿Por qué las cantidades observables o medibles de la mecánica cuántica están representadas por operadores lineales?

La respuesta corta es: dados supuestos simples sobre el espacio de estado, los operadores lineales son las cosas naturales que surgen.

Cuanto más tiempo va a requerir algún conocimiento matemático sobre operadores autoadjuntos y espacios de Hilbert. Usted ha sido advertido: proceda bajo su propio riesgo.

Recordamos el hecho de que el espacio de estado es un espacio de Hilbert [matemática] \ matemática {H} [/ matemática]; es un espacio vectorial para acomodar el hecho de que necesitamos considerar superposiciones de estados [matemática] c_1 \ phi + c_2 \ psi [/ math], y tiene una estructura de espacio interno del producto ya que necesitamos poder modelar el colapso de la función de onda. Este último punto merece algo de reflexión.

Definimos el producto interno de la siguiente manera: [matemática] \ langle \ psi, \ phi \ rangle = 0 [/ matemática] si y solo si hay alguna [matemática] A [/ matemática] observable, si medimos [matemática ] A [/ math] para los estados [math] \ psi [/ math] y [math] \ phi [/ math], siempre obtenemos resultados diferentes. Entonces tiene sentido definir operadores de proyección que fijen algunos subespacios [matemática] S [/ matemática] de [matemática] \ matemática {H} [/ matemática] y triture todos los vectores ortogonales a [matemática] S [/ matemática] a cero.

La interpretación física de dicho operador de proyección es la siguiente: medimos el estado y encontramos que está en el subespacio [matemáticas] S [/ matemáticas]. Cualquier componente del estado que sea inconsistente con esa medida desaparece en ese momento. Por ejemplo, supongamos que estamos modelando un electrón. [math] S [/ math] corresponde al subespacio de estados confinados dentro de algún recuadro. El electrón está inicialmente en algún estado [matemático] \ psi [/ matemático] de modo que tiene alguna probabilidad de ser medido dentro de esa casilla, y alguna probabilidad medida fuera de la casilla. Luego, hacemos una medición y descubrimos que el electrón está dentro de la caja. En ese momento, el estado del electrón es [matemática] P_S \ psi [/ matemática], donde [matemática] P_S [/ matemática] es el operador de proyección que fija [matemática] S [/ matemática] y aplasta todo lo ortogonal a ella .

Ahora, considere cualquier observable. Para facilitar la exposición, continuaré usando position, que denotaré [math] X [/ math]. Dado que siempre podemos considerar los diversos componentes de la posición por separado, supondré además que la posición solo varía en algún lugar entre [math] (- \ infty, \ infty) [/ math] (es decir, tenemos algo unidimensional, en lugar de 3- dimensional).

Para cualquier observable, hay una familia correspondiente de subespacios correspondientes a varias mediciones. Por ejemplo, tenemos el subespacio de estados para los que se medirá la posición en [matemáticas] (-1,1) [/ matemáticas]. También tenemos el subespacio de estados para los que se medirá la posición en [matemáticas] (-3, -1) \ cup (4,5 \ sqrt {2}) [/ matemáticas].

De manera equivalente, para cualquier observable hay una familia correspondiente de operadores de proyección. Es decir, tenemos un mapa que toma subconjuntos de la línea real [matemática] S \ mapsto P ^ X (S) [/ matemática], donde [matemática] P ^ X (S) [/ matemática] es el operador de proyección que elimina todo componentes inconsistentes con la medición [matemática] X [/ matemática] en el subconjunto [matemática] S [/ matemática]. (Técnicamente, estoy haciendo trampa un poco, solo deberíamos considerar los subconjuntos de Borel , en lugar de todos los subconjuntos, pero esta es una distinción en la que no quiero entrar).

¿Qué propiedades debería tener esta familia de operadores de proyección? Afirmo que deberían satisfacer:

  1. [math] P ^ X (\ emptyset) = 0, \ P ^ X (\ mathbb {R}) = id [/ math] —después de todo, para cada estado debemos medir [math] X [/ math] para tomar en algún valor, pero por otro lado si permitimos cualquier valor de [math] X [/ math], entonces obtendremos todo el espacio de estados.
  2. Deje que [math] S_1, S_2, S_3, \ ldots [/ math] sea un número contable de subconjuntos disjuntos de [math] \ mathbb {R} [/ math]. Entonces [matemática] P ^ X \ left (\ bigcup_i S_i \ right) = \ sum_i P ^ X (S_i) [/ math] —si lo piensa, tanto el lado izquierdo como el derecho corresponden al operador de proyección que corrige el subespacio donde [matemática] X [/ matemática] se mide como [matemática] S_1 [/ matemática] o [matemática] S_2 [/ matemática] o [matemática] S_3 [/ matemática] …

Las familias de operadores de proyección con estas propiedades se conocen como medidas con valor de proyección . Si observa las dos propiedades dadas anteriormente, la razón de esta convención es clara: si, en lugar de mapear a operadores de proyección que acabamos de mapear a números reales, las dos propiedades anteriores solo estarían diciendo que el mapa [matemático] S \ mapsto P ^ X (S) [/ math] es una medida.

Como tal, quizás no sea tan sorprendente que podamos definir una integral que corresponda a esta medida con valor de proyección: la construcción es esencialmente la misma que la de construir una integral a partir de una medida normal con valor real. Para un subconjunto dado [math] S \ subset \ mathbb {R} [/ math] y una función [math] f: \ mathbb {R} \ rightarrow \ mathbb {C} [/ math], denotamos esta integral por

[matemáticas] \ int_S f (x) dP ^ X (x) [/ matemáticas]

Podría pasar bastante tiempo discutiendo las fascinantes propiedades de esta integral. Por ejemplo, sorprendentemente,

[matemáticas] \ int_S x ^ 2 dP ^ X (x) = \ left (\ int_S x dP ^ X (x) \ right) ^ 2 [/ math].

Sin embargo, vamos a ser un poco más modestos y solo presentaremos el siguiente operador

[matemáticas] X = \ int _ {\ mathbb {R}} x dP ^ X (x) [/ matemáticas].

Sí, estoy abusando de la notación aquí también llamando al operador [math] X [/ math]. Sin embargo, afirmo que este operador es en realidad lo que queremos estudiar; de hecho, es lo suficientemente fundamental como para que los físicos simplemente identifiquen este operador con lo observable. Es decir, en el caso particular donde [math] X [/ math] denota la posición, esta integral elegante define exactamente el operador de posición.

Puede verificar que todo tipo de propiedades agradables se mantengan para este operador. Por ejemplo, es autoadjunto y [math] \ langle \ psi, X \ psi \ rangle [/ math] da el valor esperado de [math] X [/ math] para el estado [math] \ psi [/ matemáticas].

De hecho, este operador codifica toda la información sobre el observable [math] X [/ math]. Este es un hecho no trivial, y requiere que el Teorema espectral lo pruebe, pero lo que esencialmente equivale a esto es que: aunque comenzamos con la medida con valor de proyección para construir [matemáticas] X [/ matemáticas], podríamos tener se ha ido fácilmente al otro lado y ha derivado la medida (proyectada de manera única) con valor de proyección asociada con el operador [math] X [/ math].

En física clásica, las variables dinámicas físicas, por ejemplo, la posición xy el momento p pueden medirse utilizando la forma clásica de medición conocida, pero en física cuántica, donde la mecánica cuántica es la herramienta para tratar de describir un sistema microscópico , donde la forma clásica no es viable, porque en QM estas variables dinámicas están canónicamente relacionadas, y sus funciones de onda espacial están matemáticamente relacionadas a través de la transformación de Fourier, por lo tanto, x se comporta de manera diferente en el espacio momentáneo, y p se comporta de manera diferente en posición (espacio x), por lo tanto, cada variable dinámica debe estar asociada con un operador, para operar en la función de onda se describe el sistema para producir el valor propio, valor medido de la variable dinámica. Para más detalles ver, (www.quantumechanicbook.com)

La respuesta corta es que este es solo uno de los postulados de la mecánica cuántica a partir del cual se han deducido muchas consecuencias observables. El gran acuerdo entre esas predicciones y los resultados experimentales no nos permite descartar esos postulados.

Sin embargo, existe una conexión muy interesante entre la linealidad de los operadores vinculados a los observables y la causalidad. Esta conexión nos permite explorar las posibles consecuencias de la no linealidad de los operadores, por lo que puede verse como una justificación parcial de la linealidad de la mecánica cuántica. La conexión es la siguiente. Si hubiera operadores no lineales vinculados a observables, en principio podríamos construir un hamiltoniano en función de esos operadores. Entonces, la evolución temporal, dada por el hamiltoniano, sería no lineal, por lo que podríamos clonar estados cuánticos (ver teorema de no clonación). Esto, junto con la conocida existencia de estados enredados, nos permitiría enviar información a través de distancias arbitrariamente largas al instante, lo que, a su vez, potencialmente (es decir, si quisiéramos hacerlo) nos permitiría matar a nuestra abuela. antes de que pudiera dar a luz a nuestra madre.

Entonces, todo lo demás no se modificó, la no linealidad de un operador asociado a un observable dejaría una puerta abierta a la violación de la causalidad en la mecánica cuántica.

La respuesta de tres palabras (excluyendo este prefacio): es un axioma.

La respuesta un poco más larga (por eso tiene “sentido”): porque los operadores lineales son los “objetos matemáticos naturales” en los espacios vectoriales. [Advertencia: también se podrían incluir operadores multilineales, pero hay un sentido en el que se trata de operadores lineales que operan naturalmente en un espacio vectorial diferente (VxV), por lo que si solo tenemos un espacio vectorial (V), y no realmente quiero trabajar con ese tipo de espacios derivados, entonces lo único que puede tener son operadores lineales de V a sí mismo [segunda advertencia: u operadores entre espacios de operadores, etc., pero eso es de nuevo en un sentido más complicado.]]

Para un péndulo simple, hacemos ciertas aproximaciones y obtenemos una pequeña ecuación, que es muy útil para hacer relojes de pared y lo que sea. Sin embargo, esa pequeña ecuación no funcionará cuando nuestras aproximaciones iniciales no sean válidas.

En mecánica cuántica, presumiblemente hemos hecho ciertas aproximaciones, y hemos obtenido los conceptos de superposición lineal y operadores lineales, que son muy útiles para hacer la mayoría de los dispositivos e interpretaciones. Sin embargo, esos conceptos pueden no funcionar donde nuestras aproximaciones presumibles no son válidas.

Un paso a la vez …

Básicamente porque mantiene las cosas manejablemente simples. Los operadores no lineales también son posibles; consulte http://ist-socrates.berkeley.edu

¡Porque funciona! Describe la física en el mundo en que vivimos y permite hacer predicciones que, cuando se verifican experimentalmente, resultan ser ciertas. Puede haber otras formas (equivalentes o incluso mejores) de describir la verdad subyacente profunda que exista. Quizás algún día se descubran estas formas y se conviertan en un nuevo estándar. Pero no todavía.