Mecánica estadística: ¿Cuál es el ‘problema del signo de fermión’?

Las otras respuestas son buenas, pero me gustaría agregar la perspectiva algorítmica porque el problema surge en las simulaciones cuánticas de Monte Carlo de sistemas cuánticos de muchos cuerpos que exhiben el problema del signo, y resulta ser NP-difícil en el caso general .

Comencemos desde el principio. Tenemos un sistema cuántico de muchos cuerpos con partículas [matemáticas] N [/ matemáticas] y estados posibles [matemáticas] m [/ matemáticas], por lo que nuestro espacio de estado es exponencialmente grande: [matemáticas] m ^ N [/ matemáticas] ( para [matemática] m = 2 [/ matemática], digamos espines de electrones, y [matemática] N = 100 [/ matemática] de ellos, este es un espacio de estado dimensional [matemático] 10 ^ {30} [/ matemático] ) Afortunadamente, existe un procedimiento que nos permite ignorar la mayoría de estos siempre que podamos hacer una muestra representativa honesta de ellos. Este es el trabajo del algoritmo de Monte Carlo.

El procedimiento generalmente comienza mapeando la evolución del sistema cuántico en una trayectoria clásica de Monte Carlo (agregamos una dimensión al exponente al hacer esto), lo que significa que saltas de estado a estado con ciertas probabilidades. No es muy útil entrar en detalles sobre cómo se hace, y puede encontrar una gran cantidad de buen material de lectura por ahí [1]. Lo relevante es la función de partición:

[matemáticas] \ matemáticas {Z} = \ text {Tr} \ exp {(- \ beta H)} [/ matemáticas]

Tomando una expansión de Taylor y eligiendo una base [completa] para el Hamiltoniano, puede obtener una suma sobre [matemática] P (c_i) [/ matemática], probabilidades para la configuración [matemática] i [/ matemática] del sistema. Entonces la expectativa de algunos observables macroscópicos se parece al caso clásico:

[matemáticas] \ langle A \ rangle = \ frac {\ sum_i A (c_i) P (c_i)} {\ mathcal {Z}}. [/ math]

Para los sistemas cuánticos que consisten en bosones, todas las [matemáticas] P (c_i) [/ matemáticas] serán positivas, pero debido a la antisimetría de las funciones de onda fermiónicas que explica Kevin, también podemos tener contribuciones de probabilidad negativas (si ayuda a calmar esa sensación divertida, puedes decir pesos de Boltzmann en lugar de probabilidades). A veces, la magnitud de estas probabilidades es extremadamente pequeña, y las energías (o lo que sea observable) serán altamente oscilatorias en el espacio de configuraciones, y se puede imaginar que el esquema de Monte Carlo tendrá dificultades para probar todos estos estados con alta fidelidad. Es posible que tenga la inteligente idea de elegir una base que haga la diagonal hamiltoniana, que elimine el problema de los signos, pero luego está haciendo descomposiciones propias de un sistema que todavía se escala exponencialmente, es decir, [math] \ mathcal {O} ( m ^ N) [/ math] (como nota al margen, realmente me encanta ver que este tipo de inteligencia sea derribado por la complejidad computacional, solo nos muestra cuán poderosa es una idea). Al menos el problema depende de la base, lo que puede ayudar a encontrar esquemas de aproximación eficientes para algunos casos.

Es posible demostrar que en algunos casos bosónicos (y fermiónicos libres de frustración) un algoritmo de Monte Carlo puede lograr algún error [matemático] \ épsilon [/ matemático] en el tiempo que escala polinomialmente con las propiedades del sistema, es decir, el número de partículas y el temperatura. Para sistemas fermiónicos frustrados, el error escala exponencialmente [2].

Entonces, ¿qué es la frustración? Un ejemplo intuitivo simple es encontrar estados fundamentales del modelo Ising de celosía 3D, donde tenemos un gráfico de vértices [matemáticos] N [/ matemáticos] con valores binarios [matemáticos] \ pm 1 [/ matemáticos], así que [matemáticos] m = 2 [/ matemáticas]. Los bordes entre ellos pueden ser positivos o negativos, lo que implica una correlación positiva o negativa entre cada giro. Ahora imagine tres giros que están tratando de minimizar su energía total. Si los bordes entre dos de los giros son negativos, pero el tercer borde es positivo, es imposible satisfacer esto enérgicamente por completo (esto es esencialmente una desigualdad triangular), por lo que decimos que está frustrado. Tener muchos de estos problemas puede aumentar la dificultad de un problema y, en el caso general, el modelo Ising es NP-completo [3]. Se establece como un problema de decisión, donde ejecuta una simulación de Monte Carlo a cierta temperatura y pregunta si hay alguna configuración que proporcione una energía inferior al umbral elegido. Obviamente, puede calcular la energía de la configuración en tiempo polinómico para verificar esto, por lo tanto, está completa NP . Y dado que el problema de optimización correspondiente (algoritmo de Monte Carlo) tiene una versión de decisión NP-complete , es NP-hard [4].

Creo que esta es un área bastante interesante donde la teoría de la complejidad computacional se encuentra con la física cuántica. La parte más interesante radica en nuestra creencia de que ni siquiera se espera que las computadoras cuánticas puedan resolver problemas NP-completos de manera eficiente, a pesar de que la simulación cuántica es probablemente su capacidad más valiosa. Actualmente hay muchos estudios sobre el tema de qué tipos de hamiltonianos son eficientemente simulables. Por ejemplo, un hamiltoniano “estocástico” tiene todos los elementos no diagonales reales y no negativos de alguna manera, y dado que puede codificar un problema de optimización clásico como 3SAT en un hamiltoniano diagonal (que también es estocástico), sabemos que es al menos NP-hard [5].

Referencias

[1] Recomiendo encarecidamente el libro introductorio de mecánica estadística de David Chandler. Tiene un buen capítulo sobre Montecarlo y es un gran libro en general.

[2] Por ejemplo, el modelo antiferromagnético de Heisenberg (todos los acoplamientos negativos) en gráficos bipartitos puede evitar el problema del signo con un cambio de base adecuado: correlaciones del estado fundamental de los antiferromagnéticos cuánticos: un estudio de Monte Carlo con función verde.

[3] Ver El modelo de Ising es NP-completo por BA Cipra, un artículo bien escrito.

[4] Un excelente artículo describe gran parte de esta publicación con más detalle y demuestra la dureza NP del problema de los signos: [cond-mat / 0408370] Complejidad computacional y limitaciones fundamentales para las simulaciones fermiónicas cuánticas de Monte Carlo

[5] El trabajo de Sergey Bravyi es muy relevante aquí, especialmente este artículo: [1402.2295] Simulación de Montecarlo de hamiltonianos estocásticos.

Nuestro primer pensamiento debería ser que debe tener algo que ver con el hecho de que los fermiones obedecen las “estadísticas de Fermi-Dirac” (cf. La distribución de Fermi-Dirac) en lugar de Bose-Einstein (estadísticas de Bose-Einstein) o Maxwell-Boltzmann (Maxwell –Boltzmann estadísticas). Esto es lo más básico y puede tomarse como la característica definitoria de los fermiones. La forma más simple de decirlo es que si tiene una función de onda (en el espacio de posición) de dos fermiones, entonces si tuviera que intercambiar esos dos fermiones, tendría que multiplicar la función de onda por -1, es decir, [matemáticas] \ psi \ a – \ psi [/ math], que por supuesto lo voltea al revés. Tenga en cuenta que [math] | \ psi (x) | ^ 2 [/ math] no ha cambiado en ninguna parte. Tenga en cuenta también que si los dos fermiones estaban en el mismo estado (es decir, incluyendo la posición, x), intercambiarlos nos dice [math] \ psi (x) = – \ psi (x) [/ math], que requiere [ matemáticas] \ psi = 0 [/ matemáticas]. Entonces dos fermiones no pueden ocupar el mismo estado. Este es el principio de exclusión de Pauli.

Para los bosones (es decir, partículas de mecánica cuántica que obedecen las estadísticas de Bose-Einstein), [math] \ psi [/ math] no cambia bajo un intercambio de partículas. Maxwell-Boltzmann realmente no se aplica en mecánica cuántica.

Otro ángulo sobre la misma idea es que, en la teoría de campos cuánticos, los operadores de creación y aniquilación conmutan por campos bosónicos, pero deben anticommutar por campos fermiónicos, o de lo contrario, cuando intentes cuantificar la teoría, obtendrás tonterías.

En última instancia, este es un hecho bastante profundo e importante y está relacionado a través del teorema de las estadísticas de espín (teorema de espín-estadísticas) con los fermiones que tienen un espín de medio entero, mientras que los bosones tienen un espín entero. La teoría de la representación del grupo de Lorentz (o Poincare) ofrece una idea bastante profunda de dónde viene todo esto (teoría de la representación del grupo de Lorentz).

El problema del signo numérico de la página de Wikipedia nos dice

En física, el problema de los signos se encuentra típicamente (pero no exclusivamente) en los cálculos de las propiedades de un sistema mecánico cuántico con gran número de fermiones fuertemente interactuantes, o en teorías de campo que involucran una densidad no nula de fermiones fuertemente interactuantes. Debido a que las partículas interactúan fuertemente, la teoría de la perturbación no es aplicable, y uno se ve obligado a usar métodos numéricos de fuerza bruta. Debido a que las partículas son fermiones, su función de onda cambia de signo cuando se intercambian dos fermiones (debido a la simetría de la función de onda, vea el principio de Pauli). Entonces, a menos que haya cancelaciones que surjan de alguna simetría del sistema, la suma mecánica cuántica sobre todos los estados de partículas múltiples implica una integral sobre una función que es altamente oscilatoria y, por lo tanto, difícil de evaluar numéricamente, particularmente en alta dimensión. Dado que la dimensión de la integral viene dada por el número de partículas, el problema de los signos se agrava en el límite termodinámico.

De hecho, el “problema de los signos” está intrínsecamente relacionado con las estadísticas de los fermiones. En particular, es solo el problema de calcular observables en la práctica cuando tienes muchas partículas que interactúan fuertemente. Una interacción fuerte significa que los métodos perturbativos que podrían simplificar tal problema no son buenos porque la situación no es una ‘pequeña perturbación’ lejos de un montón de partículas libres o algo así. Primero pretenda que las partículas son distinguibles: todavía tendríamos que hacer una suma sobre todas las configuraciones o historias consistentes ya que estamos haciendo mecánica cuántica. Pero luego, para cada una de esas configuraciones individuales, ahora tenemos que incluir también todas las configuraciones que se ven iguales pero donde las partículas se intercambian. Entonces, la cantidad de términos que tenemos que calcular se vuelve enorme muy rápidamente. Ahora, debido a las estadísticas de fermiones, tenemos que hacer un seguimiento de agregar términos positivos y negativos. Si consideramos que el número de fermiones es muy grande, podemos reemplazar la suma por una integral. Entonces se está integrando sobre una función que a veces es positiva y a veces negativa, y esa es la naturaleza oscilatoria a la que se refiere la cita. Entonces, con suerte, la siguiente declaración de Wikipedia tiene un sentido intuitivo. El ‘gran número de variables’ al que se hace referencia es el conjunto de variables que realiza un seguimiento de las configuraciones, como la posición o el momento de cada partícula, etc.

El problema del signo numérico se refiere a la dificultad de evaluar numéricamente la integral de una función altamente oscilatoria de un gran número de variables. Los métodos numéricos fallan debido a la casi cancelación de las contribuciones positivas y negativas a la integral. Cada uno tiene que integrarse con una precisión muy alta para que su diferencia se obtenga con una precisión útil.
El problema de los signos es uno de los principales problemas no resueltos en la física de los sistemas de muchas partículas.

Hasta cierto punto, este es un problema de la tecnología matemática más que de la física, pero es probable que la solución, si la encontramos, dependerá de la física.

http://en.m.wikipedia.org/wiki/N

Esto tiene una buena explicación.

Agrego una explicación intuitiva: se puede imaginar que los valores de expectativa de los operadores fermiónicos toman valores en un círculo, en lugar de la línea real. Por lo tanto, tienen un valor máximo y mínimo. Compare esto con un operador bosónico en el que un número macroscópico de partículas puede ocupar el mismo estado, por lo que un operador bosónico no tiene un máximo.

Al imaginar un sistema de fermiones como un montón de cuentas que interactúan en pequeños anillos, puede adivinar que la posición neta o promedio es muy sensible a cada posición. Es como detener la manecilla de un reloj al azar versus detener un reloj de arena al azar. Puede hacer una suposición decente sobre la cantidad de arena que queda, pero es mucho más difícil adivinar dónde está la manecilla de segundos si la ha dejado funcionando durante mucho tiempo.