¿Cómo puede la epistemología bayesiana tratar con innumerables hipótesis infinitas?

Un espacio de probabilidad se define como un conjunto de resultados, un Álgebra Sigma sobre esos resultados y una función que asigna probabilidades a las colecciones en el álgebra σ (estas colecciones son “eventos”).

Las álgebras σ son similares a las topologías, pero están cerradas solo bajo uniones contables (e intersecciones). El par (X, ∑) se llama espacio medible . Por ejemplo, una tirada de dados tiene resultados {1, 2, 3, 4, 5, 6} y puede definir el σ-álgebra como el conjunto de potencia de {1,2,3,4,5,6}. Asignar la probabilidad de 1/6 a cada resultado (aunque no a todos los eventos) produce el espacio de probabilidad con el que estamos familiarizados.

Si tiene innumerables hipótesis infinitas, su espacio aún debe ser medible . Un álgebra sigma común se llama el conjunto Borel que funciona para cualquier espacio topológico; el conjunto Borel es el álgebra σ generado por todos los conjuntos abiertos en la topología (y, por lo tanto, también contiene todos los conjuntos cerrados).

Se dice que un álgebra σ es “generada” por algún conjunto de conjuntos de resultados si es el álgebra σ más pequeño posible que contiene esos resultados (es decir, cada álgebra σ que contiene el conjunto generador. Por ejemplo, si el conjunto de resultados es {1, 2, 3}, entonces el álgebra σ generado por {{1}} es {{}, {1}, {2,3}, {1,2,3}} (tenga en cuenta que un álgebra σ debe contener el conjunto vacío y el conjunto de todos los resultados; requerir que también contenga {1} significa que también debe contener {2,3}, porque un σ-álgebra debe estar cerrado bajo intersecciones / uniones).

El conjunto Borel se puede generar a partir de cualquier topología (no solo cualquier espacio métrico) pero puede no estar completo. Un resultado de esto fue la medida de Lebesgue, que completa la medida de Borel para números reales. Lo relevante aquí es que necesitaría definir algo de álgebra σ, y que los conjuntos Borel son a menudo un buen lugar para comenzar.

Una vez que tenga un álgebra σ, escalarlo de modo que P (X) = 1 y etiquetar todos los eventos con la medida “0” como “nulo” en algún sentido conduzca a todos los axiomas de probabilidad.

  • P (A) ≥ 0
  • P (X) = 1
  • si P (A y B) = 0, entonces P (A) + P (B) = P (A o B)

Responder la pregunta tal como está escrita, en lugar de los comentarios, lidiar con innumerables hipótesis infinitas no es nada difícil. Cualquier problema de estadísticas bayesianas en el que intente inferir el valor de una variable aleatoria continua puede considerarse que tiene ‘hipótesis’ infinitamente infinitas, una por valor, y ese es exactamente el tipo de problema para el que es el método.

En cuanto a los innumerables espacios donde no hay métrica de distancia … bueno, primero analicemos qué tipo de cosas podría significar. Una pregunta que se debe esquivar sería decir ‘Definir una métrica de distancia que mapee elementos del conjunto en números’, y después de hacer esto, podemos hacer inferencia bayesiana nuevamente. Por ejemplo, podríamos usar los modelos de distancia de Hamming o espacio vectorial para definir distancias entre palabras, y luego hacer inferencia bayesiana sobre el texto a través de ciertos métodos.

Probablemente también estaría evitando la pregunta decir que incluso en espacios donde no hay una métrica de distancia obvia, podríamos pedirle a los humanos una estimación subjetiva y aproximar la métrica ‘verdadera’ usando la inferencia bayesiana. Entonces, tal vez sea difícil saber si un humano considera que una imagen es ‘más llamativa’ que otra, pero si les preguntamos, podemos tener una idea de lo que significan y aplicar ese conocimiento para adivinar cuán ‘llamativa’ es una imagen sin preguntarle a nadie.

La respuesta práctica, donde te pregunto por qué preguntas lo que estás preguntando, también podría ser una evasión. Si tiene un conjunto infinito de elementos que no puede imaginar una forma de diferenciarlos, ¿qué razón podría tener para distinguirlos? ¿Por qué a alguien le importaría adivinar qué elemento sucederá si no hay diferencia entre los eventos?

Sin embargo, la respuesta más exacta es que la definición de lo que significa que algo sea ‘aleatorio’ en un conjunto infinito depende inherentemente de la existencia de dicha métrica. Esto no tiene que ver con la inferencia bayesiana, tiene que ver con las definiciones de probabilidad. Podemos tener un número real aleatorio porque existen funciones [matemáticas] p [/ matemáticas] de modo que [matemáticas] \ int _ {- \ infty} ^ {\ infty} p (x) dx [/ matemáticas] converge. Sin esa ‘métrica’, no se puede tener probabilidad.