¿Qué es una distribución de Poisson? Como una distribución de Poisson predice esencialmente el resultado de los eventos a partir de los datos pasados ​​de los eventos, ¿se puede considerar una distribución de Poisson cualquier dato pasado aleatorio que en general muestre una congruencia débil?

Primero, expliquemos qué es una distribución binomial , ya que es discreta y, en consecuencia, un poco más tangible.

Digamos que trabajo en la cafetería de una empresa y quiero planear las prisas de la mañana. Sé que hay una probabilidad de 1 en 3 de que cada uno de los 75 empleados de la compañía se presente y quiera un café esta mañana. Obviamente, eso significa que el número esperado de cafés servidos será de 25, pero me gustaría saber un poco más que eso, por ejemplo, ¿cuál es la probabilidad de que 30 personas quieran un café? 35?

Si sabes un poco de matemática, no es demasiado difícil calcular la probabilidad exactamente. La probabilidad de que exactamente 25 personas aparezcan queriendo un café es

[matemáticas] \ binom {75} {25} \ left (\ frac {1} {3} \ right) ^ {25} \ left (1 – \ frac {1} {3} \ right) ^ {75 – 25 } \ aproximadamente 9.73% [/ matemáticas]

y la probabilidad de que al menos 30 personas aparezcan queriendo un café es

[matemáticas] \ sum_ {k = 0} ^ {30} \ binom {75} {k} \ left (\ frac {1} {3} \ right) ^ {k} \ left (1 – \ frac {1} {3} \ right) ^ {75 – k} \ aproximadamente 90.96% [/ math]

Etcétera. Dado que esto se calcula utilizando el teorema binomial, la distribución de probabilidad del número de personas que aparecerán queriendo un café se llama distribución binomial .

La distribución de Poisson es como la distribución binomial, pero se trata de una situación continua más que discreta. Específicamente, en lugar de muchos empleados que trabajan en una empresa, piense en los infinitos momentos entre las 9 a.m. y las 10 a.m., y suponga que, en promedio, los clientes llegan a una tasa de 25 por hora. Esto es un poco diferente al modelo anterior: por ejemplo, en el modelo anterior, podrían llegar a lo más 75 clientes, mientras que en el modelo continuo hay una probabilidad (muy, muy pequeña) de que lleguen 1,000,000 de clientes. En este modelo, la distribución de probabilidad del número de clientes que se presentan entre las 9 AM y las 10 AM se denomina distribución de Poisson .

En el escenario anterior, por cierto, si la cantidad de dinero que gasta cada cliente es independiente de lo que gastan los otros clientes y se distribuye de la misma manera, entonces los ingresos totales entre las 9 AM y las 10 AM tienen otro tipo de distribución, que es conocido como una distribución compuesta de Poisson .

La distribución de Poisson se trata de la probabilidad de coincidencia. Responde la pregunta:

¿Qué tan probable es que algo suceda N veces en el mismo período de tiempo?

Por ejemplo: suponga que sabe que un promedio de 10 automóviles por hora pasan un cierto tramo de carretera (durante algunas condiciones particulares, por ejemplo, de 2:30 a.m. a 5:30 a.m.en un día laborable, o en un período que puede ser razonablemente constante) .

Sin embargo, si solo te sientas y miras el camino durante una hora, puedes ver 8 autos, puedes ver 11 autos, puedes ver 15. ¿Cómo puedes adivinar qué esperar de una hora en particular? ¿Qué tan probable es que veas 9 en la hora que eliges?

La distribución de Poisson da una buena respuesta, si puede suponer que cada uno de los autos actúa de manera independiente y aleatoria y promedia su tasa conocida. En cualquier hora en particular, su probabilidad de obtener exactamente 9 autos en esa hora proviene de usar k = 9 y lambda = 10 en el pmf de la distribución de Poisson:

  $ lambda = 10; k = 9; python -c "import math; print ($ lambda) ** ($ k) * math.exp (- ($ lambda)) / math.factorial ($ k)"
 0.125110035721

Entonces, si sus números son correctos, generalmente ganará si apuesta que exactamente 9 autos llegarán en una hora en particular con una probabilidad de 8 a 1 o mejor, y perderá si apuesta a 7 a 1 o peor.

Se han hecho muchas matemáticas útiles en sistemas como este (eventos aleatorios no relacionados que ocurren con una frecuencia promedio conocida), porque muchos sistemas del mundo real se pueden modelar así:

Distribución de Poisson (sección “Ocurrencia”)

De: ¿Qué son las estadísticas? – Distribución de probabilidad de Poisson

¿Qué son las estadísticas? – Distribución de probabilidad de Poisson

Distribución de probabilidad de Poisson: un poco de historia
La distribución de probabilidad de Poisson tomó su nombre de Siméon Denis Poisson (1781-1840). El Sr. Poisson estaba explorando la probabilidad de las condenas por juicio que fueron injustas. Además, el Sr.Ladislaus Bortkiewicz (1898) descubrió que “el número de soldados prusianos que han muerto porque fueron pateados por un caballo” sigue también una distribución de Poisson.
Distribución de probabilidad de Poisson: definición teórica
La distribución de probabilidad de Poisson es una distribución de probabilidad discreta que representa eventos aleatorios que pueden ocurrir en puntos integrales de tiempo o espacio (volumen, área o distancia), y se conoce su ocurrencia. Además, una distribución de probabilidad de Poisson puede ser una distribución de probabilidad binomial cuando se cuenta la probabilidad de no ocurrencia del mismo evento en los mismos intervalos de tiempo o espacio. Un ejemplo de esto puede ser la cantidad de bicicletas rosadas que pueden pasar fuera de su casa (o no) en relación con la cantidad total de bicicletas que pueden pasar fuera de su casa, por ejemplo, en una hora. Por lo tanto, es adecuado describir eventos raros que tienen una probabilidad de ocurrencia suficiente que pueden contarse en intervalos estándar. Por lo tanto, también se llama la “Ley de eventos raros”.
Distribución de probabilidad de Poisson: aplicaciones
La distribución de probabilidad de Poisson se aplica a numerosos campos científicos como las telecomunicaciones, la astronomía (la tasa de fotones entrantes en los telescopios), la biología (el número de mutaciones por pieza / longitud de ADN), los seguros, la sismografía y muchos otros campos científicos.
Distribución de probabilidad de Poisson: definición estadística
Si definimos una variable discreta aleatoria que sigue una distribución de probabilidad de Poisson, luego la función de masa de probabilidad (pmf) para la distribución de probabilidad de Poisson es la siguiente:
El parámetro toma siempre valores positivos, y es el valor esperado de X, es decir, la media de la frecuencia con la que ocurren los eventos X.
los toma siempre valles integrales, así como el valor cero.
los es la base del logaritmo natural, y también se llama número de Euler.
los es factorial, es decir, sus miembros se multiplican, por ejemplo
Distribución de probabilidad de Poisson: ejemplo estadístico
Supongamos que ha visitado la misma playa durante 100 días. Además, supongamos que un erizo te ha picado 20 veces en estos 100 días. Tenga en cuenta que 5 días al azar, el erizo lo ha picado varias veces, por ejemplo, 2 veces al día. ¿Cuál es la probabilidad de que un día aleatorio entre estos 100 días, el erizo te haya picado solo una vez?
Para calcular la media de veces que un erizo le ha picado estos 100 días, debemos multiplicar las veces que le ha picado la cantidad de días que sucedieron estos eventos. Es decir: 80 días no ha sido picado por un erizo, 10 días ha sido picado 1 vez por el erizo y 5 días ha sido picado 2 veces por el erizo. Luego, dividimos este resultado por el número total de frecuencia que es 100 (días):
Y por lo tanto, . Debido a que estamos buscando la probabilidad de que el erizo te haya picado solo una vez en estos 100 días: . Luego, al reemplazar los símbolos de la fórmula por los valores correspondientes, como resultado, tenemos:
ή .
Distribución de probabilidad de Poisson: distribución de probabilidad acumulativa
La distribución de probabilidad acumulativa para la distribución de probabilidad de Poisson (cdf) es la siguiente:
Explicación del símbolo
: Indique la suma de todos los resultados que se producirán cuando las operaciones matemáticas se relacionen con cada enésimo miembro (i) dentro he terminado.
: El valor integral máximo de tiempo o espacio, en relación con el evento de interés.
: toma valores integrales, p. ej. 0,1,2,3… n.
El pmf y el cdf de la distribución de probabilidad de Poisson para λ = 2. Cabe señalar que las líneas discontinuas existen por razones de ilustración. Es una distribución de probabilidad discreta y, por lo tanto, solo existen valores integrales como 1 y 2, no 1.3 o 1.6.
Recursos
http: // … Siméon Denis Poisson (1781-1840)
http: // … Ladislaus Bortkiewicz

Bio breve:
Soy un StatExpert que analiza los datos. Ejecuto los siguientes proyectos:
“Encuestas en línea” en FaceGroups para recopilar respuestas.
Utube: “Diagrama de caja de madera”.
correo electrónico: [correo electrónico protegido]

El Poisson predice cuántos eventos de cierto tipo ocurrirán en un área limitada y / o durante un período de tiempo dado, siempre que los eventos ocurran independientemente y no puedan ocurrir simultáneamente. Los eventos a veces se denominan “resultados” u “ocurrencias observadas”.

No estoy seguro de entender lo que quieres decir con la segunda parte de tu pregunta. Existen fuertes relaciones entre el Poisson y varias otras distribuciones (más notablemente binomial, exponencial y normal). Pero no, ¡no todo está distribuido por Poisson! Incluso con datos que cuentan un cierto tipo de evento durante un cierto tiempo, etc., puedo pensar en tres formas en que los datos no serán Poisson. Para todo esto, usaré el ejemplo de la cantidad de visitas a la página de inicio de Quora el sábado por la noche entre las 10:00 y las 11:00 pm.

1) La independencia de los eventos o los criterios de simultaneidad pueden ser violados. A veces esto no es un gran problema si la violación es persistente pero tiene un efecto pequeño (por ejemplo, ocasionalmente un usuario envía correos electrónicos a algunos amigos para invitarlos a unirse a Quora). A veces generará un valor atípico en los datos si es un gran efecto, pero solo sucedió en un área / período (por ejemplo, un sábado, Quora es mencionado en un programa de televisión de las 10:00). Pero si la violación es persistente y tiene un gran efecto, los datos probablemente no serán distribuidos por Poisson.

2) Puede haber restricciones físicas en el número total de eventos que pueden ocurrir, mientras que una distribución de Poisson pura no tendrá “techo”. Por ejemplo, si el sitio falla cada vez que la carga llega a X usuarios.

3) Finalmente, puede haber una diferencia cualitativa en los períodos o áreas que está viendo que no necesariamente conoce como analista. Por ejemplo, si algunos sábados la compañía publica anuncios de televisión para el sitio y otros sábados no, probablemente verá una distribución bimodal. Si pudiera separar los “días de anuncios” de los “días sin anuncios”, probablemente cada uno se distribuiría en Poisson, pero los días de anuncios tendrían una media más alta.

La mayoría de los paquetes estadísticos tienen pruebas disponibles que calcularán la probabilidad de que una muestra dada de datos esté distribuida por Poisson. Pero antes de ejecutar las pruebas, simplemente 1) piense en lo que realmente están midiendo los datos: ¿se ajustan a los criterios para un Poisson? y 2) trazar un histograma de sus datos: ¿tiene forma de Poisson?

Bueno, para que sea fácil y comprensible,

La distribución de Poisson generalmente se ajusta a la mayoría de los casos raros. Por ejemplo, las personas que mueren a causa de accidentes en una localidad durante 10 días pueden considerarse como un ejemplo perfecto de distribución de Poisson.
Vamos a tener un dato imaginario

Día 1 2 3 4 5 6 7 8 9 10

muertes 0 2 1 0 2 0 1 5 3 2

Esta es una ilustración de las distribuciones de Poisson.
Como puede ver, los recuentos no son consistentes y bastante bajos, la probabilidad de ocurrencia también es baja.

La distribución de Poisson tiene solo un parámetro que se llama ‘Lambda’, sí, el griego lamda como su notación.

El pdf de la distribución de Poisson está dado por:

A medida que n se vuelve asimétrica, la distribución binomial tiende a la distribución de Poisson.

Similar a BINOMIAL pero diferente en varianza