¿Qué es un polinomio de Bernstein?

Digamos que tienes algún experimento que tiene éxito con la probabilidad [matemática] p [/ matemática], como lanzar una moneda sesgada o jugar un juego de azar. Si prueba el experimento [matemáticas] n [/ matemáticas] veces seguidas, ¿cuál es la probabilidad de que tenga éxito exactamente [matemáticas] k [/ matemáticas] veces?

Debe saber o poder determinar que la respuesta es

[matemáticas] \ binom {n} {k} p ^ k (1-p) ^ {nk} [/ matemáticas]

y este, de hecho, es el polinomio de Bernstein [matemáticas] b_ {n, k} (p) [/ matemáticas]. A veces ayuda psicológicamente cambiar la variable de la [matemática] p [/ matemática] relacionada con la probabilidad a la más común [matemática] x [/ matemática], entonces

[matemáticas] b_ {n, k} (x) = \ binom {n} {k} x ^ k (1-x) ^ {nk} [/ matemáticas]. La misma cosa. Estamos cambiando la perspectiva de probabilidad fija y número de éxitos variable a conteo de éxito fijo y probabilidad variable.

Algunas cosas deben quedar inmediatamente claras de la definición. En primer lugar, este es un polinomio. Además, para [matemática] x [/ matemática] en el rango [matemática] [0,1] [/ matemática], los valores del polinomio no son negativos y no exceden 1 (ya que podemos interpretarlos como probabilidades).

Además, podemos ver intuitivamente cómo se comporta. Para ser concretos, tomemos [matemáticas] n = 100 [/ matemáticas] y [matemáticas] k = 40 [/ matemáticas]. Por lo tanto, estamos pidiendo la probabilidad de obtener exactamente 40 éxitos al intentar 100 veces.

Ahora, está bastante claro que si la probabilidad [matemática] x [/ matemática] es [matemática] x = 0.4 [/ matemática], entonces tener éxito en exactamente el 40% de los intentos debería ser razonablemente probable (de hecho, la probabilidad obtener exactamente 40 éxitos es aproximadamente el 8%, lo que no parece mucho, pero es mucho mejor que con otros valores de [math] x [/ math]).

Si, por otro lado, [matemática] x [/ matemática] está lejos de 0.4, entonces esta probabilidad rápidamente se vuelve ridículamente pequeña. Imagine, por ejemplo, que [matemáticas] x [/ matemáticas] resulta ser [matemáticas] 0.7 [/ matemáticas]. Entonces esperarías 70 éxitos. Obtener 60 parece poco probable pero aún posible, pero obtener 50 es tan inesperado que debería ser extremadamente raro y 40 éxitos es algo que nunca esperarías que suceda. De hecho, la probabilidad de 40 éxitos con una probabilidad de [matemáticas] 0.7 [/ matemáticas] es menos de uno en un billón .

¿Qué significa eso para nuestro polinomio? Significa que dados [matemática] n, k [/ matemática], los valores del polinomio se concentran muy fuertemente alrededor del valor más probable de [matemática] x [/ matemática] que es simplemente [matemática] k / n [/ matemática]. De hecho, aquí hay una gráfica de [math] b_ {100,40} (x) [/ math] en el rango [math] 0 \ leq x \ leq 1 [/ math]:


La forma de la campana se vuelve aún más estrecha a medida que aumentamos el valor de [math] n [/ math]: cuanto mayor es el número de experimentos, es menos probable que el número de éxitos se desvíe significativamente del valor esperado.

El pico del polinomio es, por lo tanto, siempre en [matemáticas] x = k / n [/ matemáticas], con una rápida disminución hacia la izquierda y hacia la derecha. Esta es la utilidad clave de los polinomios de Bernstein: se comportan de manera similar a una “función delta” – una función (ficticia) de masa total 1 que es 0 en todas partes excepto por un pico en un punto específico, en este caso [matemáticas] k / n [/matemáticas]. Los polinomios de Bernstein no tienen masa total 1, pero el área total debajo de la curva (la integral del polinomio de 0 a 1) se determina fácilmente como simplemente [matemática] 1 / (n + 1) [/ matemática], independientemente de [matemáticas] k [/ matemáticas].

Debido a esta propiedad de tipo delta, los polinomios de Bernstein se pueden combinar de forma natural para aproximar cualquier función continua en [matemáticas] [0,1] [/ matemáticas]. Dada tal función [matemática] f [/ matemática], definimos una aproximación [matemática] B_n [f] [/ matemática] como

[matemáticas] B_n [f] (x) = \ sum_ {k = 0} ^ nf (\ frac {k} {n}) b_ {n, k} (x) [/ matemáticas]. Simplemente estamos muestreando la función en los puntos [matemática] 0,1 / n, 2 / n, \ ldots, 1 [/ matemática] y multiplicando cada muestra por el polinomio “espiga” en ese punto. Afortunadamente, el factor de normalización que proviene de la masa total de cada polinomio de Bernstein es exactamente lo que necesitamos, ya que puede verificar si lo intenta con la función constante [matemáticas] f (x) = 1 [/ matemáticas].

Entonces se puede demostrar, con bastante facilidad, que [matemática] B_n (f) [/ matemática] no es muy diferente de [matemática] f [/ matemática] en sí misma, y ​​la diferencia disminuye a 0 cuando [matemática] n [/ matemática ] crece, simultáneamente para todas [matemáticas] x [/ matemáticas]. Por lo tanto, los polinomios de Bernstein proporcionan una prueba explícita del Teorema de aproximación de Weierstrass, que establece que las funciones continuas pueden ser aproximadas de manera uniforme por los polinomios.

Son una forma genial de representar un polinomio general. Para algunos polinomios A (x) = a_n x ^ n + a_ {n-1} x ^ {n-1} + \ cdots + a_1 x + a_0 podemos construir un polinomio de Bernstein B (x) = b_0 B_ {n, 0} (x) + b_1 B {n, 1} (x) + \ cdots b_n B {n, n} (x) con coeficientes b_i tales que B (x) = A (x). Donde B_ {n, i} (x) = \ binom {n} {i} x ^ {i} (1-x) ^ {ni} forman la base polinómica de Bernstein.

Una cosa buena de los polinomios de Bernstein es una propiedad de convexidad. Tenga en cuenta que B_ {n, i} (x) = \ binom {n} {i} x ^ {i} (1-x) ^ {ni} \ ge 0 para 0 \ le x \ le 1. Se deduce que si todos los coeficientes b_i son mayores que cero, los polinomios de Bernstein B (x) deben ser mayores que cero en el rango 0 \ le x \ le 1. Un resultado similar es que todos los coeficientes son negativos.

Podemos explotar esta propiedad en cero algoritmos de búsqueda. Digamos que desea encontrar los ceros de algún polinomio en un rango dado. Primero reescala a [0,1] y construye los polinomios de Bernstein. Podemos probar rápidamente los signos de los coeficientes, si todos son positivos o todos negativos, entonces el polinomio no puede tener un cero. Para hacer un programa de búsqueda de cero, necesita un método de subdividir, a partir de nuestro B (x) inicial podemos construir dos nuevos polinomios de Bernstein B_0 (x) y B_1 (x) de modo que B (x) = B_0 (x / 2) para 0 \ le x \ le \ frac12 y B (x) = B_1 ((x-1) / 2) para \ frac12 x \ le 1. Esto nos permite usar un procedimiento recursivo para encontrar los ceros.

find_zeros(B(x)):

check_signs_of_coefficients(B(x))

if all_the_same_sign then

return no_zeros

else if reached recursion limit

return one zero in range, say by Newtons method

else

construct polynomials B_0(x), B_1(x)

find_zeros(B_0(x))

find_zeros(B_1(x))

Para 1 dimensión esto es bastante útil, existen otros métodos alternativos que pueden hacer el mismo trabajo. Realmente comienza a tener uso en 2D y 3D. Se puede seguir un enfoque similar de división y conquista. En dos 2D, un rango cuadrado se puede dividir en cuartos que se pueden dividir en cuatro cuartos. Encontrará que para una gran parte del dominio, la prueba de signos fallará y la recursión terminará. Lo he usado en mi trazador de curvas implícitas / algebraicas que puede dibujar las soluciones de dos ecuaciones polinómicas variables como x ^ 2 + y ^ 2-1 = 0 (un círculo) o (x ^ 2 + y ^ 2) ^ 3 -4 * x ^ 2 * y ^ 2 (una forma de cuatro lóbulos). Aquí la recursión continúa a nivel de píxel y puede calcular la imagen completa en una décima de segundo.

Puedes ver los horarios en la esquina superior derecha. Tenga en cuenta que el número de píxeles es aproximadamente la mitad del tamaño real 408 * 379 = 154632, ya que muchos se han podado.

La misma idea puede extenderse a tres dimensiones. Aquí la recursión divide el dominio cúbico en ocho cubos más pequeños. Esto puede calcular formas muy complejas como este polinomio sextico

Puede ver el programa en mi sitio web Superficies algebraicas y leer sobre el algoritmo en un par de documentos http://singsurf.org/papers/dagst … y Un nuevo método para dibujar Superficies algebraicas

More Interesting

¿Cuántas matemáticas se pueden saber realmente en una vida?

Cómo reducir las llamadas de sorteo para mi móvil Infinite Running

¿Qué es la teoría de la medida?

¿Cómo podemos probar o refutar que este mundo no es una simulación por computadora?

A y B pueden hacer un trabajo en 30 días, pero B y C pueden hacerlo en 20 días. Si A trabaja durante 5 días y B lo toma y trabaja durante 15 días, ¿cuántos días le habrá tomado a cada A, B y C completar el trabajo completo?

¿Por qué tantas teorías de control avanzado no se han aplicado a la práctica industrial?

¿Qué es [math] \ displaystyle \ lim_ {n \ to \ infty} \ left (\ frac {1} {1 + n} \ right) ^ n = [/ math]?

¿De cuántas maneras hay 5 personas para ser amigos entre sí en Facebook, de modo que cada persona sea amiga de al menos otra persona en el grupo?

¿Cuáles son algunas ramas, teoremas o definiciones de las matemáticas que la teoría de categorías simplifica enormemente?

¿Cuál es el significado del trabajo de Mumford y Deligne sobre la irreductibilidad de los espacios de módulos?

¿Cuál es el mayor número de dimensiones espaciales que los matemáticos han 'visualizado'?

¿Qué áreas de las matemáticas puras son más relevantes para la industria?

¿Cómo usan las matemáticas los profesionales de TI?

Cómo probar [math] gcd [/ math] con descomposición de factores primos y cómo muestro que [math] gcd (m, n) = \ prod_ {p \ in \ mathbb {P}} p ^ {min (v_ { n} (p), v_ {n} (p))} [/ math] usando descomposición de factores

¿Cuáles son las diferencias entre CodeIgniter 2x y 3x?