Si pudieras dar un ejemplo interesante para captar el interés de alguien en la teoría de juegos (es decir, cuán útil puede ser), ¿cuál sería ese ejemplo / problema? Resuelve el problema y da una explicación paso a paso.

Fuente: Game Theory – Final de la UEFA Champions League 2008
La final del Manchester United – Chelsea Champions League de 2008 debe ser uno de los mejores ejemplos de teoría de juegos en acción.
Chelsea y Manchester United fueron bloqueados en 1-1 después del tiempo extra, haciendo inevitable un tiroteo penal. Chelsea tuvo acceso a la respuesta típica del portero del United, Van der Saar, a un tiro penal basado en el análisis de su gol, salvando el historial y, por lo tanto, tenía una estrategia para vencerlo. La estrategia casi tuvo éxito hasta que Van der Sar se enteró del hecho de que Chelsea había hecho su tarea y estaba golpeando la pelota en direcciones donde Van der Sar era débil.

Llega Anelka y todo lo que tenía que hacer era atenerse al plan porque no había forma de que Van der Sar pudiera superar su debilidad en un minuto.

El genio de Van der Sar entra en juego aquí. Sabía que la única forma de tener una oportunidad de salvar era obligar a Anelka a abandonar el plan de juego del Chelsea. Lo hace indicando a Anelka aquí que conocía el plan. Anelka ahora tenía dudas: ¿conoce el plan o está mintiendo? ¿Me adhiero al plan o se desvía? Se hace una elección y se crea la historia.

Mira el video aquí:

Considere la siguiente situación:

  • Jason Bourne, James Bond y Johnny English están enamorados de la misma niña, Adriana Lima. No me preguntes por qué, ella era el primer nombre que podía recordar de mi cabeza. ¿No es hermosa? De todos modos, deciden resolverlo de la única manera que saben, es decir, dispararse entre sí.
  • Aquí está la parte divertida, los tres tienen exactamente la misma arma con una bala cada uno . Sin embargo, Bourne alcanza sus objetivos el 97.53% del tiempo (llamé a Snowden y confirmó la estadística), Bond el 90% (le daré mejores persecuciones de autos y habilidades de juego de póker) y Johnny English el 1% (golpear objetivos no intencionados no contar)
  • Dado que nuestro amado Johnny no es un tirador talentoso, se le da el beneficio de disparar primero. ¿Cuál es la mejor estrategia que puede adoptar para maximizar su tasa de supervivencia? (y mucho menos esas vacaciones de ensueño con Adriana en Seychelles)
  • Si elige disparar a Bond o Bourne, 99 de cada 100 veces va a fallar e incluso si lo logra, es probable que el que quede le dispare a Johnny y rompa el corazón de Adriana (Sí, en este punto, incluso ella está alentando a Johnny!)
  • Entonces, el mejor enfoque para Johnny sería errar deliberadamente el disparo disparándolo hacia arriba o conociendo a Johnny, disparando su dedo izquierdo.
  • Ahora, si es el turno de Bond, su mejor opción es dispararle a Bourne, ya que él es la principal amenaza. No puede permitirse el lujo de intentar dispararle a Johnny, ya que Bourne es un excelente tirador y Bond estaría firmando su propio certificado de defunción.
  • Del mismo modo, si Bourne tuviera el segundo turno después de Johnny, tendría que usar su única bala en Bond para ayudar a Johnny y Adriana a vivir felices para siempre.
  • Adriana Lima puede llamar la atención de cualquiera. NADIE.
  • PD: Marko Jaric (la esposa de Adriana Lima) es una jugadora de baloncesto y, lo que es más importante, mide 6 pies y 7 pulgadas de alto y pesa 102 kilogramos. De ahí el anonimato 🙂

Creo que muchas de las respuestas aquí son más de alto nivel. Como el autor de la pregunta parece querer un ejemplo específico interesante de teoría de juegos, profundicemos en el mundo del canibalismo.


Aquí está el problema:

Un viajero se pierde en una isla desierta y se encuentra rodeado por un grupo de n caníbales.

Cada caníbal quiere comerse al viajero pero, como cada uno sabe, existe un riesgo. Un caníbal que ataca y se come al viajero se cansaría y estaría indefenso. Después de comer, se convertiría en un blanco fácil para otro caníbal (que también se cansaría y estaría indefenso después de comer).

Todos los caníbales tienen hambre, pero no pueden confiar entre sí para cooperar. Los caníbales están bien versados ​​en la teoría de juegos, por lo que pensarán antes de hacer un movimiento.

¿El caníbal más cercano, o algún caníbal del grupo, devora al viajero perdido?

El primer paso es reconocer que el viajero es solo un caníbal cansado e indefenso. Una vez que haga eso, el problema puede reducirse a uno que solo involucre a los caníbales. Para resolverlo ahora, tomemos pequeños tamaños de muestra.

Tamaño de muestra: n = 1

Este es un problema casi ridículamente fácil de resolver. Si hay un caníbal, y por supuesto el único viajero, entonces el caníbal obviamente se comerá al viajero, ya que no tiene nada que temer de ningún otro caníbal.

Tamaño de muestra: n = 2

Dos caníbales hambrientos y un viajero indefenso hacen que el problema sea más difícil. Recuerde que concluimos que el viajero es efectivamente un caníbal indefenso, y por extensión, un caníbal indefenso es simplemente un viajero.

Lo que los caníbales probablemente se darán cuenta es que si uno de ellos se come al viajero, se convertirán en presa del otro caníbal. Por lo tanto, comer al viajero constituye su muerte.

Debido a esto, ninguno de los caníbales atacará y el viajero estará a salvo.

Tamaño de muestra: n = 3

Aquí es donde el problema se pone interesante.

Si hay tres caníbales y un viajero, este problema puede reducirse a uno que hayamos resuelto anteriormente. Suponiendo que los caníbales están bien versados ​​en la teoría de juegos, descubrirán que el primero en atacar obtendrá los beneficios.

¿A qué me refiero cuando digo eso? Si un caníbal se come al viajero, se convierte en viajero, y el problema se reduce a n = 2. Por lo tanto, los dos caníbales restantes no atacarán, y el primer caníbal que ataque estará a salvo.

¿Cómo resolvemos este problema, entonces? Si hay un número impar de caníbales, los caníbales atacarán; Dado un número par de caníbales, no atacarán y el viajero estará a salvo.

Este no es un problema de teoría de juegos pura, pero ciertamente es un ejemplo interesante que llama la atención. ¡Espero que esto ayude!


[1] Página sobre Mindyourdecisions

Dos delincuentes son arrestados enfrentando cargos ligeros que solo pueden llevar una pena de cárcel de un año por cada uno. En un intento de construir un caso más fuerte contra ellos, el DA decide extender una oferta a cada uno de ellos de forma independiente para delatar al otro.


Se les dice que si una de ellas ratas (defectos), esa persona será absuelta de todos los cargos y la otra cumplirá una condena completa de 4 años. Si ambos desertan, el DA tiene suficiente evidencia para vincularlos a ambos con sus crímenes, pero como un buen gesto por su ayuda, les permitirá cumplir solo 3 años cada uno. Si nadie rata (cooperan juntos), nada cambia para ellos; servirán 1 año cada uno según lo previsto. No sabrán qué hicieron los demás hasta que se emita el veredicto.

Cada uno de los delincuentes se enfrenta al llamado Dilema del prisionero , un clásico favorito de los teóricos del juego.

En pocas palabras, si el prisionero B rata, tiene sentido que el prisionero A también ratifique, porque eso reduce su sentencia de 4 años a 3. Si el prisionero B coopera, es racional que el jugador A ratifique, porque esa es su tarjeta para salir de la cárcel.

El juego es simétrico, por lo que el jugador B razonará de la misma manera. Resulta que la mejor respuesta de cada uno para el juego del otro es siempre rata.

Por lo tanto, dos jugadores racionales no tienen mejor opción que criticarse mutuamente. Esto ilustra la noción de un equilibrio de Nash (llamado así por John Forbes Nash Jr., el personaje de Russell Crowe en la película ‘A Beautiful Mind’). El juego siempre se resuelve así, porque ningún jugador tiene ningún incentivo racional para cambiar su decisión.

Esta es la esencia general del juego. Hay varios spin-offs y variantes más allá del simple juego PD único, en el que no entraré.

Considera participar en una excursión grupal con tus amigos donde, a falta de un mejor pasatiempo, la gente decide jugar este juego:

Todos adivinan un número entero entre 0 y 100, ambos inclusive y lo envían por escrito
Quien se acerque más a 2/3 del promedio de todos los números enviados, gana.

Está a punto de escribir algún número como su “envío” cuando se le ocurre que, dado que el número máximo que uno puede adivinar es 100, el número ganador no puede ser más de 2/3 de 100, es decir, 67.

Luego se detiene y piensa de nuevo: tal vez los otros también hayan resuelto esto y no van a enviar ningún número más que 67 como respuesta. Lo que significa que el máximo que podrías escribir es 100 * 2/3 * 2/3 o aproximadamente 45. Pero espera, esto no ha terminado. Tal vez los demás también se hayan dado cuenta de que no deberían escribir ningún número mayor que 45, lo que significa que no debería escribir ningún número mayor que 45 * 2/3 = 30.
A estas alturas probablemente ya haya descubierto lo que está sucediendo.

Resumamos las iteraciones de su pensamiento:

Nivel 1: Aquí está asumiendo que las personas están adivinando sus números al azar (llamémoslo pensamiento de Nivel 0) .100 es la suposición máxima posible, por lo que el valor máximo de 2/3 del promedio es 2/3 * 100 = 67.
Además, también puede suponer que los demás están adivinando números entre 0 y 100 al azar y, por lo tanto, el promedio estará cerca de 50. Su envío en este caso puede ser 2/3 * 50 = 33 (aproximadamente). Llamémoslo su “Buena presentación”.

Nivel 2: Aquí su suposición es que las otras personas ya están pensando en el Nivel 1 y que no escribirán más de 67 como su presentación. Por lo tanto, 2/3 * 67 = 45 es el máximo que debe escribir.
Su buena presentación en este nivel = 2/3 * 33 = 22

Nivel 3: Extendiendo la lógica anterior, suponiendo que las otras personas hayan trabajado hasta el Nivel 2, te das cuenta de que 2/3 * 45 = 30 es el máximo que debes escribir.
Su buena presentación = 2/3 * 22 = 15

Nivel 4: 2/3 * 30 = 20 es el máximo que debe escribir.
Buena presentación = 2/3 * 15 = 10.

…y así.

En cada iteración de su pensamiento, el número máximo que puede considerar a medida que su envío sigue reduciéndose en 2/3 y finalmente esto lo llevará a enviar 0 como respuesta. Aquí es donde crees que todos convergerán. Hemos alcanzado algún tipo de “equilibrio”.

Pero espera, ¿realmente esperas que todos los demás piensen tantos pasos por delante? Echas un vistazo a las personas que te rodean e intentas adivinar lo que podría estar pasando por sus mentes. ¿Se detendrán en 67? ¿Pensarán unos pasos más por delante? ¿Van a llegar hasta 0? ¿Qué pasa si la mayoría de ellos no pasa la primera ronda de pensamiento?
Tal vez creas que los demás no pensarán más allá del primer nivel (es decir, 67) y decidirán seguir adelante, digamos, 22 como tu sumisión (razonamiento en el Nivel 2).

El ejemplo anterior muestra una situación en la que si gana depende no solo de su decisión sino también de las decisiones de los demás. Por lo tanto, su “mejor decisión” se basa en sus expectativas o creencias sobre las decisiones de los demás. En términos generales, de esto se trata la teoría de juegos: el estudio de las personas que toman decisiones u optan por una estrategia basada en sus creencias sobre lo que los otros jugadores (competidores, socios, amigos) van a hacer. Esto se debe a “lo que obtienes”, es decir, los pagos dependen de lo que hagan todos los “jugadores”.
El contexto para un “juego”, sin embargo, no siempre es competitivo. En muchas ocasiones también puede ser cooperativo, por ejemplo, compartir un taxi y encontrar la mejor manera de dividir la factura.

Volviendo al juego descrito anteriormente, podemos ver fácilmente que hay muchas decisiones importantes que imitan ese tipo de pensamiento:
Comprar acciones ya que cree que otros también lo comprarán, por lo tanto, el precio aumentará …
Tomar un desvío para evitar un atasco de tráfico, ya que esperaba que otros no lo tomaran … (y luego tal vez quedar atrapado en el tráfico allí ya que los otros viajeros también creían de esa manera :-))
..y así.

Después de compartir este “juego” de ejemplo con la audiencia, probablemente daría un ejemplo sobre el famoso Dilema del Prisionero y si mi audiencia parecía interesada en aprender más, recomendaría leer El arte de la estrategia (Dixit, Nalebuff) como Un texto introductorio absolutamente brillante sobre esta disciplina.

PD: El juego descrito anteriormente puede tener resultados interesantes cuando se juega con varios tipos de personas. Algunos estudios apuntan a la cantidad elegida entre 25-40 con una desviación estándar alta (alrededor de 20) (los grupos estudiados fueron estudiantes de secundaria, directores generales, doctores en economía, estudiantes universitarios …).
Cuando se ejecutó con un grupo de estudiantes de Caltech, se encontró que el número se encontraba entre 15-20.
Fuente de los datos anteriores: Estudios de comportamiento del pensamiento estratégico en los juegos (Colin F. Camerer) [TENDENCIAS en Ciencias Cognitivas Vol.7 No.5 mayo de 2003]

Este es un muy buen ejemplo:
Caso 1:

Supongamos que hay 4000 viajeros que tienen que viajar de A -> D.
Las rutas A-> B y C-> D son muy estrechas y el tiempo que tardan n personas en recorrerlas viene dado por: n / 100, mientras que las rutas B-> D y A-> C son muy amplias y Se tarda un tiempo constante de 45 minutos en recorrerlos.

¿Qué ruta deberían tomar?
Una solución inmediatamente visible (y atractiva ya que es simétrica) es que 2000 tome la ruta: A-> B-> D y los otros 2000 tomen la ruta A -> C -> D. ¿Por qué?
Si 1 de ellos decide (digamos, el que antes estaba tomando la ruta A -> B -> D) para cambiar a A-> C-> D, entonces el tiempo que ahora tarda en viajar: 45 + 2001/100 = 65.01 mientras que antes solo le llevó 45 + 2000/100 = 65 minutos.
Entonces, ¿por qué debería desviarse? Sin razón. No lo hará y este es un equilibrio de Nash.

Caso 2:
Ahora considere que, como buen ministro de transporte, construye un camino bidireccional BC, que es tan ancho que solo toma un tiempo constante de 1 minuto. ir de B-> C o C-> B. Ahora, qué camino tomarán los viajeros:
Esta vez, todos los 4000 tomarán el camino A-> B-> C-> D.
Tiempo empleado por cada persona: 4000/100 + 1 + 4000/100 = 81 minutos.
¿Por qué?
Si uno de ellos decide desviarse y toma el camino (wlg) A-> B-> D, entonces el tiempo total que le toma: 4000/100 + 45 = 85 minutos.
Si toma el camino A-> C-> B-> D, entonces el tiempo total que le toma: 45+ 1 + 45 = 91 minutos.
Entonces nadie se desviará y A-> B-> C-> D es un equilibrio de Nash.

Como puede ver, la construcción de una ruta adicional B <-> C aumentó el tiempo total de viaje. Aunque esto es contrario a la intuición, intenta pensarlo bien.

Ahora el hecho interesante: muchos puentes / carreteras se han cerrado / roto debido a este fenómeno conocido como la paradoja de Braess.
[Fuente: http://en.wikipedia.org/wiki/Bra …]

En Seúl, Corea del Sur, se observó una aceleración del tráfico alrededor de la ciudad cuando se retiró una autopista como parte del proyecto de restauración de Cheonggyecheon. [2] En Stuttgart, Alemania, después de las inversiones en la red de carreteras en 1969, la situación del tráfico no mejoró hasta que una sección de la carretera recién construida se cerró nuevamente para el tráfico. [3] En 1990, el cierre de la calle 42 en la ciudad de Nueva York redujo la cantidad de congestión en el área. [4] En 2008, Youn, Gastner y Jeong demostraron rutas específicas en Boston, Nueva York y Londres, donde esto podría ocurrir, y señalaron caminos que podrían cerrarse para reducir los tiempos de viaje previstos.

Así que este es un ejemplo práctico e impactante en el mundo real que, con suerte, atraerá la atención de todos hacia Game Theory.

Pirate Game , es el ejemplo más interesante que encontré de Game Theory.

Problema

Hay 5 piratas racionales, A, B, C, D y E. Encuentran 100 monedas de oro. Deben decidir cómo distribuirlos.
Los piratas tienen un estricto orden de antigüedad: A es superior a B, superior a C, superior a D, superior a E.
Las reglas de distribución del mundo pirata son las siguientes: que el pirata más veterano debería proponer una distribución de monedas. Los piratas, incluido el proponente, votan si aceptan esta distribución. Si la asignación propuesta es aprobada por mayoría, sucede. Si no, el proponente es arrojado por la borda del barco pirata y muere, y el siguiente pirata más veterano hace una nueva propuesta para comenzar el sistema nuevamente. Cada pirata preferiría lanzar otro por la borda, si todos los demás resultados fueran iguales. Cada pirata es muy codicioso pero valora más su vida. ¿Cuál sería la estrategia propuesta por A?


Solución

Se podría esperar intuitivamente que el Pirata A tendrá que asignarse poco o nada a sí mismo por temor a ser rechazado para que haya menos piratas para compartir. Sin embargo, esto está bastante lejos del resultado teórico. Tenemos que trabajarlo al revés

Caso 1: Cuando solo queda un pirata E. Es simple que se guardará todo el oro para sí mismo

Caso 2: Cuando D y E, por lo que esta es una situación muy peligrosa para D, lo que él proponga D lo votará, y luego volveremos al Caso1

Caso 3: Cuando quedan C, D y E, C sabe que si D no acepta su esquema de votación, D firmará su nota de suicidio. Entonces C propone un esquema de distribución de 100, 0, 0 monedas

Caso 4: Ahora B sabe que si le da incluso una moneda a cada D y E, obtendrá su voto. Por lo tanto, propone un esquema de distribución 98, 0, 1, 1.

Caso 5: de manera similar, A propondrá el esquema 97, 0, 1, 0, 2 o 97, 0, 1, 2,0. Por lo tanto, guarda casi todas las monedas de oro.

Siéntese y hablemos sobre la paz y la guerra.

La comunidad

Imagina que tienes un grupo de seres sensibles (no quería usar humanos, pero siéntete libre de sustituirlos por humanos) con dos tipos muy distintos de personalidades;

  • The Dove : estos tipos son muy gentiles y no les gusta pelear

  • The Hawk : estos muchachos valoran su autoestima en función de la cantidad de peleas que han ganado. Por lo tanto, NUNCA retroceden de una pelea.

La competencia

Por lo tanto, los individuos en esta comunidad tienen que competir por comida y cada vez que dos personas se reúnen para una competencia de alimentos, ocurre uno de estos 3 escenarios;

  • Si las dos son palomas, ambas evitan pelear y comparten la comida por igual

  • Si ambos son halcones, lucharán brutalmente y el ganador tomará toda la comida mientras el perdedor pasa hambre

  • Si una paloma se encuentra con un halcón, la paloma cede y huye, evitando la pelea.

El hambre

Ahora, vamos a introducir el hambre.

Si alguna persona ha tenido más de 3 concursos y no ha recibido al menos 1/2 comida, la persona morirá de hambre (¡triste!).

Repoblación

Entonces, la población se reduce debido al hambre y de repente Dios (Me) repobla el ecosistema con individuos que usan una probabilidad de 50:50 (paloma: halcón). Entonces el ciclo continúa.

Teoría de juego

Déjame ahorrarte toda la jerga de la teoría del juego. Acabo de escribir un programa Java para simular este juego durante más de 5,000 generaciones -> poph2 / HawkDove

Población normal

A partir de mis datos, me di cuenta de que la distribución de Dove to Hawks se estabilizó rápidamente en un promedio de 60% – 40% como se muestra en el cuadro a continuación.

Población con enfermedad de Hawk por 1,000 generaciones

Yo (dios) introduje una enfermedad que básicamente produce más halcones bebés que palomas bebé durante 1,000 generaciones desde la generación 2,000 hasta 3,000.

Me di cuenta de que durante este período de guerra ( Era de los Halcones ), el 65% de la población son halcones y el 35% de la población son palomas.

Después de la generación 3,000 cuando la enfermedad se curó, el equilibrio regresó después de aproximadamente 500 generaciones.

Población con enfermedad de Dove por 1,000 generaciones

Yo (dios) introduje una enfermedad que básicamente produce más palomas bebé que halcones bebés durante 1,000 generaciones desde la generación 2,000 hasta 3,000.

Ahora notamos que este período pacífico ( Era de las palomas ) le dio a la paloma la oportunidad de dominar a la población y elevar hasta el 82% de la población, mientras que los halcones solo tenían el 17% de la población.

Después de la generación 3,000 cuando la enfermedad se curó (nuevamente), el equilibrio regresó después de aproximadamente 500 generaciones.

Conclusión

Detener la violencia. Tienes más posibilidades evolutivas si no eres violento.

Tenga en cuenta

Este juego se llama Hawk-Dove Game y he agregado algunos sabores míos en la historia

He tratado de no hablar sobre temas de Game Theory Geek (como lo solicitó la pregunta) y este análisis puede volverse complejo rápidamente si lo hago. Así que no permita que un experto en teoría de juegos me crucifique por no mostrar cosas matemáticas serias.

(1) Aquí hay un ejemplo bonito y famoso que leí en el último teorema de Fermat (libro).

Planteamiento del problema:

Un “truel” es un duelo que involucra a tres personas. Las reglas son que cada uno tiene un turno para disparar a un oponente y el truel continúa hasta que solo quede un participante con vida.

En un truel particular hay tres personas: el Sr. Black, el Sr. Gray y el Sr. White. El Sr. Black golpea su objetivo una vez de cada tres, el Sr. Gray golpea el objetivo dos veces en cada tres disparos y el Sr. White nunca falla. Para hacerlo más justo, el Sr. Black dispara primero, luego el Sr. Gray, seguido por el Sr. White, y así sucesivamente, hasta que solo un hombre permanezca vivo.

La pregunta es ¿qué debe hacer el señor Black?

No, la respuesta no es “tomar lecciones de tiro”.

Para recibir puntos de bonificación, ¿cuáles son las posibilidades de cada hombre de sobrevivir a la prueba?

Análisis y solución:

La mejor opción de las negras es no violenta: disparar al aire.

Si le dispara a Gray y lo mata, entonces es un hombre muerto. Si dispara a White y lo mata, solo tiene una probabilidad de supervivencia de 1/3. Al disparar al aire, se asegura de que Gray y White lo disparen y luego tiene el primer disparo contra el sobreviviente. En otras palabras, al matar inicialmente a uno de sus oponentes solo empeoraría sus posibilidades porque luego el oponente restante le dispararía a él en lugar de al tercer hombre.

Si Black dispara al aire, las probabilidades de supervivencia son:

Blanco 22.22%
Gris 38.09%
Negro 39.69%

Parece irónico que el peor disparo tenga las mejores posibilidades, y que esto se debe a que él es el menos peligroso. Suena como el síndrome del cachorro alto.

La solución anterior, disparar al aire, es la que se ofrece en el libro de Singh. Alguien en la red me alertó de un nuevo florecimiento, a saber, que no hay nada que impida que Gray y White piensen en la misma línea. De hecho, una vez que las negras disparan al aire, es probable que hagan lo mismo, si tienen algún sentido. Sin embargo, esto no invalida la solución dada.

Fuente:

http://soler7.com/IFAQ/TruelQ.html

http://soler7.com/IFAQ/TruelA.html

(2) Este ejemplo es más realista y explica un fenómeno que probablemente presenciamos con frecuencia.

Mira el video adjunto.

(3) Este es bastante común.

Así que aquí hay un rompecabezas para hacerle saber un poco de la teoría de juegos ……

Supongamos que hay un grupo de piratas y se encuentran con un naufragio que tiene una caja del tesoro con 1000 monedas de oro. Ahora todos quieren una parte del tesoro y, siendo piratas, todos son codiciosos, quieren maximizar sus ganancias.
No hay una forma particular de decidir cómo se deben dividir las monedas de oro, por lo que se les ocurre una regla sobre cómo dividir las monedas. Asumiendo que cada pirata es un experto en teoría de juegos, aquí están las reglas:

1.) El pirata mayor creará una regla sobre cómo dividir las monedas. (Al igual que el tipo x1 elige las monedas p1, el tipo x2 elige las monedas p2 …… el tipo xn elige las monedas pn … .p1 + p2 + … + n4 … pn <= 1000.
2.) Todos, incluido el pirata que creó la regla, votarán si la aceptan o no.
3.) Si 50% o más personas aceptan la regla, entonces las monedas se dividen de esa manera y esta división se detiene.
4.) De lo contrario, el pirata que creó la regla será arrojado al mar y de los piratas restantes, el mayor creará la regla y continuará.
5.) En el caso de que un pirata obtenga las mismas monedas independientemente de si el pirata actual que crea las reglas es arrojado al agua o se queda con él, elegirá no aceptar la regla para tratar de disminuir a las personas en el barco para aumentar las posibilidades de obteniendo más monedas.

Entonces, suponiendo que eres el pirata más viejo, ¿qué pasará idealmente?

Solución-

Caso n = 1:
Si eres la persona sola, tomarás todas las monedas, al final.

Caso n = 2:
Si hay 2 personas, entonces todo lo que tienes que hacer es votar por ti mismo, para que obtengas el 50% de los votos (1/2) y tomes todas las monedas

Caso n = 3:
Si hay 3 personas, solo necesita 1 voto aparte del suyo. Dígale al primer tipo “si no acepta mi regla, terminará con 0 monedas (caso n = 2), así que le daré 1 moneda y tomaré 999”. Dado que el tipo 1 conoce bien la teoría de juegos, aceptará la oferta porque sabe que esa es la mejor cantidad posible de monedas que puede obtener.

Caso n = 4:
De manera similar, ahora necesita 1 voto aparte del suyo (2/4). Dígale al segundo tipo “si me expulsan, se producirá n = 3 y obtendrá 0 monedas, ya que el primer y tercer tipo se emparejarán (explicado anteriormente)”. Dale 1 moneda y toma 999, él aceptará la oferta.

Caso n = 5:

Usando el caso 4, convence al primer y tercer tipo de que tome 1 moneda cada uno y regrese con 998 monedas

Y más adelante.

Entonces, en este problema de la teoría del semi-juego con cada posición, puedes darte cuenta de cómo puedes maximizar tus ganancias y qué otros piratas convencer

Espero que esto ayude

Un lindo ejemplo implica aplicar la teoría de juegos al Juicio de Salomón . En el relato bíblico original, el rey Salomón resolvió dos reclamos competitivos de la maternidad al decretar que el bebé en cuestión se redujera a la mitad. La verdadera madre rápidamente objetó y renunció a su reclamo, lo que le permitió a Solomon otorgarle el bebé ileso.

El problema con esta solución es que la madre falsa, si hubiera sido más inteligente, podría haber hecho fácilmente lo mismo , sin dejar al sabio Solomon más sabio. La teoría de juegos, sin embargo, sugiere otra solución para detectar a la verdadera madre:

A ambas mujeres se les ofrece la oportunidad de completar una subasta para el bebé, con una tarifa de entrada pequeña pero no insignificante que no se aplica si solo participa una. La subasta en sí es una subasta de Vickrey : los participantes hacen ofertas selladas y el ganador paga la segunda oferta más alta. Esto ofrece a los licitantes un incentivo para ofertar su verdadero valor. La falsa madre, sabiendo que perdería la subasta (ya que valora menos al bebé) no tiene ningún incentivo para participar y pagar la tarifa de entrada. La verdadera madre, por lo tanto, lleva al bebé a casa gratis.

Un grupo de personas está haciendo una barbacoa. El chef toca una campana y anuncia: “Al menos uno de ustedes tiene la cara sucia, no serviré postre hasta que sus caras estén limpias. Tocaré esta campana hasta que todos con la cara sucia la hayan limpiado”. Hay tres personas con caras sucias. La campana suena:

Una vez.
Dos veces
Tres veces.

Y de repente, los tres delincuentes se limpian la cara y se sirve el postre.

¿Que pasó? Comencemos con una hipótesis: ¿y si hubiera una sola cara sucia? Después de ese primer timbre, el comensal con la cara sucia miraría a su alrededor y, al no ver a nadie más con la cara sucia, concluye que es suyo.

¿Y si hubiera dos caras sucias? Después del primer timbre, el comensal A con la cara sucia ve al comensal B. con la cara sucia, pero una vez que la campana suena de nuevo, A se da cuenta de que si B fuera la única cara sucia, B habría inferido del mar de caras limpias comenzando brillantemente que era La cara de B que estaba sucia, y B se habría limpiado la cara. Debido a que B en realidad no se limpió la cara, debe haber otra cara sucia … ¡y es A! Mientras tanto, B está trabajando con el mismo razonamiento aplicado a A. Así que ambos se borran al mismo tiempo.

Ahora, a nuestros tres comensales con la cara sucia. Después de la tercera campana, cada comensal sucio se da cuenta de que los otros dos comensales de cara sucia no se limpiaron la cara, y si esas dos hubieran sido las únicas caras sucias, habrían limpiado después de dos campanas por la lógica del escenario de dos caras sucias encima. Entonces los tres se limpian al mismo tiempo.

Para obtener más información: Página sobre Cmu

Si alguna vez viste The Dark Knight (2008), los primeros 6 minutos no solo son muy apasionantes, sino que también profundizan en la idea de una división justa, una faceta importante de la teoría de juegos. Esto se resume maravillosamente en el siguiente artículo:

Página sobre Mindyourdecisions

Esencialmente, la idea del Joker es robar un banco. Promete una parte del botín a cada ladrón que ha contratado para el trabajo. Cada ladrón tiene un papel que desempeñar en el atraco. Lo que los ladrones no saben es que el Joker ha instruido con tacto a cada ladrón que elimine a otro tan pronto como se complete el papel de este último (lo que lleva a una mayor participación por ladrón). Eventualmente, solo queda el Joker, y él se embolsa todo el recorrido. Si solo los ladrones entendieran la teoría del juego y se dieran cuenta de antemano de lo que el bromista estaba haciendo … ¡pero evidentemente no hay diversión en eso!

El problema del talmud

Una persona debe 100 y 200 a los acreedores, pero muere antes de pagar su deuda. Los acreedores deciden dividir su patrimonio pero piensan en una forma eficiente de dividirlo.

Caso 1: el tamaño del patrimonio es 100
Divide el patrimonio por igual. Entregue a los acreedores A 50 y B 50.

Caso 2: el tamaño del patrimonio es 200
Entregue al acreedor A 50 y B 150.

Caso 3: el tamaño del patrimonio es 300
Dé al acreedor A 100 y B 200.

Razón detrás de tal división:

Identifique la parte reclamada por ambas partes ( la parte común ), que en este caso es 100. Ahora divida esto en partes iguales entre las partes. Lo que queda después de esta división se le da al segundo acreedor.

Esto se conoce como teoría del juego cooperativo.

La mayoría de las respuestas dadas aquí son de situaciones imaginarias. Un escenario que ocurre comúnmente es votar en los reality shows de televisión . Supongamos que hay un claro favorito en la competencia y que cada espectador solo recibe 1 voto.

Escenario 1:

Aquí todos los espectadores votan por sus favoritos.

Escenario 2:

Suponiendo que todos los usuarios voten por sus favoritos, los espectadores deciden votar por su segundo o tercer favorito.

Por lo tanto, los espectadores estarán en una solución. Un ejemplo del escenario 2 sería que la ganadora de un Oscar y un Grammy, Jennifer Hudson, fuera votada en American Idol.

El dilema de los prisioneros es la primera opción obvia y justificable.

Pero si estuviera dando una clase sobre el tema, comenzaría con “Destrucción mutuamente asegurada”.

Imagine que, teóricamente, se presentaba al enemigo la voluntad de destruir el mundo como la mejor defensa contra tal resultado.

Ahora imagine que durante la mayor parte de tres décadas, esta fue la política de dos naciones capaces de exactamente esa hazaña.

Ahora imagina que funcionó.

Cue “Dr. Strangelove”. Y prepare un poco de alcohol de grano y cócteles de agua destilada.

“EPO”, “POE”, “OPE”

Maldición, ¿cuál es ese código?

Algunas organizaciones tienen evaluación por pares al final del año. Estas evaluaciones generalmente ayudan a determinar la bonificación para el individuo. Este es un caso simple de una teoría de juegos llamada dilema del prisionero.

  • Si la persona A y la persona B se retroalimentan mutuamente, cada una de ellas recibe poca o ninguna bonificación
  • Si A da retroalimentación negativa pero B da retroalimentación positiva, la persona A obtendrá una bonificación alta y la persona B obtendrá poca o ninguna bonificación
  • Si la persona A y la persona B dan comentarios positivos, ambos recibirán una bonificación

Por lo tanto, la persona A y la persona B optimizarían sus ganancias si ambos brindan comentarios positivos para cada año hasta que uno diverja.

El dilema del prisionero o la tragedia más general de los comunes.

Uno debe adoptar la estrategia en la que no soporta el Sucker’s Payoff, que generalmente no es óptimo en general.

en una nota muy muy ligera

Créditos: Dr. Isomorpheus

Mira una mesa de ruleta. ¿Por qué el juego está manipulado a favor de la casa? (La llamada “ventaja de la casa”.) Si jugaste este juego de manera óptima comenzando con una cantidad determinada y apostando una cantidad fija, ¿cuánto tiempo tomarías perder todo tu dinero?

Ahora, haz lo mismo con otros juegos de azar.

La teoría de los juegos se desarrolló originalmente para guiar el diseño de los juegos de azar y los gobierna hasta el día de hoy.