¿Cuál es el “teorema de imposibilidad de la flecha” en términos simples y cuál es su importancia práctica?

  • Andy entra a una heladería y al ver que tienen chocolate, fresa y vainilla, ordena chocolate. Antes de que el vendedor tenga la oportunidad de tomar el helado, dice: “Lo siento, se nos acabó la fresa”. “En ese caso”, dice Andy, “tendré vainilla”. ¿Extraño verdad? Sin embargo, por extraño que parezca, este comportamiento es para Andy, es una rutina cuando los grupos toman decisiones (simplemente sustituyan a Bush, Nader y Gore por chocolate, fresa y vainilla). (Fracaso del IIA).
  • A Andy le gustan las chispas sobre su helado. Andy entra en la heladería y al ver que tienen chocolate, fresa y vainilla elige chocolate. Antes de que el vendedor tenga la oportunidad de tomar el helado, dice: “Hoy, el chocolate viene con chispas gratis”. “En ese caso”, dice Andy, “tendré vainilla”. ¿Extraño verdad? Sin embargo, una vez más, es fácil demostrar que mejorar una opción puede hacer que un grupo rechace esa opción (no hay psicología involucrada en este resultado). (Fracaso de la asociación positiva).
  • Andy entra a un supermercado y le ofrecen manzanas o plátanos y elige manzanas. A Andy se le ofrecen plátanos o cocos y elige plátanos. A Andy se le ofrecen manzanas o cocos y Andy elige los cocos. (A> B, B> C pero C> A). ¿Extraño verdad? No solo es extraño, si Andy tiene preferencias como esta, el supermercado puede tomar todo su dinero con una bomba de dinero. Una vez más, sin embargo, es bastante posible que los grupos hagan un ciclo de esta manera, incluso si cada individuo en el grupo tiene preferencias perfectamente normales (transitivas). (Fallo de transitividad).

    Paradojas como las anteriores se conocen desde hace siglos. Arrow mostró que ningún mecanismo de decisión puede eliminar todos estos tipos de paradojas. (Nota: el teorema de Arrow en realidad se aplica a cualquier mecanismo para agregar cualquier clasificación, no solo votar y no solo preferencias). Podemos aplastar algunas paradojas, pero solo a costa de crear otras (o eliminar la democracia por completo).

    En términos más generales, Arrow mostró que la elección grupal (agregación) no es como la elección individual.

    Supongamos que una persona es racional y que observamos sus elecciones. Después de un tiempo, llegaremos a comprender sus elecciones en términos de sus preferencias subyacentes (supongamos que la estabilidad es un experimento mental). Podremos decir: “Ah, veo lo que esta persona quiere. Ahora entiendo por qué están eligiendo de la manera que lo hacen. Si yo fuera ellos, elegiría de la misma manera”.

    Arrow mostró que cuando un grupo elige, no hay preferencias subyacentes para descubrir, ni siquiera en teoría. En un sentido, el teorema es trivial. Sabemos o deberíamos haber sabido siempre que un grupo ya no tiene preferencias más que un grupo sonríe. Sin embargo, Arrow mostró que sin invocar casos especiales ni siquiera podemos racionalizar las elecciones grupales como si el leviatán tuviera preferencias. Dicho de otra manera, el único leviatán que racionaliza la elección grupal tiene las preferencias de un loco.

    Digamos que tiene un grupo de individuos y sus preferencias individuales para un conjunto de 3 o más alternativas y está tratando de encontrar una preferencia para el grupo.

    Para traducir estas preferencias individuales en un resultado para el grupo, tendremos que usar algún tipo de sistema de votación.

    Algunas condiciones razonables que uno puede esperar que el sistema de votación que usamos cumplan son:
    U – Universalidad, es decir, cada uno de los individuos debe poder tener cualquiera de las preferencias posibles. En otras palabras, las preferencias de los individuos no deben restringirse de ninguna manera.
    P – eficiencia pareto. Si todos en el grupo prefieren x a y, entonces el grupo debería preferir x a y. Piensa en esto como unanimidad
    I – Independencia de alternativas irrelevantes. Esto es difícil de entender. La mejor manera de pensarlo es que la elección entre dos alternativas x e y debería depender solo de sus posiciones relativas y no de la posición de decir una tercera alternativa z. Si la posición de z cambia pero las posiciones relativas de x e y son las mismas, entonces no debería hacer una diferencia en la elección entre x e y. Por lo tanto, para la elección entre x e y, los perfiles xyz y zxy se tratan de la misma manera. (En ambos casos, se prefiere x a y)
    ND – No dictadura. Un dictador se define como alguien que obtiene exactamente lo que quiere cada vez. La no dictadura simplemente significa que no debería existir un dictador como se definió anteriormente.

    Además, deberíamos querer que el sistema de votación genere un orden transitivo (si se prefiere a by b se prefiere a c, se prefiere a a c). Si este no es el caso, entonces nuestra elección de grupo podría no tener mucho sentido, ya que tendremos un ciclo entre las elecciones (digamos que se prefiere a b, que se prefiere a c, pero c se prefiere a a. Cuál es el verdadero ganador ¿luego?).

    Tal sistema de votación que genera un orden transitivo se llama función de bienestar social .

    El teorema de la imposibilidad de las flechas establece que no existe una función de bienestar social que satisfaga U, P, I y ND. Alternativamente, puede expresarse como: Si desea un orden de grupo transitivo que satisfaga U, P e I, debe tener un dictador.

    Si considera las condiciones anteriores como los criterios para un sistema de votación justa, entonces el teorema de Arrow básicamente dice que no existe un sistema de votación justa, lo cual es bastante notable.

    Como ejercicio, piense en cuáles de las condiciones de Arrow usan comúnmente los métodos de votación, como el método de la regla de la mayoría, la regla de la pluralidad y el uso de puntos / clasificaciones (conteo de borda)

    La respuesta de Tanay es correcta: para un conjunto razonable de supuestos sobre lo que debe hacer una regla de votación, no existe una regla de votación que los satisfaga.

    Pero ¿qué significa eso? Un voto mayoritario parece funcionar en la toma de decisiones, y en algunas ocasiones (raras) todos están de acuerdo y prácticamente cualquier sistema de votación razonable servirá. Entonces, al menos algunas veces, las reglas de votación funcionan.

    Aquí está mi respuesta laica para lo que dice el teorema de imposibilidad de Arrow:

    Cuando los grupos con puntos de vista conflictivos están tomando una decisión colectiva sobre qué hacer y tienen que seleccionar entre muchas opciones, probablemente tendrán dificultades extremas para hacerlo de una manera “justa”.

    Lo que señala el teorema de Arrow es que, bajo alguna circunstancia (cuando las personas tienen puntos de vista conflictivos particulares), los grupos de personas se quedan atrapados en una discusión circular sobre lo que colectivamente quieren. Dado eso, puede preguntar:

    ¿Cuál es un buen resultado? Esta es una pregunta cargada, porque “bueno” es siempre lo que quieres, pero consideremos dos conceptos:

    1. Si todos prefieren un resultado a otro, entonces definitivamente deberíamos elegir el resultado que todos prefieren. (llamado eficiencia de Pareto)
    2. Si un resultado supera a cualquier otro resultado en una batalla uno contra uno, entonces deberíamos considerar que ese es el ganador, incluso si no es el favorito de nadie. Esto es lo que sucede en compromiso. (llamado criterio de Condorcet)

    ¿Con qué frecuencia pasan cosas malas? Sabemos que existen, pero mientras no sean frecuentes, realmente no importan. Excepto que son frecuentes. Y sí importa. De hecho, para cualquier grupo pequeño de personas, a medida que aumenta el número de resultados posibles (llamados alternativas en el cuadro a continuación), la probabilidad de que no haya un ganador mayoritario aumenta al 100% (que es 1 en el cuadro) y, por lo tanto, necesitamos más calificaciones para elegir un resultado. Por otro lado, cuando el número de opciones es pequeño (con lo que quiero decir 3), todavía hay una posibilidad razonable de que exista un buen resultado (90%). Entonces no todo está perdido.
    Estos se basan en preferencias aleatorias, por lo que probablemente no representan la correlación de preferencias en grupos, pero sí muestran que las tendencias de desacuerdo sobre lo que debería suceder surgen cuando hay varias opciones en la mesa.

    Bien, están pasando cosas malas, ¿y ahora qué? Bueno, todavía se toma una decisión, entonces, ¿qué está pasando detrás de escena? Bueno, ahora el proceso importa, y sabiendo esto, la gente juega un poco más estratégicamente. Imagine que prefiere un candidato a un tercero en las elecciones presidenciales de EE. UU. A los dos candidatos principales. Adivina qué: tu favorito no va a ganar. Como resultado, la gente podría votar por uno de los principales candidatos para que su voto “cuente” para el ganador. En grupos pequeños con muchas opciones, las personas son aún más estratégicas (creando coaliciones y coludiendo para obtener mejores resultados generales para las partes involucradas). Sin embargo, a veces el sistema de votación se inclina irrevocablemente hacia un resultado u otro (por ejemplo, la presidenta de un comité limita la discusión a los resultados que considera razonables), pero como era inevitable que existiera el sesgo, no podemos culparlo realmente. Una forma “justa” de decidir las cosas es tener una discusión abierta: todo se puede proponer, discutir y votar hasta que la mayoría decida dejar de discutir. Pequeño problema: cuando el conflicto es realmente malo, esto causa un punto muerto importante.

    Una pequeña luz al final del túnel. El teorema de Arrow es bastante miserable desde algunos puntos de vista (y misteriosamente asombroso desde otros), pero hay formas de tomar decisiones razonables y aparecen técnicas más sofisticadas todo el tiempo. Otra forma de pensar sobre la votación es por su valor informativo. Si estamos tratando de decidir cuántos centavos hay en un frasco, es probable que el promedio sea mejor que la mayoría de nuestras suposiciones. Cuanto mejor logremos combinar la información / preferencias que tienen las personas, mejores decisiones podremos tomar (en términos de facilidad, velocidad y tal vez “justicia”; ¡no se garantiza que los resultados reales sean mejores!)

    Gráfico de: “Ganadores de Condorcet y la paradoja de la votación: cálculos de probabilidad para órdenes de preferencia débiles”

    Descargo de responsabilidad: deliberadamente confundo un par de temas: Condorcet no es la única definición de “bueno”, aunque es mi favorito; El teorema de Arrow se ocupa del ordenamiento completo de las preferencias colectivas, mientras que solo considero al ganador; La votación estratégica puede elegir un ganador de Condorcet (pero quería mantener el ejemplo simple).

    Las otras respuestas dan un buen resumen de la comprensión más común del teorema de Arrow. Aunque técnicamente perfectamente cierto, también están equivocados en un aspecto clave.

    La clave es que el teorema de Arrow asume solo sistemas de votación ordinales, donde los votantes pueden clasificar las alternativas. En términos simples, llamo a estos sistemas “comparativos”; un votante puede comparar A y B para decir cuál es mejor, pero no puede dar ninguna información que indique cuánto mejor. Pero desde que Arrow demostró su teorema alrededor de 1950, los teóricos se han dado cuenta de que puede solucionar este problema en particular mediante el uso de sistemas de votación cardinales. Llamo a estos sistemas “evaluativos”, porque solicitan a los votantes algún tipo de evaluación de cada candidato de forma independiente. Por ejemplo, en la votación de aprobación, el sistema de evaluación más simple, simplemente dice si “aprueba” o no a cada candidato y gana el candidato con la mayor cantidad de aprobaciones. Y la votación de aprobación, al igual que otros sistemas evaluativos como el Juicio de mayoría graduada y la Votación de puntaje, pasa fácilmente los cuatro criterios de Arrovian según lo dado por Tanay Jaipuria en su respuesta.

    Ahora, eso no quiere decir que los sistemas de evaluación sean perfectos. De hecho, Arrow descontó conscientemente tales sistemas porque sabía que, incluso si se pide a los votantes que evalúen a cada candidato de forma independiente, pueden y siempre usarán la lógica comparativa por razones estratégicas. Por ejemplo, en la votación de aprobación, si solo hay dos opciones, y ambas son lo suficientemente buenas como para que normalmente las apruebe, probablemente aprobará solo la mejor porque, de lo contrario, es posible que no haya votado. Sin embargo, tan pronto como los votantes piensan comparativamente, se rompe la independencia de las alternativas irrelevantes. Agregue un tercer candidato que odie, y eso podría hacer que apruebe los dos primeros, incluso si resulta que el tercer candidato no habría ganado de todos modos. Este problema de estrategia se demostró que era inevitable poco después de Arrow por Gibbard (y también por Satterthwaite; pero la prueba de Gibbard es, en mi opinión, mucho más limpia y más general). Mostraron que cualquier sistema de votación está sujeto a la estrategia; Siempre hay alguna situación en la que saber cómo votarán los demás te hace cambiar tu voto, incluso si tus preferencias siguen siendo las mismas. Esto es válido incluso si soluciona los problemas con la votación evaluativa al permitir la delegación de votos, como en el sistema recientemente diseñado de votación de aprobación simple opcionalmente delegada (SODA).

    Entonces, sí, al final, sigue siendo cierto que no puede haber un sistema de votación “perfecto”. Y ciertamente todavía hay casos en los que solo hay datos preferenciales disponibles, por lo que el teorema de Arrow sigue siendo relevante. Pero en mi opinión, una lectura fatalista del teorema de Arrow es un gran error. Ningún sistema de votación es perfecto, pero eso no debería cegarnos al hecho de que uno de los peores sistemas (la votación por pluralidad) es el más utilizado.

    Una vista realmente simple del teorema de Arrow (ya que dijiste “términos simples”)

    En cualquier sistema de votación basado en rangos (a diferencia de las clasificaciones) cuando hay más de dos candidatos, es posible que ocurra una paradoja en la que A vence a B, B vence a C y C vence a A.

    Para una perspectiva ligeramente diferente, piense en un sistema de votación como un intento de comunicar fielmente las preferencias de la sociedad a los poderes fácticos. Para tener una fidelidad completa, el sistema de votación debe ser seguro contra lo que llamaremos hackers. Lo que dice el teorema de Arrow es simplemente que ningún sistema de votación es perfectamente seguro; Todos tienen puertas traseras que pueden ser explotadas.

    Lo que el teorema de Arrow no dice es que encontrar estas puertas traseras es computacionalmente fácil. Cuantificar la dificultad de piratear un sistema de votación es un área de investigación muy activa en la intersección de la informática y la economía. El sitio Computational Social Choice tiene consejos para investigar artículos, pero no parece haber más cosas de ciencia pop por ahí.

    Supongamos que a la sociedad se le presentan varias opciones (Romney vs. Obama vs. Hermit the Frog) y desean encontrar un “mecanismo” para expresar sus preferencias como sociedad. Todos están de acuerdo en que la sociedad está de acuerdo en que este mecanismo debe tener algunas características sensibles y deseables:
    1) Debería poder clasificar cualquier opción de cualquier manera.
    2) Si todos prefieren Ermitaño a Obama y Romney, entonces la sociedad prefiere Ermitaño a ambos.
    3) Si la sociedad prefiere Obama a Romney y Romney a Ermitaño, entonces prefiere Obama a Ermitaño.
    4) A nadie se le debe permitir dictar lo que la sociedad prefiere.
    Arrow descubrió que no existe tal mecanismo en general. Esto significa que no importa qué mecanismo uses, siempre puedes cocinar preferencias individuales, de modo que una de las características deseables del mecanismo será violada (eso es lo que hizo Condorcet en su famosa Paradoja). Por lo tanto, ningún sistema de votación es perfecto.
    Eso sí, si solo tiene dos opciones (es decir, Romney vs. Obama), puede evitar esta paradoja utilizando un voto mayoritario simple (Teorema de mayo).
    Hablando en términos prácticos, esto significa que si desea justificar una regla de votación en particular, debe tener claro cuál de los axiomas no se aplica. El Desideratum 1) es muy común para relajarse al suponer que los votantes solo pueden clasificar a los candidatos de acuerdo con un espectro político común (que se conoce como preferencias de un solo pico).

    En términos de importancia práctica, una lección es que ser capaz de controlar la agenda y el orden en que se votan los elementos (así como su estructura y redacción) sigue siendo un elemento subestimado en los juegos de poder.

    Significa que uno podría ser un poco ambivalente al aceptar la idea de que un voto mayoritario por algo crea legitimidad, y más abierto al valor de insistir en el consenso, o al menos a la súper mayoría, si no lleva la decisión a un nivel que no depende del acuerdo sobre la acción colectiva.

    Significa que las personas que se consideran racionales y objetivas tienen que dar explicaciones cuando hablan de “la sociedad ha decidido esto y la sociedad ha decidido eso”. (¡Para los hegelianos, el asunto puede ser diferente!)

    No he leído todas las respuestas, pero me parece interesante notar que, básicamente, Arrow dice que ningún sistema de votación es perfecto para llegar a una preferencia grupal. No deberíamos sorprendernos por esto.

    Cada sistema de votación tiene un lugar y tiene un propósito. Ninguno de ellos está libre de la multitud de cosas que presionan decisiones reales y complejas, incluidas cosas que no están relacionadas con las elecciones mismas; dinámica de grupo y relaciones, cuánto le importa en ese momento la decisión en sí, etc. Lo importante es utilizar un sistema de votación que mejor se adapte a las circunstancias y darse cuenta de que los resultados serán simplemente un reflejo agregado de muchas preferencias, combinado con diferentes grados de importancia que brindan una decisión para ese punto en el tiempo, y es lo mejor que puede hacer a menos que desee ceder el control por completo a un solo autócrata. Decide mañana lo mismo otra vez y es probable que obtengas un resultado diferente.

    Arrow demostró lo que todos sabemos intuitivamente.

    Significa que votar no puede resolver ninguna disputa, pero John S. Mill tiene un argumento más fuerte, que dice que “votar es tiranía por mayoría”.