¿Por qué algunos matemáticos con una habilidad inmensa terminan sin hacer descubrimientos significativos?

Si se inclina más hacia las explicaciones de meta-nivel, podría ser útil considerar una versión más generalizada de su pregunta: para resultados de interés con predictores bastante buenos (por ejemplo, la habilidad matemática como predictor de hacer “descubrimientos significativos”), ¿por qué son extremos? ¿Los valores atípicos de un predictor dado (‘fuera de la cola de la distribución’) rara vez son valores extremos similares en el resultado que predice?

Por ejemplo, la altura se correlaciona con el rendimiento en el baloncesto (la altura promedio en la NBA es de alrededor de 6’7 “), pero hay muchos miles de hombres estadounidenses más altos que el jugador promedio de la NBA, pero no están en la NBA. Más rápido sirve en el tenis mejora la probabilidad de ganar, pero si observa a los jugadores que sirven los servicios más rápidos jamás registrados, no son los mejores jugadores de su tiempo.

Entonces, ¿por qué, en otras palabras, las colas se separan?

Considere el siguiente diagrama de dispersión de dos variables correlacionadas que obtuve de Google:

No es sorprendente ver que el tiempo de estudio está correlacionado con las calificaciones de los exámenes. Pero mire el extremo del gráfico: los estudiantes que estudiaron más no fueron los que obtuvieron las calificaciones más altas, y viceversa.

Este es un fenómeno general. Aquí hay otro diagrama de dispersión.

Y otro.

¿Ves el patrón? Dada una correlación, la envolvente de la distribución debería formar algún tipo de elipse , más estrecha a medida que la correlación se fortalece y más circular a medida que se debilita:

La cuestión es que, a medida que uno se acerca a las esquinas lejanas de esta elipse, vemos ‘divergencia de las colas’: como la elipse no se agudiza a un punto, hay protuberancias donde los valores máximos x e y se encuentran con y submáxima yx valores respectivamente:

Esto explica por qué la divergencia de las colas es un fenómeno omnipresente: siempre que el tamaño de la muestra sea grande y la correlación no sea demasiado apretada (cuanto más estrecha sea la correlación, mayor será el tamaño de la muestra requerida), se observarán las elipses con los lados abultados de la muestra. distribución.

Puede empeorar. A veces no es solo que las colas dejan de estar correlacionadas, es que puede haber una correlación negativa espuria. En cualquiera de sus diagramas de dispersión, podría cortar la esquina superior derecha (con una línea diagonal que corre hacia abajo a la derecha), y lo que quedaba por encima de la línea se vería como una correlación negativa. Esto a veces se conoce como la paradoja de Berkson. Un ejemplo que he escuchado son los puntajes SAT. En cualquier escuela, los puntajes matemáticos y verbales están correlacionados negativamente, porque las escuelas tienden a seleccionar personas que tienen aproximadamente el mismo puntaje total. Pero en general, los puntajes matemáticos y verbales están positivamente correlacionados.

La razón de que el hecho de que una correlación sea menor que 1 implica que otras cosas son importantes para un resultado de interés. Aunque ser alto es importante para ser bueno en el baloncesto, la fuerza, la agilidad y la coordinación mano-ojo también son importantes (por nombrar solo algunos). Lo mismo se aplica a otros resultados en los que múltiples factores juegan un papel: ser inteligente ayuda a hacerse rico, pero también lo es ser trabajador, tener suerte, etc.

En otras palabras, no es que el más fuerte no pueda ser también el más alto (etc.), sino que alguien que tiene esa suerte dos veces más o menos nunca sucede. Y si necesita múltiples factores para ser bueno en algo, es más probable que tenga mucha suerte en varios factores que tener mucha suerte en uno y bastante suerte en el resto. Simplemente multiplica las probabilidades para factores (relativamente) independientes.


Tal vez la explicación a nivel meta anterior no era realmente tu taza de té. Así que aquí hay un argumento a nivel de objeto dado por Terry Tao en cuanto a la relación entre la habilidad nativa y el éxito en la investigación (énfasis todo mío):

Si se considera una población de jóvenes matemáticos prometedores (por ejemplo, una clase de doctorado entrante en un departamento de matemática de élite), casi todos tendrán un nivel razonable de inteligencia, y algunos subconjuntos tendrán niveles de inteligencia particularmente excepcionales. Una fracción significativa de ambos grupos se convertirá en matemáticos profesionales de cierto nivel de logro decente, con la fracción probable (pero no necesariamente) de ser un poco más alta cuando se restringe al grupo con inteligencia excepcional. Pero si uno tratara de usar “niveles excepcionales de inteligencia” como un predictor de qué miembros de la población llegarían a ser matemáticos excepcionalmente exitosos y productivos, creo que este es un predictor extremadamente pobre, con la correlación empírica siendo bajo o incluso negativo (véase la paradoja de Berkson).

Admitiría que si uno tomara a un matemático determinado y de alguna manera aumentara su nivel de inteligencia a niveles extraordinarios, manteniendo todos los otros rasgos (por ejemplo, madurez, ética de trabajo, hábitos de estudio, persistencia, nivel de rigor y organización, amplitud y amplitud). retención de conocimiento, habilidades sociales, etc.) sin cambios, entonces esto probablemente tendría un efecto positivo en su capacidad para ser un matemático extraordinariamente productivo.

Sin embargo, empíricamente se encuentra que los matemáticos que no exhibieron niveles precoces de inteligencia en su juventud probablemente sean más fuertes en otras áreas que a menudo resultarán más decisivas a largo plazo , al menos cuando se restringe a poblaciones que tienen ya alcanzó cierto nivel de logro matemático (por ejemplo, admisión a un programa de doctorado en matemáticas de primer nivel).

Por ejemplo, muchos problemas difíciles en matemática requieren un enfoque lento y paciente en el que uno digiere metódicamente todas las técnicas existentes en la literatura y aplica varias combinaciones de ellas a su vez al problema, hasta que se obtiene una comprensión lo suficientemente profunda de la situación. puede aislar la obstrucción clave que debe superarse y la nueva visión clave que, junto con una combinación adecuada de métodos existentes, resolverá el problema. Un matemático que está acostumbrado a usar sus altos niveles de inteligencia para encontrar rápidamente soluciones originales a los problemas puede no tener la paciencia y la resistencia para un enfoque tan sistemático y, en cambio, puede gastar una gran cantidad de energía de manera ineficiente para crear ideas creativas pero inapropiadas. enfoques del problema, sin el beneficio de ser guiados por la sabiduría convencional acumulada obtenida de comprender completamente los enfoques anteriores del problema.

Por supuesto, la situación inversa también puede ocurrir, en la que un matemático inusualmente inteligente se le ocurre un enfoque viable omitido por todas las personas más metódicas que trabajan en el problema, pero en mi experiencia este escenario es más raro de lo que a veces suponen los observadores externos, aunque ciertamente puede ser una historia más interesante para contar.

Tao hace algunos buenos puntos, pero la esencia de su argumento es básicamente lo que he estado diciendo anteriormente: la habilidad nativa está positivamente pero no perfectamente correlacionada con el éxito en la investigación, por lo que las colas divergen; otros factores relativamente independientes como la ética del trabajo y la conciencia juegan un papel importante.