¿Por qué los estudios de investigación necesitan ser replicados para verificación?

Respuesta # 1: estadísticas. Cada medición tiene incertidumbre asociada, por lo que incluso si uno ha hecho un buen trabajo y realmente ha identificado algo que es estadísticamente significativo, establecido arbitrariamente en un 95% de confianza, el 5% de los estudios producirá señales falsas. Pero esa es la parte fácil. Si uno está tratando de identificar un evento relativamente raro y hay ruido en la señal, mientras que uno puede estar formalmente en este nivel, a menudo es probable que el resultado sea inexacto debido a la tasa de falsos positivos / negativos . Por supuesto, este tipo de resultados son los que hacen carreras académicas y son relevantes en la investigación médica.

Respuesta # 2: control. Si bien casi todos los científicos entienden la necesidad de un estudio de control, no hay forma de controlar realmente todos los parámetros del universo. Hacemos nuestro mejor esfuerzo, pero sin una caracterización perfecta de ambos entornos y el diseño de un experimento para explorar estadísticamente todas las diferencias, el control solo puede considerarse aproximado.

Descargo de responsabilidad: no es un estadístico, así que tome los siguientes pensamientos como los de un lector de ciencia sillón:

Las réplicas son extremadamente importantes debido a la influencia de los grados de libertad de los investigadores: “Grados de libertad de los investigadores”: modelado estadístico, inferencia causal y ciencias sociales

Cada vez que se mira un estudio que presenta una correlación estadísticamente significativa, se debe considerar el número de posibles correlaciones que los autores consideraron. A menudo esto se revela, y en buenos estudios incluso se tiene en cuenta. Sin embargo, incluso en los mejores estudios de ejecución, es muy difícil eliminar todas las fuentes de sesgo involuntario.

Como señala el cómic xkcd publicado por Madalyn, incluso entre un conjunto suficientemente grande de estudios perfectamente ejecutados, es probable que algunos, por casualidad, encuentren un resultado estadísticamente significativo.

También hay estudios que son esencialmente “expediciones de pesca” que extraen un conjunto de datos para encontrar correlaciones. Estos estudios son realmente útiles para motivar la investigación futura, pero no se pueden sacar conclusiones concluyentes de sus resultados, ya que por casualidad es probable que encuentren una correlación estadísticamente significativa en algunos pares de variables. Para este tipo de estudios, es especialmente importante realizar réplicas utilizando datos nuevos para verificar individualmente correlaciones específicas.

A menudo, el hecho de que un estudio fuera una expedición de pesca no es inmediatamente obvio cuando, por ejemplo, una variable se discretiza utilizando umbrales seleccionados / ajustados por los investigadores durante el curso de su análisis. Cuando uno diseña un estudio de manera prospectiva (es decir, al decidir exactamente cómo se analizarán los datos antes de verlos realmente), los resultados son mucho más confiables. Más información: estudios retrospectivos vs. prospectivos

En biología, el nivel estándar de significancia es (algo arbitrariamente) p <0.05. Un valor p de, digamos, .049 significa que incluso si el diseño del experimento es perfecto y la ejecución perfecta, las probabilidades son 1 en 20 de que la desviación de los datos del modelo nulo se debe al azar . O más simplemente, pero con menos precisión, el resultado tiene un 5% de posibilidades de ser falso. Idealmente, entonces, necesitamos replicar incluso experimentos perfectos por si acaso. Y los experimentos perfectos son tan comunes como las lágrimas de unicornio.

TL; DR: Necesitamos replicar experimentos para no concluir que las gominolas verdes causan acné.

xkcd: significativo, por Randall Munroe

Para verificar la fiabilidad.

A menos que su estudio abarque a toda la población objetivo (que es prácticamente imposible), es importante verificar si los resultados que arrojó su estudio no son solo la variabilidad del muestreo. Por lo tanto, es importante replicar los estudios con múltiples muestras representativas para garantizar que cada vez se obtengan resultados similares.

Si solo puede hacer algo una vez, entonces es probable que haya tenido mucha suerte. Reproducibilidad = fiabilidad. Aunque no hay garantía de que esto sea perfecto, se acerca.

Los humanos son imperfectos. La ciencia tiene un ideal de que todas las variables están controladas, excepto la que se está probando. En realidad, esto es extraordinariamente difícil de hacer. Algunas de las variables son difíciles de resolver. Al hacer que diferentes grupos repitan la prueba, algunas de las variables no controladas son diferentes. Cuando considera todos los datos de diferentes grupos, puede ver si están de acuerdo o si son diferentes. Si están de acuerdo, esto proporciona más evidencia para la hipótesis. Si difieren, esto sugiere nuevas vías a considerar para determinar por qué algunos experimentos tuvieron resultados diferentes.

De cualquier manera, ¡la ciencia funciona!

More Interesting

Si Nikola Tesla estuviera vivo hoy, ¿en qué estaría trabajando?

Cómo participar en un grupo de investigación como estudiante universitario

En un laboratorio, ¿cuáles son las funciones de los matraces cónicos?

¿Por qué un experimento científico que refuta una hipótesis también es útil?

Empecé a trabajar para obtener mi doctorado en CS recientemente y mi problema de investigación es bastante popular. Hay muchas empresas corporativas y organizaciones de investigación que intentan encontrar una solución de vanguardia para este problema. ¿Debería estar preocupado por esto?

¿Cómo encuentro una manera fácil de crear un marco teórico para mi investigación experimental?

Cómo ver su investigación sobre lo más lejos que un ser humano podría viajar teóricamente de la Tierra utilizando estimaciones agresivas y teniendo en cuenta la dilatación del tiempo

¿Los términos 'ectomorfo', 'mesomorfo' y 'endomorfo' son aceptados y utilizados por la comunidad científica?

¿La investigación astronómica generalmente está bien financiada? Si es así, ¿por qué?

¿Existe una neurociencia computacional puramente teórica?

¿Por qué las ratas son los principales animales de prueba para estudios de productos y comportamiento?

¿Cómo afectó en última instancia la recesión económica de 2008 a la producción científica (como los artículos publicados)?

¿Cuáles son los factores más importantes para producir una gran investigación?

¿Cuáles son las ventajas de usar un cultivo en portaobjetos para la identificación de hongos sobre un cultivo en placa?

¿La eugenesia y el sacrificio humano, la ciencia o el asesinato, o ambos?