¿Cuáles son algunos hallazgos que hemos descubierto debido a Big Data?

Creo que cualquier respuesta a esta pregunta solo será parcial debido a las numerosas aplicaciones de minería de datos y big data. Estos, por supuesto, varían desde la detección de fraudes y el comercio electrónico, juegos y servicios financieros, así como aplicaciones científicas como el análisis de imágenes de rayos X y el modelado del comportamiento de los genes.

Sin embargo, puede leer sobre algunos hallazgos importantes en 9 Bizarre and Surprising Insights de Data Science. Estos incluyen pepitas como “Los usuarios de los navegadores Chrome y Firefox son mejores empleados” y que “los huracanes con nombres femeninos son más mortales”.

Más en serio, para tomar algunos ejemplos en dos áreas donde Big Data ha producido resultados:

  1. Medicina: surfeando la ola de análisis de big data | Novartis documenta el uso de big data para resolver una enfermedad renal descrita, mientras que la forma en que big data puede revolucionar la I + D farmacéutica es una preocupación relacionada.
  2. Finanzas: donde se utilizan nuevos modelos y big data para comprender mejor el riesgo financiero, y SAPVoice: cómo Big Data mejora las operaciones financieras.

Podría continuar, pero en realidad hay demasiados hallazgos, o hallazgos potenciales, en demasiadas áreas para discutir sucintamente.

Lamentablemente estoy bajo NDA. Pero mi experiencia me dice que algunas de las cosas más importantes que muestra el análisis es cuán cerca o mucha más gente está del uso de información experta. Entonces, a veces, la gran recompensa se muestra gráficamente para mostrarle a la gente lo que, por ejemplo, los pilotos de las aerolíneas saben sobre el uso de combustible en aviones jumbo. O comunique la mejor y más rápida forma de colocar colillas en los asientos de los vuelos. O cuál es la enfermedad más común entre las tripulaciones de vuelo. O exactamente cuánto duermen las tripulaciones dependiendo de sus horarios.

Lo que hacen estos datos es informar y corregir las políticas y mostrar si las políticas vigentes son realmente razonables o si las quejas en su contra son razonables, o cuál es el efecto de cómo y por qué las personas eluden las reglas, o cuánto margen de error existe en el cumplimiento.

Una de las primeras cosas que aprendí fue cómo cierta empresa de comida rápida aprendió que no tiene sentido para los empleados del personal durante turnos de 8 horas decir de 8 a 5 con un almuerzo de una hora. Pero hasta que descubrieron exactamente cuántas comidas servían y a qué horas no podían cambiar los horarios. Resultó que los empleados estaban frenéticos a las 7:45 cuando llegaron y aburridos a las 10:30 cuando nadie se presenta. Así que cambiaron la dotación de personal para que las personas trabajaran 6-10, luego cambiaron los turnos a las 10 y luego hicieron que la gente trabajara de 10 a 2 y luego de 2 a 6 y luego de 6 a 10. Entonces, el personal que trabajaba turnos de 4 o 5 horas fue mucho más productivo y feliz.

He hablado con algunas personas sobre datos municipales. La logística básica que las empresas de transporte han estado utilizando durante años todavía no se ha implementado en el barrido de calles. Entonces, en este momento, ningún metro importante puede predecir cuándo los barrenderos realmente ejecutarán sus rutas. Por lo tanto, hay ventanas de 4 horas cuando las personas tienen prohibido estacionarse en las calles. No hay ninguna razón por la cual, con parquímetros y letreros inteligentes, eso no podría reducirse a una ventana de 1 hora. Eso resultaría en un 75% más de disponibilidad de estacionamiento en esos días.

Uno de los mayores cambios que creo que todos conocen es la forma en que se tiene en cuenta el entretenimiento (películas y programas de televisión). Básicamente, Hollywood descubrió, hace unos 15 años, cómo vender estas propiedades no solo por primera vez, sino también como activos sindicados. Por lo tanto, mirar los datos a pedido ha cambiado lo que las repeticiones son y no están disponibles. Marvel y Netflix son dos compañías innovadoras que han cambiado fundamentalmente el negocio de contabilidad de películas. Esa es una de las razones por las que ahora puedes ver toda una temporada de shows a la vez, lo que era impensable hace solo 10 años.

Creo que también es bastante obvio que las compañías de videojuegos han descubierto lo que hacen sus jugadores minuto a minuto. Eso ha cambiado la forma en que se diseñan los juegos y qué incentivos están alrededor de los juegos en general.

Mientras hablamos, Amazon está trabajando en formas de cambiar las formas en que las personas pueden surtir sus recetas médicas. Hoy, nadie piensa que CVS está en la era espacial. Si alguna vez ha intentado recoger un inhalador para el asma durante el fin de semana cuando su médico está ausente, sabe lo estúpidos que deben ser sus sistemas. No hay absolutamente ninguna razón por la cual hoy en día no haya un sistema seguro para que su médico pueda hacer clic en un botón de su teléfono para aprobar su receta en 2 minutos, más fácil que responder a un mensaje de texto.

La conclusión es que se sorprendería de cuánto se determina la forma en que trabajan las personas al adivinar y hacer las cosas de la manera en que siempre se han hecho. Vamos a arreglar todo eso.

Que lo que sabemos es tan poco como una gota de agua y lo desconocido, un océano.

Los datos estructurados en forma de bases de datos SQL se consideraron a prueba de fallas y la gente comenzó a jurar creyendo que esta era la forma de avanzar en términos de almacenamiento de datos.

En general, para descubrir algo fuera de los datos, debe analizarlo mediante un análisis exploratorio de datos utilizando un excelente Excel anterior para los marcos más capaces en R / Python. Este proceso iba bien hasta que llegó un punto en el que los datos tienen más dimensiones y variables que los métodos tradicionales no podían descifrar / leer.

Esta fue la principal motivación para reconsiderar las metodologías tradicionales para almacenar y recuperar datos y, a través de eso, vino en el entorno Hadoop-hdfs que se parecía a una estructura de archivo plano que es completamente diferente al diseño de base de datos estructurada. Aunque se han realizado muchos descubrimientos al poder analizar grandes datos y actualmente se están llevando a cabo. Al darme cuenta de las deficiencias del sistema de arquitectura de almacenamiento de datos existente, creo que es el hallazgo más importante que hemos hecho debido a Big Data.

“Los analfabetos del siglo XXI no serán aquellos que no pueden leer y escribir, sino aquellos que no pueden aprender, desaprender y volver a aprender”. – Alvin Toffler

El Instituto de Medición y Evaluación de la Salud (IHME) en Seattle se especializa en investigación de salud utilizando grandes datos. Puede leer el libro Epic Measures para obtener más información, que es una biografía sobre el fundador de IHME, Chris Murray.

Consulte sus Visualizaciones de datos para obtener más información sobre los tipos de proyectos que han realizado.

A2A.

Depende de lo que uno entienda como ‘datos de papá grande’ cuando piense en los resultados. Esta pequeña mirada parece fusionarse con la obtenida por la ciencia real y por las cosas sospechosas de la nube fangosa.

Pero, no pude evitar este pequeño mensaje, quizás, a la policía gramatical. De los 10 hallazgos de datos más extraños que necesita saber por CNBC. Pero, probablemente lo sabíamos antes de mirar los números.

Oh Dios, usé dos ‘peros’ (¿mental?).