¿Qué empresas están generando los conjuntos de datos más interesantes?

Pocos lo sé
Nuevos
1. Enigma.io Enigma.io
2. Futuro registrado Futuro registrado: software de inteligencia web para decisiones comerciales
3. Rapleaf: datos en tiempo real en el 80% de los correos electrónicos de EE. UU.
4. Factual Home: la plataforma de ubicación que permite la personalización móvil
5. Dirigible urbano Dirigible urbano
6. Quid (tienen algunos datos de financiación de tecnología) Quid, Inc.
7. Crunchbase: CrunchBase, la base de datos de The Free Tech Company

Tradicional
1. Página LexisNexis en www.
2. Transunion Informe de crédito, puntajes de crédito y verificaciones de crédito
3. Informe de crédito y puntaje de crédito Experian con soporte gratuito de Experian
4. Inicio de FICO – FICO
5. Dunn y Bradsheet D&B | Información comercial | Obtenga informes de crédito | 888 480-6007
6. Marshal y Swift El edificio le cuesta a la gente
7. Calidad de datos de contacto de Melissa Data – Verificación de dirección internacional

Creo que hay compañías de telefonía móvil que están generando los datos más interesantes. Los datos que provienen de la red de telefonía móvil también llamados Registros de descripción de llamadas son simplemente increíbles.

Hay muchos artículos científicos que proporcionan ejemplos de aplicaciones que utilizan datos CDR para resolver una gran cantidad de problemas en la planificación urbana, la gestión del tráfico y las aplicaciones de viajes compartidos, la detección de eventos en el entorno urbano, la propagación de enfermedades infecciosas en el tiempo y el espacio, el uso de la tierra y las actividades sociales. problemas, etc.

Aquí una colección de esos documentos presentados durante la última conferencia de NetMob en EE. UU. NetMob 2015, 8-10 de abril de 2015, MIT Media Lab

También el programa de desafío de datos D4D (Desarrollo de datos 4) o Orange, el operador francés, está demostrando ser un buen generador de ideas. Aquí el desafío basado en CDR de Senegal El segundo desafío de datos de telefonía móvil para el desarrollo

y datos de Cote d’Ivore para el desarrollo

A continuación, enumeraría los datos generados por el sector bancario y financiero.

Pero el problema es que en ambos casos, CDR y datos bancarios, es bastante difícil para esas compañías divulgar los datos y cosechar el poder del crowdsourcing (excepción hecha hasta ahora para Orange). Este tipo de datos es personal y puede dañar la privacidad si se divulga.

Incluso los datos anonimizados están sujetos a una reidentificación, como muestra el artículo a continuación: Reidentificación y fusión de información entre CDR anonimizados y datos de redes sociales

Los principales motores de búsqueda, las redes sociales, las empresas de infraestructura y las compañías de telefonía celular, todas ellas tienen bases de datos con datos únicos.

Microsoft tiene muchos datos sobre el software instalado en todo el mundo y el comportamiento de los usuarios.

Google es un agregador de datos de páginas web, datos de correo electrónico, uso de Android, redes publicitarias, uso del navegador, etc.

Los principales proveedores de red tienen muchos datos sobre infraestructura de Internet, dispositivos conectados y tráfico.

Las redes sociales (como Twitter y Facebook) tienen datos sobre la actividad de información de las personas, fotos, videos, textos y mensajes.

¡Interesante pregunta! Quandl acaba de publicar una publicación de blog esta semana sobre datos alternativos y dignos de ventaja. En la publicación, enumeramos bases de datos interesantes y compañías prometedoras que proporcionan nuevos tipos de datos de diversas fuentes para diferentes industrias, como:

  1. Datos de nanosaatélites para el clima o la industria marítima: los proveedores prometedores incluyen: Spire, Windward
  2. Imágenes de drones: los proveedores prometedores incluyen: Airware
  3. Internet de las cosas: los proveedores prometedores incluyen: Samsara

Para ver la lista completa, échale un vistazo aquí: Las generaciones cambiantes de datos financieros – Quandl Resource Hub

[Divulgación: trabajo para Quandl]

La nueva empresa de análisis con sede en India, Modak, ha creado un conjunto de datos electorales de la democracia más grande del mundo. Ha recopilado datos sobre 815 millones de votantes en la India.

Modak Analytics crea un repositorio de Big Data de datos electorales

Página en modakanalytics.com

Feliz de responder esto.

Nosotros, en PromptCloud, como una compañía de soluciones de datos especializada en la extracción de datos web personalizados y recurrentes para empresas, manejamos un volumen de datos muy alto (lee millones de registros a diario).

Han pasado cerca de siete años desde que hemos estado en el negocio y hemos generado miles de conjuntos de datos en este período de tiempo. Regularmente contribuimos conjuntos de datos en Kaggle y data.world.

Además de nuestra solución personalizada en la que creamos fuentes de datos que requieren rastreos recurrentes a una frecuencia predefinida, también tenemos una solución llamada DataStock: es una solución ideal para las personas que buscan conjuntos de datos completos, limpios y listos para usar. de una amplia gama de industrias.

kimono: Convierta los sitios web en API estructuradas desde su navegador en segundos. (Kimono Labs). Es asombroso. Extractor visual de datos web, pero también un directorio de sitios web que se han mapeado como API para que pueda integrar extracciones de datos o descargar CSV.

Survata.com le permite recopilar cualquier conjunto de datos de consumidor personalizado. Tenemos clientes que recopilan información fascinante.
(Divulgación: soy un fundador)

More Interesting

Cómo encontrar oportunidades de investigación

¿Cuáles son mis opciones si mi manuscrito de investigación es rechazado en base a suposiciones incorrectas?

¿Las empresas tecnológicas como Google tienen investigaciones para empleados o estudiantes? En caso afirmativo, ¿en qué se diferencia la investigación en esas empresas de la investigación en universidades como el MIT?

Cómo escribir un POE de investigación

¿Qué son las publicaciones de investigación universitaria?

¿Tener un buen acento es importante para ser profesor?

¿Por qué la gente dice que la adolescencia termina a los 18 años cuando no es así porque la investigación dice que la adolescencia termina a los 25 y usted todavía es un adolescente a los 18?

Cómo encontrar el valor de los artículos antiguos y antiguos.

Parece que la investigación industrial está disminuyendo en SV. ¿Cuál es su opinión sobre esto y cómo podemos tener un modelo de investigación exitoso?

¿Qué opina de que Chitraang Murdia abandone el IIT-B para realizar una investigación? ¿Estás de acuerdo con la gente que dice que ha desperdiciado un asiento IIT?

¿Qué empresas están generando los conjuntos de datos más interesantes?

¿Los métodos de investigación cualitativa se están volviendo más cuantitativos de una manera que hace obsoleto un enfoque cualitativo purista? ¿O los datos cualitativos permanecen incalculables?

¿Encontraremos a través de la investigación que la adicción a las drogas / alcohol, etc. está basada genéticamente, no solo basada en la fuerza de voluntad?

¿Qué es una nueva investigación en ingeniería mecánica?

¿De qué manera la investigación sobre las relaciones de menage a trois es beneficiosa para mí y para el mundo?