¿Dónde / cómo puedo comprar datos históricos de Twitter para investigación académica?

Hola,

Compré datos en el pasado de GNIP (https://gnip.com/), que creo que ahora es el único revendedor de datos autorizado para Twitter. Proporcionan acceso a transmisiones en vivo (abre una transmisión y comienza a recopilar datos a partir de ese momento) o datos históricos (desde el comienzo de los tiempos de Twitter).

Sé que dijiste datos históricos, pero si eso no es obligatorio y si tienes habilidades de programación o tienes un desarrollador en tu equipo que pueda echar una mano, puedes usar la API pública de Twitter (transmisiones en vivo, sin datos históricos) o buscar API (va 30 días en el pasado). Ambos devuelven una muestra de datos si realiza una consulta que tiene un volumen muy grande de tweets (+ 1% del volumen global de Twitter, según la última vez que lo verifiqué). Pero en la mayoría de los casos esto no será un problema.

Un enfoque más ‘sucio’ sería desarrollar un raspador usando la página de búsqueda … pero eso podría ser complejo y no demasiado agradable con las políticas de Twitter.

Espero que esto ayude.

¿Has revisado la base de datos de Twitter en Quandl? La base de datos cubre estadísticas de Twitter para 100,000 empresas. Ver TWITTER | Twitter Inc. | Quandl

[Divulgación: trabajo para Quandl]

Puede generar presupuestos gratuitos de autoservicio utilizando Sifter. Hay un video “Sifter Explicado” y hay preguntas frecuentes sobre Sifter.

Sifter proporciona acceso a todos los Tweet no eliminados en la historia utilizando el Gnip historical PowerTrack 2.0.