No, por muchas razones: 1) Los documentos siguen siendo generalmente inaccesibles para las solicitudes automatizadas. Pubmed solo proporcionará título y resumen. Google Scholar te bloqueará en un segundo caliente.
2) incluso si los recopila de alguna manera (probablemente no del todo legal) son archivos PDF, un formato que fue inventado para replicar fielmente la visualización, y a pesar de ser analizable por las computadoras, es bastante horrible cuando se usa para la extracción automática de texto e imágenes.
3) Los documentos son, en general, horriblemente escritos y apenas legibles por un científico humano. Nada es consistente Los métodos son muy variados en formato, incluso si se completan de forma remota (lo cual es muy raro) Los datos están incompletos o faltan o están ocultos con fines visuales (un gráfico de barras con barras de error en quién sabe qué unidades y sin acceso a los datos subyacentes) imágenes con múltiples canales nuevamente oscurecidos por el formato extraño y buena suerte extrayendo exactamente en qué se encuentra cada canal de los métodos incompletos.
- Cómo hacer que mi verano sea útil en Londres
- Hablar en público: en una presentación de 10 minutos de un artículo científico, ¿cuánto tiempo debo presentar una sola diapositiva de PowerPoint para que la audiencia se mantenga enfocada e interesada?
- ¿Cuáles son las áreas de investigación en finanzas?
- ¿Cómo afecta la reciente 'fiesta cubesat' entre la comunidad satélite y los círculos académicos a la situación de los desechos espaciales?
- ¿Qué es el santo grial de la ciencia abierta?
4) Si ha sobrevivido, todo lo que llegamos ahora debería ser la parte divertida: algún tipo de procesamiento del lenguaje natural para extraer información útil. Este es un proyecto en el que muchas personas están trabajando (ver BioC) y no está resuelto, pero al menos es posible.
El sistema de publicación científica es una reliquia, no hay estándares y el PDF es un pequeño paso adelante de estar sentado junto al fuego leyendo su copia de la Lanceta que acaba de entregar a caballo. A medida que avanza la ciencia y aumenta la cantidad de datos, tendremos que avanzar hacia sistemas que sean tanto visibles para humanos como para ser interpretados por máquinas, pero en este momento, aunque se discute mucho, no está sucediendo.