23andMe (compañía): ¿Qué pueden construir los desarrolladores sobre nuestros datos genéticos?

La primera versión básica de la API solo permite el acceso a una lista de ubicaciones específicas del genoma (identificadas por rsids), y cada una de ellas debe tener un alcance por separado al solicitar el token OAuth, por lo tanto, el desarrollador debe identificar todos los SNP que desea obtener acceso antes de solicitar la autorización del usuario. No se establece un límite explícito para el número de rsids que se pueden determinar, por lo que no está claro qué sucede si solicita acceso a miles de ellos. Además, los datos recuperados no se pueden almacenar en caché más allá del límite de tiempo impuesto por la API, que esperaría que fuera bastante corto.

Las restricciones anteriores sugieren posibilidades para varias clases amplias de aplicaciones:

  • Arte / música / juegos / etc. personalizados, en los que algún aspecto del producto final o la experiencia se personaliza algorítmicamente utilizando un subconjunto de SNP del usuario (similar al laboratorio de música de 23andMe [1]).
  • Análisis alternativo de riesgos para la salud: condiciones sobre las que 23andMe no informa, SNP adicionales que no incluyen por varias razones, etc. (similar a Promethease [2]).
  • Replicación de GWAS: alguien con una gran base de datos de fenotipos podría intentar recopilar un conjunto de genotipos de usuarios de 23andMe en un esfuerzo por replicar una asociación informada, pero la magnitud de esta empresa (que necesita miles, si no decenas de miles, genotipos; datos de población , etc.) probablemente haría de esto un esfuerzo prohibitivo.

Una pregunta interesante es si alguna de estas ejecuciones entraría en conflicto con los 23andMe API TOS que establecen “No utilizará las API en una aplicación que compita con los productos o servicios ofrecidos por nosotros”. Todavía no está claro si se toman en serio la aplicación de esto, o si se trata de una jerga puramente defensiva.

Esto deja de lado muchas otras ideas más interesantes que requieren acceder y / o almacenar en caché el genoma completo. Pero hay que comenzar en alguna parte, y tiene sentido que el primer paso sea cauteloso. ¡Veremos que pasa!

[1] http://spittoon.23andme.com/ance…
[2] http://snpedia.com/index.php/Pro…

Desarrollé un ejemplo llamado OSGenome que raspa SNPedia y crea una cuadrícula de datos adicionales que responde en 2D. Se puede encontrar en http://www.github.com/mentatpsi/OSGenome . Utiliza Python, Flask y BeautifulSoup para el raspado. Se basa en el volcado de datos csv de todos sus datos SNP. Es completamente privado y se ejecuta en su computadora.