¿Podemos transferir ciertos datos a través del ADN?

Los científicos han utilizado con éxito el ADN para almacenar y recuperar imágenes.

Los investigadores han desarrollado uno de los primeros sistemas completos para almacenar datos digitales en el ADN, lo que permite a las empresas almacenar datos que hoy llenarían un gran supercentro de una gran caja en un espacio del tamaño de un terrón de azúcar.

Todas las películas, imágenes, correos electrónicos y otros datos digitales de más de 600 teléfonos inteligentes básicos (10,000 gigabytes) se pueden almacenar en la tenue mancha rosada de ADN al final de este tubo de ensayo.

Crédito de la foto: Tara Brown Photography / Universidad de Washington

Las compañías de tecnología construyen habitualmente centros de datos para almacenar todas las fotos de bebés, transacciones financieras, videos divertidos de gatos y mensajes de correo electrónico que sus usuarios acumulan.

Pero una nueva técnica desarrollada por los investigadores de la Universidad de Washington y Microsoft podría reducir el espacio necesario para almacenar datos digitales que hoy llenarían un súper centro de Walmart hasta el tamaño de un terrón de azúcar.

El equipo de científicos informáticos e ingenieros eléctricos ha detallado uno de los primeros sistemas completos para codificar, almacenar y recuperar datos digitales utilizando moléculas de ADN , que pueden almacenar información millones de veces más compacta que las tecnologías de archivo actuales.

En un experimento descrito en un documento presentado en abril en la Conferencia Internacional de ACM sobre Soporte Arquitectónico para Lenguajes de Programación y Sistemas Operativos, el equipo codificó con éxito datos digitales de cuatro archivos de imagen en las secuencias de nucleótidos de fragmentos de ADN sintético.
Más significativamente, también pudieron revertir ese proceso: recuperaron las secuencias correctas de un conjunto más grande de ADN y reconstruyeron las imágenes sin perder un solo byte de información.
El equipo también ha codificado y recuperado datos que autentican archivos de video de archivo de las voces de la UW del proyecto del Tribunal de Ruanda que contienen entrevistas con jueces, abogados y otro personal del tribunal de crímenes de guerra de Ruanda.

“La vida ha producido esta fantástica molécula llamada ADN que almacena eficientemente todo tipo de información sobre sus genes y cómo funciona un sistema vivo: es muy, muy compacto y muy duradero”, dijo el coautor Luis Ceze, profesor asociado de informática de la Universidad de Washington y Ingenieria.

“Básicamente lo estamos reutilizando para almacenar datos digitales ( fotos, videos, documentos ) de manera manejable durante cientos o miles de años”.

Se espera que el universo digital, todos los datos contenidos en nuestros archivos de computadora, archivos históricos, películas, colecciones de fotos y el volumen explosivo de información digital recopilada por empresas y dispositivos en todo el mundo, alcance los 44 billones de gigabytes para 2020.

Eso es un aumento de diez veces en comparación con 2013, y representará datos suficientes para llenar más de seis pilas de tabletas de computadora que se extienden hasta la luna. Si bien no es necesario guardar toda esa información, el mundo está produciendo datos más rápido que la capacidad de almacenarlos.

Las moléculas de ADN pueden almacenar información millones de veces más densamente que las tecnologías existentes para el almacenamiento digital: unidades flash, discos duros, medios magnéticos y ópticos. Esos sistemas también se degradan después de unos años o décadas, mientras que el ADN puede preservar de manera confiable la información durante siglos . DNA es el más adecuado para aplicaciones de archivo, en lugar de instancias donde los archivos deben ser accedidos de inmediato.

El equipo del Laboratorio de Sistemas de Información Molecular ubicado en el Edificio de Ingeniería Eléctrica de la Universidad de Washington, en estrecha colaboración con Microsoft Research, está desarrollando un sistema de almacenamiento basado en ADN que, según se espera, podría abordar las necesidades mundiales de almacenamiento de archivos.
Primero, los investigadores desarrollaron un enfoque novedoso para convertir las largas cadenas de unos y ceros en datos digitales en los cuatro componentes básicos de las secuencias de ADN: adenina, guanina, citosina y timina.

“Cómo pasas de unos y ceros a As, Gs, Cs y Ts realmente importa porque si usas un enfoque inteligente, puedes hacerlo muy denso y no obtienes muchos errores”, dijo el coautor Georg Seelig , profesor asociado de ingeniería eléctrica y de informática e ingeniería de la UW. “Si lo haces mal, obtienes muchos errores”.

Los datos digitales se cortan en pedazos y se almacenan sintetizando una cantidad masiva de pequeñas moléculas de ADN, que pueden deshidratarse o conservarse para su almacenamiento a largo plazo.
Los investigadores de UW y Microsoft son uno de los dos equipos en todo el país que también han demostrado la capacidad de realizar “acceso aleatorio”, para identificar y recuperar las secuencias correctas de este gran conjunto de moléculas de ADN aleatorias, que es una tarea similar a volver a armar un capítulo de Una historia de una biblioteca de libros rotos.

Para acceder a los datos almacenados más tarde, los investigadores también codifican el equivalente de los códigos postales y las direcciones de las calles en las secuencias de ADN. El uso de técnicas de reacción en cadena de la polimerasa (PCR) , comúnmente utilizadas en biología molecular, les ayuda a identificar más fácilmente los códigos postales que están buscando. Usando técnicas de secuenciación de ADN, los investigadores pueden “leer” los datos y convertirlos nuevamente a un archivo de video, imagen o documento utilizando las direcciones de las calles para reordenar los datos.

Actualmente, la barrera más grande para el almacenamiento de ADN viable es el costo y la eficiencia con la que el ADN puede sintetizarse (o fabricarse) y secuenciarse (o leerse) a gran escala. Pero los investigadores dicen que no hay una barrera técnica para lograr esas ganancias si existen los incentivos correctos.

Los avances en el almacenamiento de ADN se basan en técnicas pioneras de la industria de la biotecnología, pero también incorporan nuevos conocimientos. El enfoque de codificación del equipo, por ejemplo, se basa en esquemas de corrección de errores comúnmente utilizados en la memoria de la computadora, que no se habían aplicado al ADN.

“Este es un ejemplo en el que tomamos prestado algo de la naturaleza, el ADN, para almacenar información. Pero estamos usando algo que sabemos de las computadoras, cómo corregir errores de memoria, y aplicarlo de nuevo a la naturaleza”, dijo Ceze.

“Este enfoque multidisciplinario es lo que hace que este proyecto sea emocionante. Nos basamos en un conjunto diverso de disciplinas para ampliar los límites de lo que se puede hacer con el ADN. Y, como resultado, crear un sistema de almacenamiento con una densidad y durabilidad sin precedentes”, dijo Karin Strauss, investigadora de Microsoft y profesora asociada afiliada a la UW de ciencias de la computación e ingeniería.
La investigación fue financiada por Microsoft Research, la National Science Foundation y la David Notkin Endowed Graduate Fellowship.

Los coautores incluyen al estudiante de doctorado en ciencias de la computación e ingeniería de la UW James Bornholt, el estudiante de doctorado de bioingeniería de la UW Randolph Lopez y Douglas Carmean, arquitecto asociado de Microsoft Research y profesor afiliado de ciencias de la computación e ingeniería de la UW.


Fuente de la historia:
La publicación anterior se reproduce a partir de materiales proporcionados por la Universidad de Washington .
El artículo original fue escrito por Jennifer Langston.
Nota: Los materiales pueden ser editados por contenido y duración.

El ADN está emergiendo como una opción para el almacenamiento de datos a largo plazo. Con la codificación adecuada, se pueden lograr densidades de datos extremadamente altas, el formato debe ser legible para siempre y la copia a través de PCR es muy económica. Actualmente, la escritura es lenta y costosa, y la lectura también es lenta y costosa en comparación con las opciones totalmente electrónicas, pero ambas deberían caer,