Header Ads

Microsoft e Universidade de Washington demonstram armazenamento automatizado de dados de DNA



O armazenamento de dados de DNA mantém a promessa de colocar grandes quantidades de informação em um tubo de ensaio - mas quem quer transportar tubos de ensaio ao redor de um data center?

A Microsoft e da Universidade de Washington estão trabalhando de uma maneira melhor: um sistema completamente automatizado que pode transformar bits digitais em moléculas de DNA codificadas para armazenamento, e transformar essas moléculas de volta em bits quando necessário. </ p>
sistema de prova de conceito, descrito em um artigo publicado hoje na revista Nature Scientific Reports, para codificar a palavra “olá” em filamentos de DNA e depois lê-lo. Isso pode soar como uma tarefa ridiculamente simples, mas serviu para mostrar que o sistema funciona.

“Temos a convicção de que as moléculas de DNA são boas candidatas para o armazenamento de dados. Mas nós somos, no coração, arquitetos de computadores. Nós realmente queremos descobrir como seria um futuro computador ”, disse Luis Geze, professor da Escola de Ciência da Computação e Engenharia da Universidade Paul G. Allen, da UW, à GeekWire. “O que é excitante para nós aqui é que é um passo para mostrar um sistema de computador que tem um componente molecular e um componente eletrônico.”

O mecanismo de armazenamento de dados de DNA é semelhante à maneira como o DNA em nossas células codifica informações genéticas: em vez de usar os eletrônicos e zeros, o sistema de codificação traduz dados em pares de bases de DNA, usando as “letras” químicas para adenina, citosina, guanina e timina (A, C, G, T). "Olá", por exemplo, pode ser codificado na cadeia química TCAACATGATGAGTA.

É importante notar que a molécula feita sob medida não faz nada geneticamente. Em vez disso, o sistema usa meramente as substâncias químicas no DNA como código. "Não há células, nem organismos", disse a pesquisadora principal da Microsoft, Karin Strauss.

O método aumenta drasticamente a densidade do armazenamento de dados. Teoricamente, você poderia armazenar um bilhão de bilhões de bytes de dados (conhecidos como exabytes) em uma polegada cúbica de DNA, diz Strauss.




Experiências anteriores, a equipe da Microsoft-UW usou o DNA para codificar arquivos que vão desde textos históricos a fotos de gatos, até vídeos de alta definição da OK Go. O Laboratório de Sistemas de Informação Molecular da UW até tem um site “Memórias no DNA” onde você pode enviar seus próprios arquivos para armazenamento de DNA.

Mas esse trabalho envolveu muitas etapas manuais para descobrir o código, enviar um pedido para obter as moléculas sintetizadas, espere que o DNA retorne pelo correio e execute os experimentos. Porque tanto manuseio estava envolvido, havia muitas oportunidades de cometer erros. Isso nunca aconteceria em um ambiente comercial.

“Você não pode ter um monte de pessoas correndo em torno de um data center com pipetas - é muito propenso a erros humanos, é muito caro e a pegada seria muito “O principal autor do estudo, Chris Takahashi, pesquisador sênior da Allen School, explicou em um post no blog da Microsoft. É por isso que um sistema automatizado é importante.

O software do sistema traduz o código digital em código de DNA. Esse código é enviado automaticamente para um sintetizador que combina os químicos e líquidos necessários, na ordem e nas proporções corretas, e então projeta as moléculas de DNA feitas sob medida em um recipiente de armazenamento.

Os dados, o DNA é arrastado para um aparelho que adiciona produtos químicos e os empurra através de uma máquina de sequenciamento de DNA nanopore. A sequência é automaticamente convertida em uns e zeros de dados digitais.

Ceze disse que o procedimento ainda leva de 12 a 16 horas, mas o tempo decorrido não foi o objetivo deste experimento. Em vez disso, o objetivo era mostrar que um sistema automatizado poderia fazer o trabalho de forma confiável do início ao fim. A equipe da Microsoft-UW também criou um sistema programável que pode mover gotículas de fluido em uma microfluídica digital. dispositivo apelidado de PurpleDrop. O sistema operacional, conhecido como Puddle, pode ser usado para emitir comandos para um sistema microfluídico, da mesma forma que um sistema operacional mais convencional, como o Linux, pode emitir comandos para um sistema de computação eletrônica.

Aqui está uma amostra do código Puddle. :


 
a = entrada (substância_A) 
b = entrada (substância_B) 
ab = misturar (a, b) 
while get_pH (ab) > 7: 
   aquecer (ab) 
   acidificar (ab) 
"O que é fantástico neste sistema é que, se quisermos substituir uma das peças por algo novo, melhor ou mais rápido, podemos ligá-lo", disse o pesquisador da Microsoft, Bichlien Nguyen. </ p> Eventualmente, um sistema de armazenamento de dados de DNA de última geração poderia ser combinado com dispositivos como o PurpleDrop e softwares como o Puddle para criar um ambiente de computador baseado em microfluídica em vez de eletrônica. Ceze disse que isso provavelmente levaria a sistemas computacionais híbridos que combinam o poder de processamento da computação eletrônica com a densidade de armazenamento de dados do DNA.
"Nossa visão para o uso de moléculas é para aplicativos que possuem muitos dados", disse ele. “O tipo de computação que estamos explorando é a correspondência de padrões e a pesquisa aproximada. Se você tem uma grande coleção de imagens e vídeos, como encontra imagens semelhantes, como encontra vídeos semelhantes? ”Ceze e seus colegas já demonstraram como a computação baseada em DNA pode“ pescar ”através de grandes bancos de dados para imagens que correspondem a uma determinada consulta. Esse tipo de capacidade é algo que a Agência de Projetos de Pesquisa Avançada da Defesa do Pentágono, ou DARPA, está muito interessada em desenvolver.

Também nesta semana, pesquisadores da Caltech e da Universidade da Califórnia em Davis publicaram um artigo descrevendo um sistema de processamento de dados que usa moléculas de DNA de auto-montagem para executar algoritmos. "É super interessante", disse Ceze. "Ele permite que você faça cálculos na escala molecular ... mas não é realmente sobre o processamento de grandes quantidades de dados, que é o nosso objetivo."

Sistemas de computador baseados em DNA provavelmente não aparecerão na Best. Compre a qualquer momento em breve.

“Estamos realmente imaginando isso sendo implantado na nuvem. … O cenário que vemos está substituindo partes de um sistema de escala maior que fica em um data center com componentes de sistema que usam armazenamento de dados moleculares e pesquisa de dados moleculares ”, disse Ceze.

Strauss não está disposto para prever quanto tempo levará para adicionar DNA ao Microsoft Azure, mas ela está confiante de que a Microsoft e a UW farão o que for preciso para transformar o experimento em um produto.
“Temos uma equipe muito especial aqui, " ela disse. “Temos muita sorte de estar em um ambiente onde as pessoas estão dispostas a fazer apostas e inovar.”
Takahashi, Nguyen, Strauss e Ceze são co-autores do projeto. estudo de acesso aberto na Nature Scientific Reports, “Demonstração da automação de ponta a ponta de armazenamento de dados de DNA”.
Atualização para as 21h21 da PT 21 de março: ajustamos esse relatório para refletir a estimativa de densidade de dados teórica para armazenamento de DNA com mais precisão, e também revisou uma referência ao software usado para o experimento descrito no trabalho de pesquisa.
Via: Geek Wire

Nenhum comentário