A gigante de tecnolocia quer usar a saúde digital, na forma de cloud, para criar um big data de indivíduos e trabalhar com esses dados. O primeiro produto desenvolvido é o Google Genomics, um serviço de cloud que eles lançaram em março, de acordo com a Technology Review.

Comparar o genoma de milhares e, mais tarde, de milhões de pessoas vai impulsionar descobertas médicas para a próxima década. A questão de quem vai armazenar os dados é um ponto de bastante competição entre algumas empresas, como a Amazon, o Google, a IBM e a Microsoft.

O Google começou a trabalhar há 18 meses, encontrando com cientistas e construindo uma interface que os permite mover dados de DNA para os seus servidores e fazer experimentos usando a mesma tecnologia de database que indexa a Web e monitora bilhões de usuários. “Vimos biólogos se movendo de estudar um genoma por vez para estudar milhões. A oportunidade é aplicar tecnologia de ponta para ajudar nesta transição.”, diz David Glazer, engenheiro de software.

Alguns cientistas fazem piada, dizendo que os dados do genoma humano ainda são muito complexos para o Google, mas alguns já o vêem como um bom parceiro. A explosão de dados está acontecendo enquanto laboratórios adotam equipamentos novos e mais rápidos para decodificação de DNA.

O Broad Institute, em Cambridge, disse que, em outubro, decodificou o equivalente a um genoma humano a cada 32 minutos. Isso é traduzido em, aproximadamente, 200 terabytes de dados crus. Estes números não são grandes, se comparados à capacidade de geração de dados da internet. Em dois meses, o Broad vai produzir o equivalente ao que é colocado no YouTube em um dia, mas, em termos de ciência, é muito maior do que tudo o que já foi visto para geração deste tipo de dados.

O National Cancer Institute disse que vai pagar $19 milhões para mover cópias de 2,6 petabytes de arquivos do Cancer Genome Atlas para a nuvem. Dados de milhares de pacientes de câncer serão colocados no Google Genomics e na Amazon.

A ideia é criar um sistema de cloud de genoma humano, onde cientistas possam compartilhar informação e fazer experimentos virtuais de forma tão simples como uma busca online.

Atualmente, o Google cobra $25 para armazenar um genoma e um pouco mais para realizar análises computacionais sobre isso. Os dados crus de um genoma humano representam 100 gigabytes em tamanho e uma versão polida chega a ter menos de 1gb, custando $0,25 por ano.