Com o título O Uso do Big Data em Epidemiologia, a conferência foi proferida por Laura Rodrigues, professora e ex-diretora da L ondon School of Hygiene and Tropical Medicine, da London University e teve coordenação de José Cássio de Moraes, professor da Faculdade de Ciências Médicas da Santa Casa de São Paulo. Antes da sessão, Moraes fez uma homenagem ao epidemiologista Ciro de Quadros, falecido em maio deste ano. Quadros esteve a frente da coordenação dos programas de imunização da Organização Pan-Americana de Saúde (OPAS)e foi determinante nas campanhas de erradicação da varíola, da poliomielite e do sarampo, contribuindo decisivamente para o desenvolvimento da saúde no continente americano.
Brasileira radicada na Inglaterra há mais de 20 anos e que acaba de chegar a marca de 300 trabalhos publicados em revistas científicas internacionais, a professora Laura apresentou o conceito, que começa a ser discutido e utilizado pela ciência brasileira quero a normalização dessa ideia, e em cinco anos veremos como rotina fazermos pesquisas com um milhão de indivíduos.
Foram as próprias empresas de tecnologia que descobriram o potencial do quanta de informação armazenados em seus servidores. Gigantes como a Google, a livraria Amazon e o Facebook constantemente apresentam às pessoas a utilização desses dados não-estruturados, ou seja, que não são frutos de banco de dados ou de ações direcionadas, mas sim produzidos cotidianamente e que, quando cruzados, definem nossas redes de contato, nossas preferências literárias, nossa forma de relacionamento.
A grande pergunta para nós epidemiologistas é saber se as pesquisas usando dados eletrônicos podem melhorar a saúde da população. Sim, podem e seu uso já começou, seja em novas formas de fazer pesquisa, que não poderiam ser feitas sem Big Data, seja nos estudos regulares que, com o uso desses metadados, nos oferecem melhores respostas, com maior rapidez e mais baratas, respondeu Laura, frisando ainda que a utilização dos dados não serve apenas para estudos observacionais, mas também para ensaios clínicos e randomizados.
O monitoramento de doenças é a primeira forma de aplicação do Big Data, já realizado de maneira experimental e acessória pela SVS da prefeitura de Belo Horizonte, capital mineira, que acompanha pela rede de microblogging Twitter a incidência de termos como gripe, dengue e mosquito para o acompanhamento da dengue na capital mineira, antecipando cenários antes da notificação oficial vinda dos serviços de saúde.
Outro exemplo é o Google Flu Trends, pesquisa dedicada da gigante do Vale do Silício americano que desde 2008 cruza metadados sobre gripe nos Estados Unidos. No início do projeto, seus engenheiros utilizaram cerca 50 milhões de termos processados por 400 milhões de algorítmos matemáticos, localizando 45 termos centrais e apresentando mapas de registros sobre a incidência da doença muito similares aos notificados pelo Centro de Controle de Doenças dos Estados Unidos (US CDC). No entanto, Laura registrou que as pesquisas de 2013 não foram tão precisas, mostrando variação de quatro pontos percentuais entre as notificações e os dados da Google. O argumento de defesa da empresa foi mudanças no padrão de buscas, e comprometeram-se a ajustar as equações.
Desafios e dilemas
Como tudo que envolve tecnologia e seres humanos, diversas questões éticas envolvendo a confidencialidade das pessoas e a privacidade das mesmas são levantadas no uso desses dados. Uma saída é a concessão da produção desses bancos de dados somente para empresas conveniadas e comprometidas a gerar relatórios e bancos anonimizados, preservando identidades e condições de saúde. O público precisa acreditar, para isso devem existir centros de trabalho para o estruturação desses dados, destacou ela, como o UK Biobank. São necessárias também ações dos governos, como o inglês, que já iniciou um debate público nomeado Better information means better care. Essa discussão está acontecendo e tende a ter uma limitação com a disseminação da importância desse conhecimento, que no entanto, devem sempre trabalhar com a possibilidade de ter a autorização de uso negadas pelos pacientes.