Na maior epidemia da era moderna, as praias, shoppings e comércio de rua permanecem abarrotados no Brasil como em outros países. Logradouros lotados, assim como as UTIs. Se a maioria da população ainda se mantem isolada, hordas de inconsequentes espalham o coronavírus, que promete infectar mais de 100 milhões de indivíduos mundo afora até fevereiro próximo. Em 2020, ficou claro que é “mais fácil fazer as máquinas apreenderem do que os indivíduos”. E elas estão apreendendo rápido, principalmente com o desenvolvimento dos imunizantes.

A euforia com a velocidade das vacinas não é sem propósito: o ‘godzilla epidêmico’ ajoelhou o mundo em pouco mais de 11 meses, sendo que em menos de 10 a indústria farmacêutica (e seus parceiros financeiros) fizeram chegar ao mercado meia dúzia de imunizantes, alguns já em fase de vacinação. Nunca o genoma de um vírus tinha sido mapeado com tal velocidade e uma vacina fora desenvolvida, testada e distribuída em menos de um ano. Até então, a espera por imunizantes demorava de 4 a 10 longos anos, com um custo aproximado de US$ 2,5 bilhões. Uma quantia titânica considerando que a taxa de sucesso é de apenas 12%. A vitória é da Ciência e dos pesquisadores, mas sempre é bom salientar que nada disso teria sido possível em tão breve espaço de tempo sem as “máquinas de inteligência artificial (IA)”. Em especial, uma delas, nominada Machine Learning (aprendizado de máquina), que está fazendo toda diferença no combate a Covid-19. Todos já ouviram sobre seus predicados, mas nada comparado ao que ouvirão falar daqui para frente, principalmente de sua “coirmã” Deep Learning (DP).

Machine Learning (ML) passou a ser um fator determinante no desenvolvimento de toda e qualquer vacina nos últimos meses. Seu empowerment é definitivo em várias linhas de ação, como: (1) encontrar as moléculas desejadas em gigantescos biobancos e biorrepositórios; (2) sugerir modificações químicas e atalhos bioquímicos de fundamental importância nas análises virais; (3) pesquisar e identificar imunizantes já existentes que poderiam ser reaproveitados na Covid-19 (sua velocidade e assertividade na varredura de biodados epidemiológicos é cem vezes superior a capacidade humana); (4) prognosticador e simular a disseminação do vírus em centenas de cenários diferentes; (5) acelerar a fase de clinical trial identificando os voluntários certos com base em seu histórico clínico e atributos funcionais; (6) acelerar a fabricação, auxiliando a triagem de compostos (fármacos) em função de sua taxa de sucesso; (7) construir análises preditivas do surto viral e da eficácia vacinal, se antecipando a efeitos adversos e dilemas logísticos; além de inúmeros outros atributos que fazem parte dos benefícios de ML.

“O maior uso de IA ​​ML na pandemia é desvendar os segredos biológicos da Covid-19, identificando as poucas moléculas que ajudarão a eliminar o surto entre milhões delas, reduzindo, assim, o tempo e o ciclo de desenvolvimento da droga (descoberta, ensaios clínicos e aprovação final pelas agências de regulação)”, explicou Subroto Mukherjee, chefe de inovação para as Américas da GlaxoSmithkline“Veja a velocidade e agilidade atuais: levou 300 dias desde a identificação do genoma do coronavírus até o primeiro estudo de vacina, que anteriormente demoraria em média de oito a dez anos”, continua Mukherjee. Um simples exemplo pode explicar a força de Machine Learning no front dos imunizantes da Covid-19: quando uma fase do ensaio clínico termina, leva-se em geral mais de 30 dias para que os dados coletados sejam “limpos”, com centenas de pesquisadores analisando manualmente os resultados e inspecionando erros e inconsistências (que ocorrem naturalmente ao se coletar dezenas de milhões de data-points). Uma única ferramenta de aprendizado de máquina (SDQ – Smart Data Query) faz com que os dados do ensaio clínico sejam revisados em ​​apenas 22 horas, permitindo um nível excepcional de velocidade e qualidade durante todo o teste. “Com isso ganhamos um mês inteiro”, disse Demetris Zambas, vice-presidente e chefe de monitoramento de dados da Pfizer“Em nossa própria equipe, as mesmas pessoas que estavam gastando milhares de horas procurando erros, agora estão procurando maneiras inovadoras de utilizar os dados dos testes clínicos”, explicou Zambas.

Oxford Vaccine Group, por exemplo, utilizou o SIMON (Sequential Iterative Modeling OverNight), uma plataforma de software livre para aprendizagem de máquina voltada à dados biomédicos. “O alvo principal do projeto era compreender porque alguns indivíduos que recebem a vacina estão protegidos contra a gripe enquanto outros foram contaminados, assim como prever se um biotipo de indivíduo responderá apropriadamente à vacina”, explicou Adriana Tomic, Ph.D. e membro do Oxford Vaccine Group. O SIMON foi capaz de identificar subconjuntos de células imunes que estavam presentes naqueles indivíduos que respondiam bem à vacina. O algoritmo pesquisou nas publicações mais lidas de 2019 e 2020, conforme avaliação da American Association of Immunologists (projeto FluPRINT, realizado em colaboração com a Stanford University e que analisou estudos clínicos gripais de 2007-2015). O escopo do “aprendizado” foi descobrir quais tipos de células respondem bem para alguns indivíduos e como podem ser melhoradas naqueles em que a resposta não é boa. “Os resultados do SIMON são importantes para o desenvolvimento das vacinas, tendo a capacidade de mudar fundamentalmente a vacinologia pela aplicação de algoritmos computacionais que aceleram a descoberta de padrões biomédicos”, completa Tomic.

Uma das funções da IA ​​no projeto de vacinas é estudar as proteínas que compõem o vírus. Ao examinar sua estrutura complexa, um sistema de IA pode classificar milhares de componentes identificando aqueles que têm maior probabilidade de desencadear uma resposta imunológica robusta. Como os vírus estão sempre em mutação, as plataformas de IA podem identificar os componentes que provavelmente não sofrerão mutação significativa, “garantindo” que a vacina permanecerá eficaz ao longo do tempo. Nas primeiras semanas da pandemia, uma equipe de cientistas de computação liderada por Russ Altman e Binbin Chen, do Stanford Institute for Human-Centered Artificial Intelligence (HAI), usaram o aprendizado de máquina para fazer exatamente isso. Utilizando ML com os algoritmos de rede neural NetMHCpan-4.0MARIA e um modelo de regressão linear chamado DiscoTope, os pesquisadores criaram uma lista de alvos no SARS-CoV2” que tinham maior probabilidade de provocar uma resposta imunológica, sendo os alvos, também conhecidos como epítopos, os componentes virais que podem ser ‘reconhecidos’. Como esperado, muitos dos principais epítopos recomendados no estudo pela plataforma de ML estavam localizados na proteína spike do vírus (aquela que adentra à célula e entende o seu funcionamento). “Estamos muito confiantes de que cada vez mais obteremos respostas imunológicas no nível celular aos alvos elencados. Todas as empresas farmacêuticas que desenvolvem vacinas estão realizando análises computacionais similares com ML”, explicou Chen.

Na Índia, uma empresa como a TCS′ Innovation Lab usou sua plataforma de IA para identificar 31 resultados potenciais que podem atuar como inibidores da Covid-19. A britânica Benevolent AI iniciou suas pesquisas no final de janeiro e nove meses depois identificou o baricitinibe, um tratamento potencial para ser usado na Covid-19. Um feito impossível sem a sua sofisticada plataforma de conhecimento biomédico e inteligência artificial: em outubro de 2020, os dados clínicos do estudo (NIAID ACTT-2) validaram a hipótese inicial e a droga recebeu aprovação do FDA em novembro. A canadense Cyclica está colocando sua ferramenta de ML (MatchMaker) para triar 6.700 moléculas em testes humanos de Fase 1 (incluindo drogas já aprovadas pela FDA), focando o reaproveitamento de fórmulas para a Covid-19. A IBM também utilizou sua estrutura de IA para apoiar pesquisas de drogas SARS-CoV-2: gerou 3 mil novas moléculas potenciais para o desenvolvimento de medicamentos contra a Covid-19, liberando a lista para uso dos pesquisadores.

ML traz a capacidade de gerenciar novos graus de escala e complexidade no data-mining. Métodos estatísticos geralmente funcionam dentro dos “imperativos e suposições rígidas”. IA subverte essa lógica, ampliando o cenário de forma nunca antes imaginada, ajudando a descobrir se uma molécula se encaixa ou não nos critérios especificados. Em janeiro de 2020, a equipe da norte-americana Inovio Pharmaceuticals esperou com um misto de ansiedade e entusiasmo que a sequência genética do coronavírus fosse postada online. “Quando foi carregada pelas autoridades chinesas em 10 de janeiro, nossos cientistas imediatamente inseriram a sequência em nosso algoritmo de ML: em 3 horas eles tinham uma vacina de DNA totalmente projetada”, explicou Kate Broderick, vice-presidente sênior de P&D da empresa. Essa corrida contra o tempo (e contra as mortes) é o novo parâmetro para a imunologia vacinal do século XXI. Mais do que citômetros, espectromicos, microscópios eletrônicos e inúmeros outros equipamentos de fundamental importância laboratorial, serão os algoritmos que irão insuflar a velocidade, o alcance e o futuro da ciência biomédica.

Guilherme S. Hummel

Coordenador Científico – HIMSS Hospitalar Forum

eHealth Mentor Institute (EMI) – Head Mentor