Webinar realizado pela Fundação de Amparo à Pesquisa do Estado de São Paulo teve participação de diversos especialistas.
O gerenciamento de dados obtidos em pesquisas científicas sempre foi de extrema importância para subsidiar descobertas nas mais diversas áreas de conhecimento, de acordo com os cientistas. Durante a pandemia de COVID-19 ficou evidente que o compartilhamento de dados abertos estruturados entre pesquisadores de vários países e comunidades pode, até mesmo, salvar vidas.
“Neste momento de urgência global que vivemos, é preciso juntar todas as informações já produzidas para, a partir delas, gerar evidências que permitam a diferentes comunidades e países estarem mais bem preparados para enfrentar esse grande desafio”, disse à Agência Fapesp Luiz Eugênio Mello, diretor científico da Fundação de Amparo à Pesquisa do Estado de São Paulo, na abertura do seminário online Open Data under the COVID-19 pandemic, o 4º Fapesp COVID-19 Research Webinars, realizado em 5 de agosto.
De acordo com Mello, é a partir de dados de qualidade – oriundos de pesquisas anteriores, de levantamentos epidemiológicos ou de atendimentos clínicos – que a comunidade científica pode identificar dificuldades que precisam ser superadas e propor soluções para o enfrentamento da pandemia.
“A Fapesp foi pioneira ao lançar no dia 1º de julho o primeiro repositório de dados abertos do Brasil, com dados demográficos e de exames clínicos e laboratoriais de pacientes que fizeram testes para COVID-19 no país”, salientou à Agência Fapesp Claudia Bauzer Medeiros, professora do Instituto de Computação da Universidade Estadual de Campinas (Unicamp) e participante do projeto.
Dados abertos
O COVID-19 Data Sharing/BR abriga dados abertos e anonimizados de, inicialmente, mais de 177 mil pacientes, 9.634 dados de desfecho e um total de quase 5 milhões de resultados de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Israelita Albert Einstein e Sírio-Libanês desde novembro de 2019.
Apesar da grande importância e dos benefícios do compartilhamento de dados da COVID-19, a empreitada surge em meio a grandes desafios. No seminário online, especialistas do Brasil, dos Estados Unidos e da França abordaram a relevância e as dificuldades de iniciativas como o COVID-19 Data Sharing/BR, assim como a necessidade de um grande esforço global para lidar com a pandemia.
“Iniciativas e estruturas que permitam o compartilhamento de dados intensificam a capacidade de pesquisa e contribuem para o maior entendimento sobre o impacto da doença. No entanto, existem desafios importantes nessa seara, como a heterogeneidade e privacidade dos dados. Há também questões de legislação, que ficaram ainda mais evidentes durante a pandemia. Diferentes países usam justificativas legais distintas para o uso dos dados, o que cria sérias dificuldades para conectar todas essas informações”, pontuou à Agência Fapesp Maurício Barreto, pesquisador da Fundação Oswaldo Cruz (Fiocruz), onde coordena o Centro de Integração de Dados para Saúde (Cidacs).
O Cidacs realiza estudos e pesquisas com base em projetos interdisciplinares originados na vinculação de grandes volumes de dados e na estruturação de plataformas como a Coorte de 100 Milhões de Brasileiros, a Plataforma Zika, Tecnologias e Inovações para o SUS, Equidade e Sustentabilidade Urbana e Bioinformática e Epidemiologia Genética (Epigen).
Impactos
A pandemia evidenciou ainda que, para compreender os impactos totais da crise global, é preciso ir além dos dados de saúde. “Não é difícil perceber que se trata não apenas de uma crise de saúde, mas também uma crise social, econômica e até política. Tudo aquilo que está relacionado ao mundo social mudou de modo abrupto e a capacidade de entender o impacto da doença na população perpassa por questões muito mais amplas”, disse à Agência Fapesp Amy Pienta, pesquisadora do Inter-University Consortium for Political and Social Research (ICPSR), nos Estados Unidos, uma das maiores e mais antigas base de dados relacionada às ciências sociais.
Pienta ressalta que a pandemia envolve questões de moradia, desigualdades, fechamento de pequenos negócios, saúde mental, desemprego, impacto do ensino a distância no desenvolvimento infantil e muitos outros.
“Como se trata muito mais do que uma crise de saúde, cientistas sociais estão coletando e fornecendo dados sobre o impacto da pandemia para subsidiar um maior entendimento sobre as diversas crises e também identificar onde estão os problemas. Isso envolve uma variedade grande de dados que precisam ser correlacionados”, acrescentou.
Para Anne Cambon-Thomsen, pesquisadora da University Toulouse III Paul Sabatier (França), além da conexão entre informações de diferentes áreas do conhecimento, há ainda a necessidade de cooperação internacional para o compartilhamento e reuso de dados.
“Um dos grandes aprendizados da pandemia está na necessidade de balancear a agilidade e precisão. Há uma carência de acordos internacionais pré-aprovados para o compartilhamento de dados. Precisamos então coordenar esforços entre jurisdições diferentes para fomentar globalmente a ciência aberta por meio de novas políticas e investimentos em repositórios de dados. Lembrando que é preciso envolver formuladores de políticas públicas nesse debate”, ressaltou Cambon-Thomsen.
De acordo com Cambon-Thomsen, para que esse esforço tenha resultados é importante, sobretudo, incentivar a publicação dos dados e a construção de repositórios comprometidos com a permanência no longo prazo. “Existe ainda a necessidade de equilíbrio ético e de privacidade, levando em conta o interesse público quando se abordam crises como a que vivemos”, avaliou.
Cambon-Thomsen integra a Research Data Alliance (RDA), iniciativa apoiada pela Comissão Europeia, pela National Science Foundation (NSF), dos Estados Unidos, e pelo Departamento de Inovação do Governo Australiano, que desde 2013 vem desenvolvendo protocolos com o objetivo de construir infraestrutura social e técnica para o compartilhamento e reutilização de dados abertos.
Em trabalho recente, a RDA desenvolveu diretrizes e recomendações detalhadas sobre o depósito de várias fontes de dados em plataformas abertas em situações de emergências de saúde pública como a pandemia por COVID-19.
“Destacamos quatro áreas prioritárias, cada uma com diferentes tipos de dados: clínicas, ômicas, epidemiologia, ciências sociais. Além dessas áreas, há quatro temas transversais [participação da comunidade, dados sobre comunidades indígenas, considerações legais e éticas, software de pesquisa] que surgem como forma de focar o debate e fornecer um conjunto inicial de diretrizes em um prazo muito curto e de urgência”, contou.
Cenário
De acordo com Dawei Lin, do National Institutes of Health (NIH), dos Estados Unidos, a pandemia trouxe um cenário muito específico, que não havia sido previsto por especialistas de dados.
“As pessoas que estão gerando os dados estão extremamente ocupadas, salvando vidas ou buscando descobertas fundamentais para o combate à pandemia. Portanto, elas não têm muito tempo de gerenciar essas informações. Por isso a necessidade de valorizar infraestruturas, protocolos e maneiras inovadoras de tornar o gerenciamento de dados possível mesmo nessas condições”, enfatizou à Agência Fapesp.
Lin alertou para a necessidade de dados confiáveis. “Os repositórios devem ganhar a confiança das comunidades que pretendem servir e demonstrar que são confiáveis e capazes de gerenciar adequadamente os dados que possuem”, afirmou.
Entre os princípios fundamentais, apresentados por Lin, para dados confiáveis estão: transparência, responsabilidade, foco no usuário, perenidade e tecnologia.
“A disponibilidade de dados é prioritária em uma pandemia. Assim como a variedade e a interdisciplinaridade dessas informações. No entanto, sabemos que repositórios de dados não são uma novidade. A pandemia apenas evidenciou a sua importância e enfatizou seus principais desafios. O que mantém um repositório importante e funcionando ao longo de tantos anos é justamente ele se tornar relevante para a comunidade”, disse Pienta.
A íntegra do 4º FAPESP COVID-19 Research Webinars pode ser vista no endereço: https://covid19.fapesp.br/open-data-under-the-covid-19-pandemic-august-5-2020/265.