opinião > o que Kelly Rosa Braghetto está pensando…
A ciência precisa ser aberta
ARede nº 99 – julho/agosto de 2014
Com o aumento do uso de computação nas mais variadas áreas da ciência, os dados têm assumido um papel cada vez mais importante no processo de descoberta científica. Muitos dos resultados científicos divulgados hoje são embasados por dados digitais coletados ou gerados em experimentos científicos. Logo, é natural esperar que esses dados estejam publicamente acessíveis, para que os resultados possam ser validados e reproduzidos. Mas “abrir” dados científicos ainda é a exceção. Em muitos domínios da ciência, a coleta de dados é um trabalho dispendioso e pouco reconhecido.
Grande parte da pesquisa científica feita no mundo é financiada por dinheiro público. Compartilhar os produtos dessa pesquisa com a sociedade muitas vezes é visto como um dever cívico. Vários países têm leis que garantem aos cidadãos o direito de acesso às informações produzidas por órgãos públicos, incluindo universidades e outras instituições de pesquisa. No Brasil, a lei ainda é nova, mas a discussão sobre a importância da Ciência Aberta vem se intensificando e começa a mostrar resultados. A Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) já exige que dados e softwares produzidos nos projetos que financia sejam colocados à disposição do público. O Centro de Pesquisa, Inovação e Difusão em Neuromatemática (NeuroMat), financiado pela Fapesp, está criando um banco de dados aberto para dados de neurociência, um trabalho pioneiro que visa a amparar progressos na compreensão do funcionamento cerebral e no tratamento de doenças neurológicas.
A criação de bancos de dados científicos abertos envolve aspectos técnicos e legais. Para que os dados possam ser compreendidos e reusados, é preciso fornecer também informações sobre a sua proveniência e estrutura. Além disso, deseja-se assegurar que cientistas e instituições recebam créditos pelos bancos de dados e possam proteger seu uso futuro. Legalmente, isso implica definir os detentores dos direitos autorais e as licenças que estabelecerão os “direitos e deveres” de quem usa esses bancos.
Só recentemente licenças concebidas para software e conteúdo livre começaram a ser adaptadas para o uso em bancos de dados. Licenças como Creative Commons (CC) e Open Data Commons (ODC) hoje permitem condicionar o uso dos dados à atribuição de crédito ao seus autores e estabelecer que redistribuições só podem ser feitas sob a mesma licença (ou similar). Idealmente, um banco de dados aberto não deve ter uma licença que restrinja o seu uso para fins comerciais ou que só permita sua redistribuição sem derivações. O uso de licenças padronizadas (como CC e ODC) reduz problemas de incompatibilidade e jurisdição, uma vez que essas licenças são redigidas de acordo com a legislação internacional sobre direitos autorais, possibilitando o seu uso em vários países.
Os benefícios de dados científicos abertos para a sociedade são inegáveis: permitem que ciência de melhor qualidade e maior impacto seja produzida. Espera-se que um entendimento dos aspectos técnicos e legais envolvidos na disponibilização de dados de forma pública sirva de incentivo a iniciativas de abertura de dados científicos.
Kelly Rosa Braghetto
Professora do Departamento de Ciência da Computação da Universidade de São Paulo, especialista em modelagem de bancos de dados e pesquisadora associada do Centro de Pesquisa, Inovação e Difusão em Neuromatemática (NeuroMat).