fundamentos da e-science

A filosofia e a tecnologia de uma Ciência para todos

Um dos princípios basilares do paradigma da e-Science é que dados científicos obtidos ou gerados pelos pesquisadores devem ser compartilhados ampla e irrestritamente . O compartilhamento de dados científicos é uma forte tendência entre as mais diversas comunidades científicas no mundo. Razões para tanto incluem:

  • um maior retorno dos investimentos públicos que frequentemente financiam a obtenção dos dados;
  • a redução de custos e a minimização de esforços redundantes;
  • a possibilidade de reuso dos dados para atender demandas distintas, consequentemente gerando novos conhecimentos e aplicações;
  • a garantia da replicabilidade de análises e modelos, ou seja, sua validação por pares.

A disponibilização de dados científicos em repositórios públicos é um passo fundamental para a operacionalização dos princípios e objetivos mais amplos da Ciência Aberta. Repositórios de dados científicos são orientados por protocolos de curadoria que garantem a preservação e acessibilidade dos dados.. As políticas e mecanismos de curadoria de dados dependem do modelo de Ciclo de Vida de Dados (CVD) adotados, o qual precisa estar em sintonia com os objetivos específicos do repositório e possibilitar acesso à informação por agentes humanos e por mecanismos automatizados de processamento e análise. Para o DATAPB e LMI IDEAL, adotamos como modelo de CVD a abordagem FAIR. 

FAIR

O acrônimo FAIR se refere às propriedades desejáveis para dados compartilhados no contexto da da Ciência Aberta: esses dados devem ser econtráveis (Findable ), acessíveis (Accessible), interoperáveis (Interoperable) e reutilzáveis ( Reusable). Cada elemento de dados deve ter um identificador digital único – digital object identifier, DOI ( Rodriguez-Iglesias et al. 2016).

Aplicação dos princípios FAIR no DATAPB

O DATAPB tem em seu núcleo central uma proposta de curadoria de dados baseada no Dataverse, nosso repositório que está em implantação em nossos servidores. Estreitamente em consonância com os princípios FAIR, nosso repositório inclui:

  • identificadores únicos globais associados a cada elemento de dados depositado, os quais estão associados a metadados contextualizados e pesquisáveis que garantem que os dados sejam encontráveis (findable);
  • o usuário tem acesso gratuito e livre aos dados e metadados, desde que seja realizada a autenticação e firmado o compromisso ético de reuso dos dados conforme nossa Política de Gestão de Dados ( accesbile);
  • os dados e metadadosa são estruturados de forma a facilitar a integração com outros conjuntos de dados, bem como seu uso por aplicativos e fluxos de trabalhos relacionados ao armazenamento, análise e processamento, usando vocabulários que seguem os princípios FAIR ( interoperable);
  • os dados e metadados são fornecidos ao usuário com uma licença de uso clara e com as referências necessárias para a citação apropriada das fontes originais (reusable ).

Apesar da adoção dos princípios FAIR para gestão de dados científicos ser um processo recente, essa abordagem está rapidamente se consolidando como um padrão internacionalmente reconhecido e amplamente empregado. No Brasil, a estruturação de repositórios digitais de dados científicos com base em princípios FAIR ainda está no início de seu desenvolvimento. O DATAPB é um projeto pioneiro nesse sentido, tanto na Paraíba como em escala nacional. Além de nosso repositório DATAVERSE, estamos desenvolvendo projetos-piloto de reuso dos dados que ilustram o potencial revolucionário da abordagem FAIR para subsidiar pesquisa, desenvolvimento e inovação na área da Sustentabilidade.

+princípios FAIR e dados abertos

Os princípios FAIR são um modelo de Ciclo de Vida de Dados que adotamos no projeto DATAPB, em consonância com nossa abordagem de e-Science. Para aprofundar-se nesse tema e saber como FAIR amplia a descoberta de dados científicos, clique no ícone vermelho para gratuitamente assistir à palestra.

Luana F. S. Marques – IBICT

PRINCÍPIOS FAIR: AMPLIANDO A DESCOBERTA DE DADOS CIENTÍFICOS

Gravação de palestra apresentada no I Simpósio Online de e-Science para a Sustentabilidade promovido pelo projeto DATAPB em março de 2022.

OUTROS CONTEÚDOS RELACIONADOS:

Ciência Aberta: por quê ela importa tanto para o meio ambiente?
Entenda o que é o DATAPB e o
LMI IDEAL
Sustentabilidade se faz com planejamento, ação e inovação em rede