Boletim SBCS Volume 45 Número 1

Page 31

A maneira mais eficiente de disponibilizá-los é publicando-os em um repositório de dados da pesquisa, por vezes chamado de arquivo ou biblioteca de dados ou biblioteca, o que nada mais é que uma infraestrutura de tecnologias da informação (TI) usada para armazenar e distribuir dados da pesquisa via web. A infraestrutura de TI é variável e pode ser constituída, por exemplo, por um conjunto de bases de dados que utilizam padrões comuns de armazenamento e distribuição, comunicando-se de maneira automática. Um repositório também pode incluir rotinas avançadas de padronização e harmonização dos dados provenientes de diferentes origens. Costumam estar presentes uma interface gráfica para os usuários (GUI) e outra de programação de aplicações (API). Enquanto a GUI permite o carregamento, busca e descarregamento manuais dos dados, a API permite que serviços web de terceiros se conectem ao repositório e usufruam de suas funcionalidades. Um repositório de dados da pesquisa costuma incluir ainda dados sobre os dados, os chamados metadados. São explicações detalhadas sobre porque, como, quando, onde e por quem os dados foram coletados que permitem que estes sejam reutilizados no futuro por outras pessoas, sem que haja a necessidade de entrar em contato com quem os produziu. Outro componente importante de um repositório é a política e as licenças de uso dos conjuntos de dados.

Repositórios de dados da pesquisa

Existem milhares de repositórios de dados da pesquisa em todo o mundo. Boa parte deles está cadastrada no Registry of Research Data Repositories (re3data.org), iniciativa lançada em 2012, com financiamento da Fundação Alemã de Pesquisa, que incorporou o Databib, um catálogo de repositórios de dados mantido por pesquisadores voluntários. Gerido pelo DataCite, uma organização sem fins lucrativos que fornece identificadores persistentes (DOI) para dados de pesquisa, o re3data.org conta com parceiros de instituições de todo o mundo. Isso o consolidou como referência global na identificação de repositórios de dados da pesquisa.

dos numa instituição específica. Hoje, a maioria dos repositórios é disciplinar. Essa preferência possui inúmeras razões. Uma delas é o fato de que uma estrutura especializada costuma facilitar o gerenciamento do repositório, a definição de padrões de armazenamento e a distribuição dos dados que atendem às necessidades específicas dos pesquisadores daquela área. Além disso, estes repositórios costumam servir como ponto de nucleação de comunidades científicas bastante colaborativas. Num segundo momento, a formação dessas comunidades é fundamental para garantir a continuidade dos próprios repositórios, dado que raramente possuem aportes fixos de recursos.

Os repositórios de dados da pesquisa registrados no re3data.org são tipificados de diferentes maneiras. Uma delas é quanto ao escopo ou tema dos dados que armazenam e distribuem, podendo ser disciplinares ou institucionais. Um repositório disciplinar lida com dados relacionados a uma área específica do conhecimento. Já os institucionais lidam com os que foram produzi-

A maioria destes repositórios pode ser acessada abertamente pelo público e garante acesso irrestrito aos dados. O cadastramento dos usuários é opcional e usado apenas como forma de conhecer melhor como os dados são usados. Outros impõe alguma restrição para acesso,como um cadastramento compulsório. Além disso, a política de dados dos repositórios não costu-

em foco

lar, os padrões usados para organização dos dados e as informações disponibilizadas podem não ser suficientes para permitir o reúso deles. Uma informação comumente faltante nesses casos é a licença de uso dos dados. Ademais, iniciativas particulares não dão garantias de que os dados continuarão disponíveis no futuro.

A abertura dos dados é fundamental para fazermos uma ciência o solo mais transparente.

BOLETIM INFORMATIVO DA SBCS | JAN - ABR 2019 |

29


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.