Dlaczego warto udostępniać dane badawcze?

Udostępnianie danych badawczych innym osobom i instytucjom staje się coraz istotniejszym elementem krajobrazu nauki w Polsce i na świecie. Mają na to wpływ naukowcy, którzy coraz częściej sami decydują się na udostępnienie swoich danych; redakcje czasopism naukowych, które wymagają od autorów udostępniania danych pozwalających na weryfikację twierdzeń zawartych w publikacji; a także instytucje finansujące, które coraz częściej zobowiązanie do udostępnienia danych badawczych czynią elementem umów grantowych z beneficjentami. Dzięki udostępnianiu danych naukowcy zwiększają szanse na cytowanie swoich publikacji i zbiorów danych, czasopisma mają lepszą renomę i wyższą jakość ukazujących się w nich artykułów, a instytucje finansujące dbają o racjonalność wydatkowania środków publicznych.

Fragment broszury „Selekcja i przygotowanie danych badawczych do udostępniania” dostępnej w zakładce Pliki do pobrania

Rodzaje repozytoriów danych badawczych

Repozytoria danych badawczych, podobnie jak repozytoria publikacji, mogą mieć charakter dziedzinowy lub instytucjonalny, Mogą też łączyć funkcje obu typów, jeżeli prowadząca je instytucja zajmuje się badaniami w określonym obszarze lub prowadzi repozytorium z myślą o konkretnym projekcie badawczym.
Repozytoria dziedzinowe gromadzą dane z konkretnych obszarów wiedzy, co dla poszukujących danych użytkowników jest istotne. Przeszukiwanie właściwego repozytorium zwiększa bowiem prawdopodobieństwo znalezienia szybko interesujących danych.
Repozytoria instytucjonalne gromadzą dane badawcze wytworzone i  opracowanie przez pracowników konkretnej instytucji lub grantobiorców realizujących finansowane przez nią badania. Dla szukających danych naukowców mogą być przydatne zwłaszcza wtedy, gdy prowadząca repozytorium instytucja specjalizuje się w określonym obszarze. Dane badawcze deponowane są również w repozytoriach ogólnego przeznaczenia, takich jak Zenodo (https://zenodo.org) czy Figshare (https://figshare.com).

Fragment broszury „Jak korzystać z zasobów w repozytoriach danych” dostępnej w zakładce Pliki do pobrania


W ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych zostały utworzone i uruchomione trzy repozytoria. Repozytorium Danych Społecznych (RDS) oraz Macromolecular Xtallography Raw Data Repository (MX-RDR) mają charakter dziedzinowy, natomiast nowa wersja Repozytorium Otwartych Danych RepOD to repozytorium ogólnego przeznaczenia. Z repozytoriów korzystać mogą wszyscy polscy badacze, niezależnie od afiliacji instytucjonalnej.

O projekcie Dziedzinowe Repozytoria Otwartych Danych Badawczych w Biuletynie EBIB

W najnowszym numerze Biuletynu EBIB, w całości poświęconym otwartemu udostępnianiu danych badawczych, ukazał się artykuł na temat projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych. Przedstawiono w nim genezę, założenia, cele i planowane rezultaty projektu: trzy repozytoria funkcjonujące w oparciu o otwarte oprogramowanie Dataverse, a także opracowywane i sukcesywnie udostępniane zbiory danych badawczych z zakresu krystalografii, nauk społecznych i innych dziedzin. Artykuł przybliża ponadto program szkoleń z zarządzania danymi badawczymi, organizowanych w ramach projektu od jesieni 2019 roku.

Dlaczego warto korzystać z repozytoriów danych badawczych?

Otwarte repozytoria jako narzędzia informatyczne służące do przechowywania i udostępniania wyników badań naukowych są tworzone z uwzględnieniem zasad otwartej komunikacji naukowej oraz potrzeb indywidualnych badaczy i instytucji naukowych. Obejmują zatem odpowiednie rozwiązania w zakresie bezpiecznego, trwałego przechowywania zasobów, ich stałej dostępności i widoczności w Internecie czy łatwości wyszukiwania i cytowania. Aktualnie w tworzeniu i rozwijaniu infrastruktury repozytoryjnej uwzględniane są także zasady FAIR (Findable – Accessible – Interoperable – Reusable), które mają umożliwiać jak najszerszy zakres ponownego wykorzystania danych badawczych.

Deponowanie zestawu danych w repozytorium wymaga podania metadanych, czyli danych opisujących właściwe dane. Podstawowy zestaw metadanych obejmuje między innymi informacje o autorze lub autorach oraz tytule zbioru. Wraz z datą jego powstania i trwałym identyfikatorem, metadane te stanowią zarazem informacje potrzebne do jednoznacznej identyfikacji i zacytowania zbioru. Większość repozytoriów automatycznie nadaje deponowanym w nich zestawom danych trwałe identyfikatory, np. DOI (Digital Object Identifier). Stałe i unikalne w skali światowej oznaczenia obiektów cyfrowych umożliwiają nie tylko uzyskanie podstawowych informacji na ich temat (czyli właśnie metadanych), ale także wskazanie ich aktualnego adresu w sieci czy powiązanie z innymi obiektami, np. artykułami naukowymi.

Zarówno odpowiednie metadane, jak i trwałe identyfikatory są elementami ułatwiającymi wdrażanie zasad FAIR, w szczególności zasady F – Findable, która określa możliwość łatwego wyszukania i zidentyfikowania odpowiednich danych. Im bogatsze metadane, tym łatwiejsze staje się wyszukiwanie odpowiednich danych, dlatego też – tam gdzie to możliwe – warto korzystać z repozytoriów dziedzinowych, które mogą wdrażać odpowiednie standardy, takie jak np. słowniki kontrolowane.

Trwałe identyfikatory ułatwiają ponadto cytowanie danych badawczych, które stanowią pełnoprawne rezultaty badań i powinny być wskazywane wszędzie tam, gdzie posłużyły za podstawę jakichś wniosków czy ustaleń. Strona (rekord) z odpowiednim zestawem danych zawiera zwykle sugerowaną formę cytowania, obejmującą podstawowe informacje o danych oraz trwały identyfikator. Formułę tę wystarczy skopiować i wkleić do pliku tekstowego z powstającym artykułem, notatkami czy bibliografią. Osoby korzystające z aplikacji do zarządzania bibliografią i przypisami bibliograficznymi mogą skorzystać także z opcji wyeksportowania pliku z rekordem bibliograficznym w wybranym formacie, np. BibTex czy RIS.

Repozytoria ułatwiają też wywiązanie się z obowiązków wobec instytucji finansujących badania naukowe, które coraz częściej przedstawiają rekomendacje bądź wymogi w zakresie sposobu otwartego udostępniania danych badawczych.