Zasady FAIR w repozytoriach danych badawczych

FAIR to akronim słów „findable” (możliwy do znalezienia), „accessible” (dostępny), „interoperable” (interoperacyjny) i „reusable” (możliwy do ponownego wykorzystania). Termin ten określa zasady, jakie należy uwzględnić w zarządzaniu danymi badawczymi oraz ich otwartym udostępnianiu. Każda z nich ma charakter ogólnych wytycznych, które można realizować poprzez szczegółowe rozwiązania, zarówno na etapie przygotowania, jak na etapie udostępniania danych.

Repozytoria mogą umożliwiać lub ułatwiać wdrażanie zasad FAIR m.in. poprzez nadanie zestawom danych trwałych identyfikatorów, konieczność wprowadzenia opisujących dane metadanych czy możliwość udostępnienia danych wraz z metadanymi i dokumentacją na wolnych licencjach wskazanych bądź wybranych z listy przez użytkownika.

Zasady FAIR sformułowane zostały z myślą o budowaniu i rozwijaniu technicznego ekosystemu, w którym poprzez różnego rodzaju powiązane ze sobą serwisy i infrastruktury możliwe będzie wyszukiwanie, łączenie, analizowanie czy ponowne wykorzystanie danych badawczych. Opcje te mają być dostępne nie tylko dla ludzi, ale i dla maszyn, dlatego tak istotne jest odpowiednie wdrażanie zasad FAIR i stosowanie standardowych rozwiązań wszędzie tam, gdzie to możliwe.

Zasady FAIR są ponadto istotnym elementem wymogów w zakresie udostępniania danych badawczych w politykach otwartości instytucji finansujących badania naukowe (np. programy ramowe Komisji Europejskiej, wytyczne Narodowego Centrum Nauki) oraz w raportach, rekomendacjach i innych dokumentach określających strategiczne cele związane z rozwojem infrastruktury otwartej nauki w Europie.

Więcej o zarządzaniu danymi badawczymi zgodnie z zasadami FAIR przeczytać można w broszurze „Selekcja i przygotowanie danych badawczych do udostępnienia” opracowanej w ramach projektu i dostępnej w zakładce Pliki do pobrania.

Kwestie prawne na etapie planowania projektu badawczego

Na etapie planowania projektu badawczego kluczowa jest identyfikacja wszystkich kwestii oraz ryzyk prawnych, gdyż wiele z nich na późniejszym etapie może być bardzo trudno rozwiązać bez uprzedniego przygotowania. Niekiedy upływ czasu lub dalszy rozwój projektu może nawet spowodować, że rozwiązanie części z nich będzie niemożliwe.
Zaplanowanie działań projektowych od strony prawnej wymaga dobrej orientacji we wszystkich aspektach prawnych, z  którymi projekt może się wiązać, a z drugiej strony – dobrej merytorycznej znajomości projektu.

Fragment broszury „Prawne aspekty otwierania danych badawczych – poradnik” dostepnej w zakładce Pliki do pobrania.

Dlaczego warto udostępniać dane badawcze?

Udostępnianie danych badawczych innym osobom i instytucjom staje się coraz istotniejszym elementem krajobrazu nauki w Polsce i na  świecie. Mają na to wpływ naukowcy, którzy coraz częściej sami decydują się na udostępnienie swoich danych; redakcje czasopism naukowych, które wymagają od autorów udostępniania danych pozwalających na weryfikację twierdzeń zawartych w publikacji; a także instytucje  finansujące, które coraz częściej zobowiązanie do udostępnienia danych badawczych czynią elementem umów grantowych z beneficjentami. Dzięki udostępnianiu danych naukowcy zwiększają szanse na cytowanie  swoich publikacji i zbiorów danych, czasopisma mają lepszą renomę i wyższą jakość ukazujących się w nich artykułów, a instytucje finansujące dbają o racjonalność wydatkowania środków publicznych. 

Fragment broszury „Selekcja i przygotowanie danych badawczych do udostępniania” dostępnej w zakładce Pliki do pobrania

Rodzaje repozytoriów danych badawczych

Repozytoria danych badawczych, podobnie jak repozytoria publikacji, mogą mieć charakter dziedzinowy lub instytucjonalny, Mogą też łączyć funkcje obu typów, jeżeli prowadząca je instytucja zajmuje się badaniami w określonym obszarze lub prowadzi repozytorium z myślą o konkretnym projekcie badawczym.
Repozytoria dziedzinowe gromadzą dane z konkretnych obszarów wiedzy, co dla poszukujących danych użytkowników jest istotne. Przeszukiwanie właściwego repozytorium zwiększa bowiem prawdopodobieństwo znalezienia szybko interesujących danych.
Repozytoria instytucjonalne gromadzą dane badawcze wytworzone i  opracowanie przez pracowników konkretnej instytucji lub grantobiorców realizujących finansowane przez nią badania. Dla szukających danych naukowców mogą być przydatne zwłaszcza wtedy, gdy prowadząca repozytorium instytucja specjalizuje się w określonym obszarze. Dane badawcze deponowane są również w repozytoriach ogólnego przeznaczenia, takich jak Zenodo (https://zenodo.org) czy Figshare (https://figshare.com).

Fragment broszury „Jak korzystać z zasobów w repozytoriach danych” dostępnej w zakładce Pliki do pobrania


W ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych zostały utworzone i uruchomione trzy repozytoria. Repozytorium Danych Społecznych (RDS) oraz Macromolecular Xtallography Raw Data Repository (MX-RDR) mają charakter dziedzinowy, natomiast nowa wersja Repozytorium Otwartych Danych RepOD to repozytorium ogólnego przeznaczenia. Z repozytoriów korzystać mogą wszyscy polscy badacze, niezależnie od afiliacji instytucjonalnej.

O projekcie Dziedzinowe Repozytoria Otwartych Danych Badawczych w Biuletynie EBIB

W najnowszym numerze Biuletynu EBIB, w całości poświęconym otwartemu udostępnianiu danych badawczych, ukazał się artykuł na temat projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych. Przedstawiono w nim genezę, założenia, cele i planowane rezultaty projektu: trzy repozytoria funkcjonujące w oparciu o otwarte oprogramowanie Dataverse, a także opracowywane i sukcesywnie udostępniane zbiory danych badawczych z zakresu krystalografii, nauk społecznych i innych dziedzin. Artykuł przybliża ponadto program szkoleń z zarządzania danymi badawczymi, organizowanych w ramach projektu od jesieni 2019 roku.