Kolekcje instytucjonalne w Repozytorium Otwartych Danych RepOD

Z Repozytorium Otwartych Danych RepOD korzystać mogą zarówno indywidualni badacze, jak i instytucje naukowe. Serwis umożliwia tworzenie kolekcji instytucjonalnych gromadzących w jednym miejscu dane wytwarzane w ramach badań prowadzonych w polskich uczelniach lub instytutach oraz udostępnianie ich zgodnie ze światowymi standardami, między innymi zasadami FAIR.

Instytucje naukowe sprawują nadzór merytoryczny nad swoimi kolekcjami, współpracując przy ich prowadzeniu z ICM UW. Założenie i prowadzenie kolekcji jest bezpłatne. Porozumienia w tym zakresie zawarto już z Uniwersytetem Mikołaja Kopernika w Toruniu, Akademią Leona Koźmińskiego, Uniwersytetem Przyrodniczym w Poznaniu, Uniwersytetem Szczecińskim, Politechniką Lubelską, Międzynarodowym Instytutem Biologii Molekularnej i Komórkowej w Warszawie, Instytutem Slawistyki Polskiej Akademii Nauk oraz Centrum Materiałów Polimerowych i Węglowych Polskiej Akademii Nauk. Odpowiednie kolekcje będą tworzone i uruchamiane w nadchodzących miesiącach.

Repozytorium Danych Społecznych (RDS)

Do czego służy repozytorium?
Repozytorium Danych Społecznych (RDS), dziedzinowe repozytorium powstałe w ramach projektu, służy do archiwizacji i udostępnienia wszelkiego typu danych społecznych, zarówno ilościowych, jak i jakościowych.

Kto może korzystać z repozytorium?
Korzystanie z repozytorium jest bezpłatne i otwarte dla wszystkich zainteresowanych. Z repozytorium korzystać mogą naukowcy chcący udostępnić dane badawcze lub przeprowadzić wtórną analizę danych, nauczyciele akademiccy zainteresowani wykorzystaniem danych w dydaktyce, a także inne osoby z różnych względów poszukujące danych społecznych.

Jak korzystać z repozytorium?
Zasoby widoczne są na stronie i można je swobodnie przeszukiwać i przeglądać bez zakładania konta. Deponowanie danych możliwe jest dla zarejestrowanych użytkowników. Rejestracja w repozytorium jest szybka i bezpłatna.

Kolekcje i zasoby repozytorium

 • Archiwum Danych Jakościowych jest najstarszym polskim archiwum cyfrowym gromadzącym, opracowującym i udostępniającym materiały pochodzące ze społecznych badań jakościowych. Archiwum prowadzi Instytut Filozofii i Socjologii Polskiej Akademii Nauk.
 • Polskie Archiwum Danych Społecznych powołane zostało w celu opracowywania standardów archiwizacji i udostępniania danych pochodzących z badań społecznych o charakterze ilościowym. Archiwum jest wspólnym przedsięwzięciem Instytutu Studiów Społecznych im. prof. Roberta Zajonca Uniwersytetu Warszawskiego i Instytutu Filozofii i Socjologii Polskiej Akademii Nauk.

Funkcje wyróżniające repozytorium RDS

 • schemat metadanych dla nauk społecznych,
 • wybrane słowniki CESSDA (Consortium of European Social Science Data Archives).

Pozostałe funkcje repozytorium

 • zdeponowane dane otrzymują numer DOI (Digital Object Identifier), który zostaje wstępnie przypisany do zestawu podczas deponowania, jeszcze przed publikacją,
 • deponujący ma możliwość ustawienia embargo (maksymalnie 36 miesięcy);
 • opcja wersjonowania umożliwia zdeponowanie kolejnych wersji zbioru, uwzględniających zmiany lub poprawki;
 • w metadanych można wskazać informacje na temat źródła finansowania: instytucji finansującej, programie grantowym, numerze grantu;
 • dane mogą zostać powiązane z innymi obiektami cyfrowymi: publikacjami bądź innymi zestawami danych, dla których wskazać można odpowiedni identyfikator;
 • dla poszczególnych plików w zbiorze danych wybrać można odpowiednie licencje i warunki użycia;
 • na stronie rekordu znajduje się sugerowana forma cytowania danych, można także pobrać dane bibliograficzne zbioru w formatach EndNote XML, RIS i BibTEX.

Gdzie szukać więcej informacji?

Warunki korzystania z Repozytorium Danych Społecznych opisane są w regulaminie repozytorium. Dodatkowe informacje na temat serwisu oraz kolekcji znaleźć można w witrynach informacyjnych prowadzonych przez Polskie Archiwum Danych Społecznych i Archiwum Danych Jakościowych. Instrukcja korzystania z repozytorium dostępna jest w serwisie YouTube.

Macromolecular Xtallography Raw Data Repository (MX-RDR)

Macromolecular Xtallography Raw Data Repository (MX-RDR) to repozytorium dziedzinowe, które powstało w ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych. Repozytorium jest prowadzone przez ICM UW oraz zespół projektowy w Zakładzie Krystalografii UAM w Poznaniu.

Do czego służy repozytorium?
Repozytorium MX-RDR służy do archiwizacji i udostępniania surowych danych dyfrakcyjnych zarejestrowanych dla kryształów makromolekuł. Dane te rejestrowane są głównie na liniach krystalograficznych w dużych ośrodkach synchrotronowych lub przy wykorzystaniu dyfraktometrów i innych źródeł promieniowania rentgenowskiego. Deponować można wszystkie zestawy dyfrakcyjne, nawet takie, które nie były z różnych względów wykorzystane do badań, a powinny być zachowane.

Kto może korzystać z repozytorium?
Korzystanie z repozytorium jest bezpłatne i otwarte dla wszystkich zainteresowanych. Z repozytorium korzystać mogą naukowcy chcący udostępnić dane badawcze, ale także osoby poszukujące danych krystalograficznych.

Jak korzystać z repozytorium?
Zasoby widoczne są na stronie i można je swobodnie przeszukiwać, przeglądać i pobierać bez zakładania konta. Deponowanie danych możliwe jest dla zarejestrowanych użytkowników. Rejestracja w repozytorium jest szybka i bezpłatna.

Funkcje wyróżniające repozytorium MX-RDR

 • możliwość automatycznego uzupełnienia części metadanych na podstawie nagłówków obrazów dyfrakcyjnych, informacji zawartych w bazie PDB, plików w formacie cif oraz XDS;
 • schemat metadanych krystalograficznych.

Pozostałe funkcje repozytorium

 • zdeponowane dane otrzymują numer DOI (Digital Object Identifier), który zostaje wstępnie przypisany do zestawu podczas deponowania, jeszcze przed publikacją,
 • deponujący ma możliwość ustawienia embargo (maksymalnie 36 miesięcy);
 • opcja wersjonowania umożliwia zdeponowanie kolejnych wersji zbioru, uwzględniających zmiany lub poprawki;
 • w metadanych można wskazać informacje na temat źródła finansowania: instytucji finansującej, programie grantowym, numerze grantu;
 • dane mogą zostać powiązane z innymi obiektami cyfrowymi: publikacjami bądź innymi zestawami danych, dla których wskazać można odpowiedni identyfikator;
 • dla poszczególnych plików w zbiorze danych wybrać można odpowiednie licencje i warunki użycia;
 • na stronie rekordu znajduje się sugerowana forma cytowania danych, można także pobrać dane bibliograficzne zbioru w formatach EndNote XML, RIS i BibTEX.

Gdzie szukać więcej informacji?

Warunki korzystania z Macromolecular Xtallography Raw Data Repository (MX-RDR) opisane są w regulaminie repozytorium.

Repozytorium Otwartych Danych RepOD

Repozytorium Otwartych Danych RepOD to jedno z trzech repozytoriów stworzonych i uruchomionych w ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych. Obecna wersja serwisu zastąpiła wersję pilotażową, która działała od 2015 roku jako repozytorium dla tzw. małych danych, powstających w trakcie prac badawczych prowadzonych przez pojedynczych naukowców lub niewielkie zespoły naukowe. Obecnie repozytorium działa w oparciu o oprogramowanie Dataverse.

Do czego służy repozytorium?
Jako repozytorium ogólnego przeznaczenia służy do otwartego udostępniania wszystkich typów danych badawczych wytworzonych, zebranych lub opisanych na potrzeby działalności naukowej.

Kto może korzystać z repozytorium?
Korzystanie z repozytorium jest bezpłatne i otwarte dla wszystkich zainteresowanych. Z repozytorium korzystać mogą naukowcy chcący udostępnić dane badawcze, ale także osoby poszukujące danych: dziennikarze, pracownicy administracji publicznej i organizacji pozarządowych, przedsiębiorcy i wszyscy obywatele.

Jak korzystać z repozytorium?
Zasoby widoczne są na stronie i można je swobodnie przeszukiwać, przeglądać i pobierać bez zakładania konta. Deponowanie danych możliwe jest dla zarejestrowanych użytkowników.

Najważniejsze funkcje repozytorium:

 • zdeponowane dane otrzymują numer DOI (Digital Object Identifier), który zostaje wstępnie przypisany do zestawu podczas deponowania, jeszcze przed publikacją
 • deponujący ma możliwość ustawienia embargo (maksymalnie 36 miesięcy);
 • opcja wersjonowania umożliwia zdeponowanie kolejnych wersji zbioru, uwzględniających zmiany lub poprawki;
 • w metadanych można wskazać informacje na temat źródła finansowania: instytucji finansującej, programie grantowym, numerze grantu;
 • dane mogą zostać powiązane z innymi obiektami cyfrowymi: publikacjami bądź innymi zestawami danych, dla których wskazać można odpowiedni identyfikator;
 • dla poszczególnych plików w zbiorze danych wybrać można odpowiednie licencje i warunki użycia;
 • na stronie rekordu znajduje się sugerowana forma cytowania danych, można także pobrać dane bibliograficzne zbioru w formatach EndNote XML, RIS i BibTEX.

Gdzie szukać więcej informacji?
Warunki korzystania z Repozytorium Otwartych Danych RepOD opisane są w regulaminie repozytorium. Dodatkowe informacje na temat serwisu znaleźć można w witrynie informacyjnej.

Zasady FAIR w repozytoriach danych badawczych

FAIR to akronim słów „findable” (możliwy do znalezienia), „accessible” (dostępny), „interoperable” (interoperacyjny) i „reusable” (możliwy do ponownego wykorzystania). Termin ten określa zasady, jakie należy uwzględnić w zarządzaniu danymi badawczymi oraz ich otwartym udostępnianiu. Każda z nich ma charakter ogólnych wytycznych, które można realizować poprzez szczegółowe rozwiązania, zarówno na etapie przygotowania, jak na etapie udostępniania danych.

Repozytoria mogą umożliwiać lub ułatwiać wdrażanie zasad FAIR m.in. poprzez nadanie zestawom danych trwałych identyfikatorów, konieczność wprowadzenia opisujących dane metadanych czy możliwość udostępnienia danych wraz z metadanymi i dokumentacją na wolnych licencjach wskazanych bądź wybranych z listy przez użytkownika.

Zasady FAIR sformułowane zostały z myślą o budowaniu i rozwijaniu technicznego ekosystemu, w którym poprzez różnego rodzaju powiązane ze sobą serwisy i infrastruktury możliwe będzie wyszukiwanie, łączenie, analizowanie czy ponowne wykorzystanie danych badawczych. Opcje te mają być dostępne nie tylko dla ludzi, ale i dla maszyn, dlatego tak istotne jest odpowiednie wdrażanie zasad FAIR i stosowanie standardowych rozwiązań wszędzie tam, gdzie to możliwe.

Zasady FAIR są ponadto istotnym elementem wymogów w zakresie udostępniania danych badawczych w politykach otwartości instytucji finansujących badania naukowe (np. programy ramowe Komisji Europejskiej, wytyczne Narodowego Centrum Nauki) oraz w raportach, rekomendacjach i innych dokumentach określających strategiczne cele związane z rozwojem infrastruktury otwartej nauki w Europie.

Więcej o zarządzaniu danymi badawczymi zgodnie z zasadami FAIR przeczytać można w broszurze „Selekcja i przygotowanie danych badawczych do udostępnienia” opracowanej w ramach projektu i dostępnej w zakładce Pliki do pobrania.

Kwestie prawne na etapie planowania projektu badawczego

Na etapie planowania projektu badawczego kluczowa jest identyfikacja wszystkich kwestii oraz ryzyk prawnych, gdyż wiele z nich na późniejszym etapie może być bardzo trudno rozwiązać bez uprzedniego przygotowania. Niekiedy upływ czasu lub dalszy rozwój projektu może nawet spowodować, że rozwiązanie części z nich będzie niemożliwe.
Zaplanowanie działań projektowych od strony prawnej wymaga dobrej orientacji we wszystkich aspektach prawnych, z  którymi projekt może się wiązać, a z drugiej strony – dobrej merytorycznej znajomości projektu.

Fragment broszury „Prawne aspekty otwierania danych badawczych – poradnik” dostepnej w zakładce Pliki do pobrania.

Dlaczego warto udostępniać dane badawcze?

Udostępnianie danych badawczych innym osobom i instytucjom staje się coraz istotniejszym elementem krajobrazu nauki w Polsce i na świecie. Mają na to wpływ naukowcy, którzy coraz częściej sami decydują się na udostępnienie swoich danych; redakcje czasopism naukowych, które wymagają od autorów udostępniania danych pozwalających na weryfikację twierdzeń zawartych w publikacji; a także instytucje finansujące, które coraz częściej zobowiązanie do udostępnienia danych badawczych czynią elementem umów grantowych z beneficjentami. Dzięki udostępnianiu danych naukowcy zwiększają szanse na cytowanie swoich publikacji i zbiorów danych, czasopisma mają lepszą renomę i wyższą jakość ukazujących się w nich artykułów, a instytucje finansujące dbają o racjonalność wydatkowania środków publicznych.

Fragment broszury „Selekcja i przygotowanie danych badawczych do udostępniania” dostępnej w zakładce Pliki do pobrania

Rodzaje repozytoriów danych badawczych

Repozytoria danych badawczych, podobnie jak repozytoria publikacji, mogą mieć charakter dziedzinowy lub instytucjonalny, Mogą też łączyć funkcje obu typów, jeżeli prowadząca je instytucja zajmuje się badaniami w określonym obszarze lub prowadzi repozytorium z myślą o konkretnym projekcie badawczym.
Repozytoria dziedzinowe gromadzą dane z konkretnych obszarów wiedzy, co dla poszukujących danych użytkowników jest istotne. Przeszukiwanie właściwego repozytorium zwiększa bowiem prawdopodobieństwo znalezienia szybko interesujących danych.
Repozytoria instytucjonalne gromadzą dane badawcze wytworzone i  opracowanie przez pracowników konkretnej instytucji lub grantobiorców realizujących finansowane przez nią badania. Dla szukających danych naukowców mogą być przydatne zwłaszcza wtedy, gdy prowadząca repozytorium instytucja specjalizuje się w określonym obszarze. Dane badawcze deponowane są również w repozytoriach ogólnego przeznaczenia, takich jak Zenodo (https://zenodo.org) czy Figshare (https://figshare.com).

Fragment broszury „Jak korzystać z zasobów w repozytoriach danych” dostępnej w zakładce Pliki do pobrania


W ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych zostały utworzone i uruchomione trzy repozytoria. Repozytorium Danych Społecznych (RDS) oraz Macromolecular Xtallography Raw Data Repository (MX-RDR) mają charakter dziedzinowy, natomiast nowa wersja Repozytorium Otwartych Danych RepOD to repozytorium ogólnego przeznaczenia. Z repozytoriów korzystać mogą wszyscy polscy badacze, niezależnie od afiliacji instytucjonalnej.

O projekcie Dziedzinowe Repozytoria Otwartych Danych Badawczych w Biuletynie EBIB

W najnowszym numerze Biuletynu EBIB, w całości poświęconym otwartemu udostępnianiu danych badawczych, ukazał się artykuł na temat projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych. Przedstawiono w nim genezę, założenia, cele i planowane rezultaty projektu: trzy repozytoria funkcjonujące w oparciu o otwarte oprogramowanie Dataverse, a także opracowywane i sukcesywnie udostępniane zbiory danych badawczych z zakresu krystalografii, nauk społecznych i innych dziedzin. Artykuł przybliża ponadto program szkoleń z zarządzania danymi badawczymi, organizowanych w ramach projektu od jesieni 2019 roku.

Dlaczego warto korzystać z repozytoriów danych badawczych?

Otwarte repozytoria jako narzędzia informatyczne służące do przechowywania i udostępniania wyników badań naukowych są tworzone z uwzględnieniem zasad otwartej komunikacji naukowej oraz potrzeb indywidualnych badaczy i instytucji naukowych. Obejmują zatem odpowiednie rozwiązania w zakresie bezpiecznego, trwałego przechowywania zasobów, ich stałej dostępności i widoczności w Internecie czy łatwości wyszukiwania i cytowania. Aktualnie w tworzeniu i rozwijaniu infrastruktury repozytoryjnej uwzględniane są także zasady FAIR (Findable – Accessible – Interoperable – Reusable), które mają umożliwiać jak najszerszy zakres ponownego wykorzystania danych badawczych.

Deponowanie zestawu danych w repozytorium wymaga podania metadanych, czyli danych opisujących właściwe dane. Podstawowy zestaw metadanych obejmuje między innymi informacje o autorze lub autorach oraz tytule zbioru. Wraz z datą jego powstania i trwałym identyfikatorem, metadane te stanowią zarazem informacje potrzebne do jednoznacznej identyfikacji i zacytowania zbioru. Większość repozytoriów automatycznie nadaje deponowanym w nich zestawom danych trwałe identyfikatory, np. DOI (Digital Object Identifier). Stałe i unikalne w skali światowej oznaczenia obiektów cyfrowych umożliwiają nie tylko uzyskanie podstawowych informacji na ich temat (czyli właśnie metadanych), ale także wskazanie ich aktualnego adresu w sieci czy powiązanie z innymi obiektami, np. artykułami naukowymi.

Zarówno odpowiednie metadane, jak i trwałe identyfikatory są elementami ułatwiającymi wdrażanie zasad FAIR, w szczególności zasady F – Findable, która określa możliwość łatwego wyszukania i zidentyfikowania odpowiednich danych. Im bogatsze metadane, tym łatwiejsze staje się wyszukiwanie odpowiednich danych, dlatego też – tam gdzie to możliwe – warto korzystać z repozytoriów dziedzinowych, które mogą wdrażać odpowiednie standardy, takie jak np. słowniki kontrolowane.

Trwałe identyfikatory ułatwiają ponadto cytowanie danych badawczych, które stanowią pełnoprawne rezultaty badań i powinny być wskazywane wszędzie tam, gdzie posłużyły za podstawę jakichś wniosków czy ustaleń. Strona (rekord) z odpowiednim zestawem danych zawiera zwykle sugerowaną formę cytowania, obejmującą podstawowe informacje o danych oraz trwały identyfikator. Formułę tę wystarczy skopiować i wkleić do pliku tekstowego z powstającym artykułem, notatkami czy bibliografią. Osoby korzystające z aplikacji do zarządzania bibliografią i przypisami bibliograficznymi mogą skorzystać także z opcji wyeksportowania pliku z rekordem bibliograficznym w wybranym formacie, np. BibTex czy RIS.

Repozytoria ułatwiają też wywiązanie się z obowiązków wobec instytucji finansujących badania naukowe, które coraz częściej przedstawiają rekomendacje bądź wymogi w zakresie sposobu otwartego udostępniania danych badawczych.