Otwarte dane badawcze

Dane badawcze to wszelkie dane, które zostały zebrane, zaobserwowane bądź stworzone podczas procesu badawczego inne niż publikacje naukowe. Są one niezbędne do weryfikacji, analizy oraz oceny wyników badań naukowych. Mogą występować w różnych formatach cyfrowych lub analogowych, np. próbki biologiczne, zdjęcia, wypełnione ankiety, nagrania wywiadów, odczyty czujników, wyniki pomiarów, rezultaty eksperymentów, fiszki.

Otwarte dane badawcze

Otwarte dane badawcze (Open data)


Są to dane wytworzone w trakcie badań i użyte w pracy naukowej, udostępnione w trakcie lub po zakończeniu realizacji projektu, do których każdy bez ograniczeń ma swobodny i bezpłatny dostęp, zgodnie z zasadami FAIR. Powinny stanowić podstawę publikacji naukowej.

Zalety udostępniania danych :

  • możliwość weryfikacji lub replikacji badań naukowych;
  • zakończenie projektu nie oznacza zakończenia wykorzystywania danych badawczych;
  • standaryzacja danych  badawczych i metadanych;
  • uniknięcie powtórnego finansowania tych samych badań;
  • wzrost widoczności prowadzonych badań oraz zwiększenie cytowalności publikacji i zbiorów danych badawczych;
  • prezentacja informacji istotnych przy wyszukiwaniu członków krajowych i międzynarodowych zespołów badawczych, ekspertów, partnerów do projektów itp.

Zasady FAIR Data


  • Findable – dane powinny być możliwie do znalezienia;
  • Accessible – dane badawcze lub zespoły danych powinny być dostępne dzięki zastosowaniu określonych standardów do ich opisu, czyli metadanych;
  • Interoperable – interoperacyjność danych, zespołów danych lub metadanych umożliwia ich wymianę i wykorzystanie do celów naukowych nie tylko przez osoby, ale także w sposób maszynowy;
  • Reusable –  dane lub zbiory danych mogą być ponownie wykorzystane (dane są „wielokrotnego użytku").

Akty prawne, regulaminy



Poradniki


Plan Zarządzania Danymi


Plan Zarządzania Danymi (DMP) Dokument opisujący to, co będzie działo się z danymi w trakcie projektu badawczego i po jego zakończeniu. Ma on charakter „żywego dokumentu”, który może i powinien zmieniać się wraz ze zmianami pojawiającymi się w innych obszarach projektu badawczego. 

Sporządzenie planu zarządzania danymi coraz częściej stanowi wymóg instytucji finansujących. Niekiedy realizacja tego wymogu konieczna jest już na etapie przygotowania wniosku grantowego (tak jest np. w wypadku Narodowego Centrum Nauki), a niekiedy na początku realizacji projektu (np. sześć miesięcy od jego rozpoczęcia dla projektów finansowanych ze środków Komisji Europejskiej).

Wytyczne NCN dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI


Przykładowe Plany Zarządzania Danymi:


Praktyczne wskazówki dot. planu zarządzania danymi

Poradnik w wersji do pobrania


1. Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych


1.1 W jaki sposób będą pozyskiwane lub wytwarzane nowe dane lub ponownie wykorzystywane dane już istniejące?


Należy opisać: 

- dane badawcze, które zostaną wytworzone lub pozyskane na potrzeby projektu. Zarówno dane pierwotne (np. ankiety, kwestionariusze, zdjęcia, nagrania audio, notatki, oprogramowanie, próbki, rezultaty kwerend itp.), jak i wtórne (dane pochodzące z wcześniejszych badań, analiz lub dokumentów źródłowych (np. zbiory biblioteczne, archiwalne, akty prawne, dokumenty urzędowe, zestawienia, statystyki itp.).

- pochodzenie oraz sposoby pozyskania danych badawczych. W przypadku danych pierwotnych - kwerendy,  badania terenowe,  badania laboratoryjne,  eksperymenty, wywiady, obserwacje.
W przypadku danych wtórnych - podać źródło, z którego zostaną pozyskane oraz w jaki sposób będą dane opracowywane (np. w jakim programie).
Należy również sprawdzić, czy są to dane otwarte i na jakiej licencji są udostępnione. Czasami konieczne jest uzyskanie zgody lub podpisanie umowy określającej warunki korzystania.

 
Ważne:
- gdy w projekcie nie będą wytwarzane, na nowo wykorzystywane, ani poddawane analizie żadne dane badawcze - wymagane jest uzasadnienie. 

- gdy udostępnienie danych jest niemożliwe lub podlega ograniczeniom (np. z powodu klauzuli poufności, zasad bezpieczeństwa i dobra publicznego, prawa własności intelektualnej,  tajemnicy handlowej, kwestii etycznych, ochrony danych osobowych) -  wymagane jest uzasadnienie. 

 


1.2 Jakie dane (tj. rodzaje, formaty, objętości) będą pozyskiwane lub wytwarzane w projekcie?
 


Należy podać: 

- rodzaj danych (np. dane tekstowe, dane liczbowe, wyniki ankiety, kwestionariuszy, nagrania audio, wideo, zdjęcia, zawartość bazy danych, oprogramowanie, wyniki symulacji komputerowych); 

- format danych (np. odt, .csv, .wav, .avi, .pdf); 

- rozmiar danych (np. szt., MB, KB. Jeśli trudno go oszacować, należy taką informację zawrzeć w planie).

 

Ważne:
- wybierając format danych należy wybierać formaty otwarte. Pakiety Microsoft Office nie są formatami otwartymi, ponieważ jest to oprogramowanie płatne;

- jeśli dane są gromadzone w formatach zamkniętych, należy rozważyć konwersję do formatów otwartych (zalecanych przez NCN) przynajmniej tej części danych, które będą udostępnione w repozytorium.

 


2. Dokumentacja i jakość danych
 


2.1 Jakie metadane i dokumentacja (np. metodologia oraz sposoby pozyskiwania i organizacji danych) będą towarzyszyć danym w projekcie?
 


Należy:

- zaplanować organizację danych;

- w przypadku danych cyfrowych - opisać sposób porządkowania danych: foldery, nazwy plików, wersje, napisać w jakim standardzie będą tworzone metadane; 

- w przypadku danych papierowych - przechowywanie w teczkach/segregatorach, opisanych metadanymi (np. autor, tytuł, data powstania, słowa kluczowe itd.) wg ustalonego standardu dla danej dziedziny.  

  


2.2 Jakie planują Państwo zastosować środki kontroli jakości?
 


Należy opisać:

 - sposób kontroli jakości danych (kto będzie kontrolował jakość, wdrożone procedury laboratoryjne, kalibracja urządzeń, weryfikacja danych); 

- sposób zabezpieczenia danych przed nieuprawnioną modyfikacją (procedury autoryzacji dostępu, odzyskiwania danych, regulamin pracy w chmurze).


Ważne:
- w przypadku współpracy kilku instytucji, należy opisać jak będzie przebiegał proces kontroli jakości danych w każdej z nich.

 


3. Przechowywanie i tworzenie kopii zapasowych podczas badań
 


3.1 W jaki sposób w trakcie projektu będą przechowywane dane i metadane? W jaki sposób będą tworzone ich kopie zapasowe?
 


Należy opisać:

- gdzie będą przechowywane dane (np. dyski chronione hasłem, chmura);

- w jaki sposób będą tworzone kopie zapasowe (częstotliwość aktualizacji, podział obowiązków, proces automatyczny/ręcznie kontrolowany, środki bezpieczeństwa, kto będzie odpowiedzialny za tworzenie kopii zapasowych i odzyskiwanie danych?

 

Ważne:
- NCN zaleca tworzenie kopii zapasowych zgodnie z zasadą 3-2-1 (przechowuje się przynajmniej trzy kopie danych, w tym dwie kopie na różnych urządzeniach, z których jedno znajduje się w innej lokalizacji fizycznej); 
- nie powinno się przechowywać danych na płytach CD lub DVD; 
- w przypadku współpracy kilku naukowców lub instytucji, należy opisać proces przechowywania oraz wymiany danych między nimi.

 


3.2 W jaki sposób zostanie zapewnione bezpieczeństwo i ochrona danych wrażliwych w okresie trwania projektu?
 


Jeśli dane wrażliwe:

- nie będą przetwarzane - należy napisać taką informację (np. W projekcie nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych wrażliwych);

- będą przetwarzane - należy opisać gdzie będą przechowywane, w jaki sposób będą chronione przed nieuprawnionym dostępem, czy dane umożliwiające identyfikację zostaną zanonimizowane lub spseudonimizowane? A jeśli tak, to gdzie będzie przechowywany skrypt szyfrów do danych spseudonimizowanych? (NCN zaleca inne pomieszczenie niż to, gdzie będą przechowywane dane), kto będzie miał do nich dostęp.

 

Ważne:
- w przypadku wątpliwości dotyczących przetwarzania danych wrażliwych warto skontaktować się z uczelnianym Inspektorem Ochrony Danych. Informację o konsultacji należy umieścić w planie;
- kwestie prawne dot. polityki bezpieczeństwa informacji na UWM reguluje Zarządzenie Nr 36/2018 Rektora Uniwersytetu Warmińsko-Mazurskiego w Olsztynie z dnia 28 maja 2018 roku w sprawie Polityki Bezpieczeństwa Informacji Uniwersytetu Warmińsko-Mazurskiego w Olsztynie;

- jeśli stosujemy anonimizację lub pseudonimizację należy wskazać, gdzie będzie przechowywany skrypt szyfrów do danych. NCN zaleca inne pomieszczenie niż to, gdzie będą przechowywane dane;
- w przypadku współpracy kilku instytucji należy opisać procedurę postępowania z danymi wrażliwymi w każdej z nich.

 


4. Wymogi prawne, kodeks postępowania
 


4.1 Jeżeli będzie miało miejsce przetwarzanie danych osobowych, w jaki sposób zostanie zapewniona zgodność z przepisami dotyczącymi danych osobowych oraz ich ochrony?
 


Jeśli dane osobowe:

- nie będą przetwarzane - należy napisać taką informację (np. W projekcie nie przewiduje się konieczności zbierania, gromadzenia oraz przechowywania danych osobowych);

- będą przetwarzane - konieczne będzie uzyskanie świadomej zgody uczestników na utrwalanie i udostępnianie ich danych osobowych. W przypadku pseudonimizacji lub anonimizacji danych należy wyjaśnić, jak będzie przebiegał ten proces.
 


Ważne:
- w przypadku wątpliwości dotyczących przetwarzania danych osobowych warto skontaktować się z uczelnianym Inspektorem Ochrony Danych. Informację o konsultacji należy umieścić w planie;
- kwestie prawne dot. polityki bezpieczeństwa informacji na UWM reguluje Zarządzenie Nr 36/2018 Rektora Uniwersytetu Warmińsko-Mazurskiego w Olsztynie z dnia 28 maja 2018 roku w sprawie Polityki Bezpieczeństwa Informacji Uniwersytetu Warmińsko-Mazurskiego w Olsztynie.

 


4.2 W jaki sposób planują Państwo zapewnić zgodność z innymi przepisami, takimi jak prawa własności intelektualnej i prawa własności? Jakie przepisy znajdują w tym przypadku zastosowanie?
 


Należy wskazać:

- właściciela praw własności intelektualnej;

- przepisy dotyczące praw własności intelektualnej obowiązujące na UWM - UCHWAŁA Nr 787 Senatu Uniwersytetu Warmińsko-Mazurskiego w Olsztynie z dnia 25 września 2015 roku zmieniająca uchwałę w sprawie wprowadzenia Regulaminu zarządzania prawami autorskimi i prawami pokrewnymi oraz prawami własności przemysłowej oraz zasad komercjalizacji 

- na jakiej licencji zostaną udostępnione dane w repozytorium (zgodnie z wytycznymi NCN dane badawcze powinny zostać udostępnione na licencji Creative Commons: CC0 lub CC BY).

 

Ważne:
- w przypadku współpracy kilku instytucji konieczne będzie podpisanie wspólnej umowy dotyczącej praw własności intelektualnej.

 


5. Udostępnianie i długotrwałe przechowywanie danych
 


5.1 Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy istnieją ewentualne ograniczenia i zakazy dotyczące ich udostępniania?
 


Należy wskazać:

- planowany termin udostępnienia danych (nie artykułu powstałego w wyniku projektu) - wg zaleceń NCN powinno to nastąpić najpóźniej w momencie publikacji wyników badań naukowych;

- przez jaki czas dane będą przechowywane - NCN zaleca 10 lat;

- ewentualne ograniczenia w udostępnianiu danych - należy opisać jakie dane i z jakich powodów nie zostaną udostępnione, kto będzie mógł korzystać z udostępnionych danych.

 

Ważne:

Danych można nie udostępniać tylko w przypadku, gdy:

- w projekcie przetwarzane są dane osobowe lub dane wrażliwe, a niemożliwa jest ich anonimizacja/pseudonimizacja,

- przewidziana jest komercjalizacja wyników badań, 

- zostały podpisane umowy (np. z firmami) zakazujące udostępniania danych. 

- w projekcie przetwarzane są dane mające wagę państwową np. dotyczące bezpieczeństwa państwowego.

 


5.2 Jak będzie wyglądać selekcja danych przeznaczonych do utrwalenia i gdzie będą one długoterminowo przechowywane (np. w repozytorium danych, archiwum)?
 


Należy opisać:

- jakie dane zostaną udostępnione w repozytorium, a jakie będą długotrwale przechowywane lub zniszczone. Nie trzeba udostępniać wszystkiego - jednak należy uzasadnić swój wybór. NCN zaleca, aby do udostępnienia wybrać takie dane, które będą weryfikowały i potwierdzały wnioski zawarte w publikacji towarzyszącej;

- w jakim repozytorium danych badawczych dane zostaną udostępnione.

Na UWM funkcjonuje Repozytorium Danych Badawczych UWM, w którym można zdeponować dane badawcze bezpłatnie, zgodnie z zasadami FAIR. Repozytorium zapewnia nr DOI do każdego zestawu danych.

 


5.3 Jakie metody lub oprogramowanie umożliwiają dostęp do danych i korzystanie z danych?
 


Należy opisać:

- w jakim formacie zostaną udostępnione dane;

- czy będzie potrzebny sprzęt lub specjalistyczne oprogramowanie do odczytu danych.


Ważne:
- wybierając format danych należy wybierać formaty otwarte. Pakiety Microsoft Office nie są formatami otwartymi, ponieważ jest to oprogramowanie płatne.
- jeśli dane przeznaczone do udostępnienia są w formatach zamkniętych, należy rozważyć konwersję do formatów otwartych (np. csv, pdf, odt, avi, jpeg).

 


5.4 W jaki sposób zagwarantują Państwo stosowanie unikalnego i trwale przypisanego identyfikatora (takiego jak cyfrowy identyfikator dokumentu elektronicznego (DOI) dla każdego zbioru danych?
 

 

Należy wybrać repozytorium, które zapewni trwały identyfikator cyfrowy DOI.

Na UWM funkcjonuje Repozytorium Danych Badawczych UWM, w którym można zdeponować dane badawcze bezpłatnie, zgodnie z zasadami FAIR. Repozytorium zapewnia nr DOI do każdego zestawu danych.

 


6. Zadania związane z zarządzaniem danymi oraz zasoby
 


6.1 Kto będzie odpowiadał za zarządzanie danymi (tj. kto będzie ich opiekunem)?
 


Należy opisać:

- kto będzie odpowiedzialny za zarządzanie danymi badawczymi, za gromadzenie, selekcję, przechowywanie, tworzenie kopii zapasowych, archiwizację i udostępnianie. Jeśli będzie to więcej niż jedna osoba należy opisać role i obowiązki związane z zarządzaniem.


Ważne:

W przypadku współpracy kilku instytucji należy opisać sposób koordynacji działań w zakresie zarzadzania danymi.

 


6.2 Jakie zasoby zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR? (Jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie? W jaki sposób zostaną opłacone?)
 


Należy opisać:

- czy zarządzanie danymi badawczymi w projekcie będzie generowało dodatkowe koszty (np. zakup sprzętu, dysków zewnętrznych do kopii zapasowych lub usługa digitalizacji). Jeśli tak, należy to zaplanować w ramach kosztów bezpośrednich i ująć w kosztorysie;

- jeśli projekt nie będzie generował dodatkowych kosztów związanych z udostępnianiem danych, również należy taką informację podać.

 

 

Udostępnianie

Gdzie udostępniać dane badawcze


  • Znalezienie odpowiedniego repozytorium ułatwią bazy gromadzące informacje o istniejących serwisach, np.:
    - baza Registry of Research Data Repositories - gromadzi informacje o repozytoriach danych badawczych z całego świata.
    - baza OpenDOAR – znaleźć w niej można informacje o repozytoriach danych badawczych, ale też o repozytoriach publikacji czy bibliotekach cyfrowych.

  • Repozytorium Danych Badawczych UWM 

Dane badawcze zamieszczane są w repozytorium przez redaktora BU po przekazaniu mu przez autora odpowiedniej wersji zestawu danych, wypełnieniu formularza (zał. nr 2) i złożeniu oświadczenia o udzieleniu licencji (zał. nr 6).
Załącznik nr 2 : formularz danych badawczych
Załącznik nr 6 : zdeponowanie w Bazie Wiedzy UWM danych badawczych

Dział Informacji Naukowej, ul. Oczapowskiego 12B, piętro 1, bibliografia@uwm.edu.pl


Licencje udostępniania


Dane badawcze powinny być udostępniane na podstawie licencji określającej warunki korzystania. Od tego zależy ich dostępność i możliwość dalszego wykorzystania.

NCN dopuszcza publikowanie danych badawczych jedynie w oparciu o licencję Creative Commons Domena Publiczna (CC0) lub Creative Commons Uznanie Autorstwa (CC BY).

Creative Commons Domena Publiczna (CC0) - oznacza przekazanie utworu do domeny publicznej. Utwór taki można wykorzystywać, rozpowszechniać i zmieniać, nawet w celach komercyjnych, bez konieczności uzyskania zgody autora.

Creative Commons Uznanie Autorstwa (CC BY) - Licencja ta pozwala na kopiowanie, zmienianie, rozprowadzanie, przedstawianie i wykonywanie utworu jedynie pod warunkiem oznaczenia autorstwa.

Konsultacje


Konsultacje w zakresie Planu Zarządzania Danymi na etapie składania projektów do Narodowego Centrum Nauki:

Biblioteka Uniwersytecka UWM w Olsztynie
Dział Informacji Naukowej, ul. Oczapowskiego 12B, piętro 1
tel. 89 523 49 57, 89 524 63 08

mgr Monika Bartnik, monika.bartnik@uwm.edu.pl
mgr Joanna Suchto, joanna.suchto@uwm.edu.pl

Prosimy o przesyłanie do konsultacji planów w języku polskim.