Wat is datamanagement?

Research Data Management (RDM) is de organisatie van het verzamelen of creëren, analyseren, opslaan, delen, archiveren en publiceren van onderzoeksdata. Onder onderzoeksdata verstaan we alle informatie of materialen die zijn verzameld, gegenereerd, verwerkt of geanalyseerd om onderzoeksbevindingen te ondersteunen of te beschrijven. Dit omvat zowel ruwe data (de onbewerkte vorm van brongegevens) als de bewerkte versies van data die gebruikt zijn voor analyse in onderzoek. Voorbeelden van onderzoeksdata zijn interviews en transcripties, geluids- en video-opnamen, afbeeldingen, codes en resultaten van computersimulatie, metingen van instrumenten, en geografische coördinaten.

 

Het doel van RDM is om het beheer van data in je onderzoek zo gemakkelijk, veilig, en efficiënt mogelijk te maken. Een goede planning is hierbij de belangrijkste eerste stap. Dit helpt je ook om te voldoen aan bijvoorbeeld de geldende wetgeving en aan de eisen van de subsidiegever.

Het belang van goed datamanagement

Voldoen aan wetgeving en ethische richtlijnen:
  • Door je onderzoek zo vorm te geven dat het aan de ethische richtlijnen voldoet
  • En door het zorgvuldig beschermen van de privacy van je onderzoekspersonen
Vergroten van je impact:
  • Door het delen en opnieuw gebruiken van data voor verder onderzoek
  • En het vergroten van de vindbaarheid en zichtbaarheid van je werk door het citeren van onderzoeksdata 
Transparantie:
  • Door je onderzoek verifieerbaar en repliceerbaar te maken
  • En collega's inzicht te bieden in hoe je tot onderzoeksresultaten bent gekomen
Goede samenwerking met bedrijven:
  • Door op een veilige manier te werken met bedrijfsgevoelige informatie
  • En op tijd na te denken hoe er met intellectueel eigendom in het onderzoek wordt omgegaan
Tijdbesparing:
  • Door met metadatering en versiebeheer samenwerking makkelijk te maken
  • En door zorgvuldige documentatie en archivering voorkomen dat data onbruikbaar wordt of kwijtraakt
Voldoen aan voorwaarden subsidiegevers:
  • Door je data zo FAIR mogelijk beschikbaar te stellen
  • En hergebruik door andere onderzoekers en studenten mogelijk te maken

FAIR data

Steeds meer onderzoeksinstellingen, subsidiegevers en overheden geven aan te werken volgens de FAIR-principes van datamanagement. Deze houden in dat data Findable, Accessible, Interoperable en Reusable zijn, oftewel vindbaar, toegankelijk, interoperabel/uitwisselbaar en herbruikbaar. De FAIR-principes zijn van toepassing op de data zelf, de metadata (informatie over de data), en de infrastructuur (repository) waarin de data wordt ontsloten. 

 

De ambitie aan de Hanzehogeschool Groningen is om data zo FAIR mogelijk te maken. De FAIR-principes zijn erop gericht dat data dusdanig wordt vastgelegd, beheerd en bewaard, dat deze in de loop van tijd raadpleegbaar blijven, toegankelijk zijn en authentiek (origineel) blijven. Het uiteindelijke doel hiervan is de mogelijkheid om de data te kunnen gebruiken voor verder onderzoek en het uitbreiden van de bestaande kennis. 

 

Findable (Vindbaar): de data moeten vindbaar zijn voor anderen. Metadata en onderzoeksdata zouden gemakkelijk vindbaar moeten zijn voor mensen en computers (systemen). Computer- en systeem-leesbare metadata zijn essentieel voor automatische vindbaarheid van data. 

Accessible (Toegankelijk):  data moeten duurzaam opgeslagen zijn, eenvoudig toegankelijk (authenticatie en authorisatie) en downloadbaar zijn en voorzien zijn van een heldere gebruikslicentie. 

Interoperable (Interoperabel/uitwisselbaar): De data zouden gecombineerd moeten kunnen worden met andere data. De data zouden geschikt gemaakt moeten worden om uitgewisseld te kunnen worden met andere platformen/software/applicaties of werkwijzen voor analyse, opslag en bewerking.

Reusable (Herbruikbaar):  Het ultieme doel van FAIR is om de herbruikbaarheid van data te optimaliseren. Om dit te bereiken worden de metadata en de data goed beschreven, zodat zij gereproduceerd en/of gecombineerd kunnen worden in verschillende omgevingen.

Een veelkomend misverstand is dat FAIR data een synoniem is voor open data. Echter, om data FAIR beschikbaar te maken, hoeft deze niet altijd open toegankelijk te zijn voor iedereen. Sterker nog, in bepaalde situaties is dit juist af te raden, bijvoorbeeld bij privacygevoelige data. Ook kan het wenselijk zijn om data nog niet publiek toegankelijk te maken wanneer er binnen het project nog vervolgonderzoek wordt gedaan of als er meerdere dataverzamelingsrondes zullen plaatsvinden. Als je data beschikbaar stelt in een online data repository, heb je vaak de mogelijkheid om de toegang tot de data af te sluiten. Derden kunnen de data dan niet zomaar downloaden, maar kunnen bijvoorbeeld alleen toegang tot de data aanvragen. Hierbij houdt je zelf de controle over wie de data kan gebruiken.

 

Het leidende motto bij FAIR data is daarom: 

 

"Zo open als mogelijk, zo gesloten als nodig."

Inhoud van deze Library Guide

Deze Library Guide heeft als doel inzicht te geven in de verschillende ethische, juridische, maar ook praktische uitdagingen waar je in het werken met onderzoeksdata mee te maken kunt krijgen. Daarnaast biedt deze Guide handreikingen over hoe je datamanagement zo kunt inrichten dat je onderzoek op een goede manier verloopt. Dit is ingedeeld per onderzoeksfase.

 

Klik op de links hieronder of ga zelf naar het keuzemenu onder de desbetreffende tab. 

Research Data Management Voorbereiding & planning Tijdens het onderzoek Na het onderzoek

 

Begrippenlijst

Onderzoeksdata. Als je onderzoek doet, heb je vaak gegevens nodig die je analyseert om je onderzoeksvraag te beantwoorden. Dit zijn onderzoeksdata. Onderzoeksdata kunnen kwantitatief van aard zijn, zoals aantallen en metingen, of kwalitatief, zoals audio- en video-opnamen.

Ruwe data is de onbewerkte, oorspronkelijke versie van de data. Ook wel bronmateriaal genoemd.

Bewerkte data zijn data waaraan bewerkingen zijn toegevoegd, bijvoorbeeld datasets die zijn opgeschoond en klaargemaakt voor analyse.

Datamanagement. Datamanagement is de organisatie van het verzamelen of genereren, opslaan, delen, analyseren, archiveren en publiceren van onderzoeksdata.

Datamanagementparagraaf. Een onderdeel van een onderzoeksvoorstel of subsidieaanvraag waarin beknopt beschreven wordt hoe de data tijdens het onderzoek worden opgeslagen en beheerd en hoe deze na afloop van het onderzoek (zo open mogelijk) beschikbaar worden gemaakt.

Datamanagementplan (DMP). Een DMP is een document dat in meer detail dan een datamanagementparagraaf beschrijft hoe onderzoeksdata tijdens en na het onderzoek worden verzameld, verwerkt en beheerd. Het geeft inzicht in waarmee rekening moet worden gehouden bij het verzamelen en verwerken van data, het beschrijft de verschillende opslagmogelijkheden van data en geeft informatie over data-archivering en data-disseminatie.

Metadata. Metadata beschrijven (basis)kenmerken van de onderzoeksdata, zoals bijvoorbeeld wie de dataset heeft gecreëerd en welke data de dataset bevat. ​Metadata zorgen ervoor dat jij en anderen, op een later moment, gemakkelijker data kunnen vinden en hergebruiken.

Data repository. Online database voor het vinden en beschikbaar stellen van datasets voor hergebruik.

FAIR data. Data die vindbaar (findable), toegankelijk (accessible), uitwisselbaar (interoperable) en herbruikbaar (reusable) zijn.

Open Data. Data die zonder restricties door iedereen gebruikt, hergebruikt, en gedeeld mogen worden, met daarbij als enige (mogelijke) voorwaarden het citeren van de oorspronkelijke maker en bij het delen dezelfde gebruiksvoorwaarden te hanteren. 

 

Meer definities van begrippen vind je onder 'Data jargon' op de website van Research Data Netherlands (RDNL).

[anchornavigation]