Gå till huvudinnehållet

Forskningsdata: Öppna, dela och/eller arkivera efter projektets slut

Guiden är avsedd att stöda forskare vid Åbo Akademi med frågor om forskningsdata.

Vad händer med forskningsdata efter projektet?

Dina forskningsdata är värdefulla! Senast vid projektets slut ska data och metadata (beskrivningen av den och dess tillkomst) arkiveras och/eller publiceras/öppnas på ett ansvarsfullt sätt. Observera att flera större forskningsfinansiärer kräver FAIR och öppna data, om det inte finns grunder att hålla materialet stängt eller förstöra det.

Du kan deponera materialet i en arkivtjänst som sköter om det och ser till att andra kan få tillgång till det. Du besluter själv för vilka ändamål dina forskningsdata blir tillgängliga (t.ex. forskning och undervisning), och om du öppnar allt eller bara en del av dina data. Forskningsetiska, juridiska och praktiska aspekter kan begränsa hur och i vilken grad forskningsdata kan arkiveras, öppnas och publiceras.

Inom ett forskningsprojekt samlas stora mängder data/material in. Det lönar sig att redan i planeringsskedet fundera över vilka dataset kan vara användbara eller viktiga att spara. Forskaren ska också planera när och hur data eventuellt ska förstöras. Det lönar sig dock att lagra data åtminstone 3–5 år för eventuell verifiering av forskningsresultat. 

FAIR data och öppen data

ÅA:s riktlinjer för öppen vetenskap stöder öppenhet och transparens och återanvändning av forskningsdata enligt FAIR-principerna, enligt vilka data borde vara sökbara, tillgängliga, kompatibla (med andra data) och återanvändbara (findable, accessible, interoperable and reusable). ​Enligt den nationella policyn om öppna forskningsdata och metoder (2021-2025) bör forskningsmaterial och -metoder vara så öppna som möjligt och så slutna som nödvändigt. Material hanteras på ett lämpligt sätt i syfte att uppfylla FAIR-principerna.

FAIR och öppna data är inte synonymer, även om begreppen används tillsammans. Forskningsdata kan vara FAIR utan att vara (helt) öppet, och data kan vara öppet utan att vara FAIR. Målsättningen är att göra ens data så öppet och så FAIR som möjligt efter att bl.a. juridiska och forskningsetiska aspekter vägts in. Metadata kan uppfylla FAIR-principerna, om man av någon orsak inte kan öppna datat helt (t.ex. känsligt data, patenter och innovationer). I många fall är det möjligt att efter anonymisering arkivera och/eller publicera/öppna data som innehållit personuppgifter och/eller känsliga data. I en del fall kan forskningsdata göras tillgänglig efter en embargotid.

Var kan jag arkivera och/eller publicera/öppna mina data efter projektet?

Hitta ett dataarkiv/repositorium för dina forskningsdata:

  • Använd söktjänster för att utforska hurdana dataarkiv/repositorier finns:
    • DataCite Commons DataCites söktjänst med FAIR-filter
    • Brand Ett register över dataarkiv/repositorier
    • Disciplinsspecifika och generella dataarkiv hittas nedan
  • Kolla finansiärens krav på FAIR och/eller öppna data
  • Kolla förlagets/tidskriftens skribentinstruktioner eller data policy
    • En del förlag/tidskrifter rekommenderar eller kräver att författare arkiverar sina data in ett särskilt dataarkiv/repositorium. Mer information hittas oftast i skribentinstruktioner eller datapolicy.
    • En del förlags data policy finns listade på FAIRsharing.org.
  • Var publicerar och arkiverar forskare inom ditt forskningsområde sina forskningsdata?
    • En tumregel är att publicera/öppna data i ett arkiv/repositorium där också du själv hittar relevanta och användbara forskningsdata. På så sätt kan du försäkra dig om att forskare inom ditt forskningsområde hittar också dina data.

 

Vid arkivering är det viktigt att

  • du informerat forskningsdeltagare på förhand om avsikten att öppna data 
  • dina data får en persistent identifikator (DOI, Handle eller liknande) som fungerar som en permanent adress på nätet,
  • metadatan (beskrivningen) följer standarder och är tillräcklig så att andra hittar fram till det och förstår den,
  • materialet förses med en öppen licens (Creative Commons, GNU osv) som säkrar goda återanvändningsvillkor och,
  • arkivet/repositoriet garanterar tillgängligheten i längden.

I första hand rekommenderas disciplinsspecifika dataarkiv eller -repositorier inom ens forskningsområde, om det finns sådana som följer FAIR-principerna. Så länge villkoren ovan uppfylls kan man bedöma att ett dataarkiv/repositorium är av god kvalitet. Om det inte finns relevanta disciplinsspecifika dataarkiv, kan man istället välja ett generellt dataarkiv/repositorium. Notera också att vissa repositorier tillåter versionering av data ifall man exempelvis hittar ett fel och behöver ladda upp en ny version av sitt dataset. 

 

Exempel på disciplinsspecifika dataarkiv eller repositorier:

Humaniora, samhällsvetenskap, hälsovetenskaper, m.fl.:

  • Finlands samhällsvetenskapliga dataarkiv (FSD) / Tietoarkisto - är ett kuraterat arkiv. Arkivet erbjuder stöd i arkiveringsprocessen, korrekturläsning m.m. och data deponerad här följer FAIR-principerna. FSD tar emot både kvantitativa och kvalitativa data, men inte audio-visuellt data. Ta kontakt i god tid och erbjud dina data, så får du stöd och anvisningar.

Språkforskning:

Naturvetenskaper:

Tjänst för arkivering och delning av kod:

  • GitHub - plattform, använd av miljoner, där kod kan delas för samarbete och versionshistorik.

 

Exempel på generella dataarkiv eller -repositorier (alla forskningsområden)

 Följande är gratis att använda för forskare och har god arkiveringspolicy:

  • Zenodo - pålitlig arkivering av allt material: "publications ("book, book section, conference paper, journal article, patent, preprint, report, thesis, technical note, working paper, etc.), posters, presentations, datasets, images (figures, plots, drawings, diagrams, photos), software, videos/audio and interactive materials such as lessons").
  • FAIRdata.fi - ett servicepaket bestående av IDA-tjänsten för lagring av stabila data (öppen eller stängd), både rådata och processerad data, QVAIN: verktyg för beskrivning av datan, och Etsin.   
  • EUDAT -  B2SHARE - europeiskt nätverk för lagring av data med servrar i Finland och senare även möjligheten att välja från olika serverlägen i Europa.
  • Figshare - enkelt publicering av all forskningsdata. Alla format, inklusive video och dataset. CC-licenser.

 

Övriga tjänster och verktyg för forskning

  • EOSC - European Open Science Cloud, en samling tjänster och verktyg för öppen vetenskap för forskare i Europa 
  • OSF.io - Open Science Framework, plattform för öppna arbetsflöden

Guider för publicering och öppnande av data

Varför öppna data?

Genom att öppna dina data gör du dem tillgängliga för återanvändning och tillämpning för andra forskare och för hela samhället. Det här främjar forskningens transparens och tillförlitlighet.

CC BY Danny Kingsley & Sarah Brown

Fairdata.fi - finländsk tjänst för FAIR-data

Fairdata-servicepaketet som erbjuds av CSC består av IDA för datalagring, verktyget Qvain för beskrivning och publicering av dataset, och portalen Etsin där man kan utforska olika dataset. Som minimiinsats lönar det sig att registrera en beskrivning (metadata) av ditt dataset i Qvain, vilket ger datasetet en ingångssida som gör det möjligt för andra forskare att hitta det i Etsin och att hänvisa till det.

Öppna licenser för forskningsdata

Med en öppen licens informerar man andra om vilka rättigheter de har att sprida och återanvända ens forskningsdata. Utan licens riskerar man att potentiell återanvändning uteblir.

Hur kan man skydda data?

Man kan skydda eller begränsa andras användning av sina data med hänvisning till

  • avtalsvillkor (man begränsar användningsrätten i egenskap av ägare till den) 
  • som affärshemlighet (det kan innehålla affärshemligheter eller man kan sluta sig till sådana utifrån det)
  • som databas eller katalog 
  • som verk (copyright)

Att lägga ut data på nätet med en mycket begränsande licens (CC-BY-NC-ND) är bättre än att hålla den på egen hårdskiva. 

Om man öppnar data med licensen CC-BY (eller CC0 med citationskrav) ger man rätt att återanvända dem, vilket kan underlätta i längden eftersom den som vill använda data inte blir tvungen att kontakta dig och eventuella andra delägare.