Gå till huvudinnehållet

Forskningsdata: Öppna, dela och/eller arkivera efter projektets slut

Guiden är avsedd att stöda forskare vid Åbo Akademi med frågor om forskningsdata.

Vad händer med datan efter forskningsprojektet?

Din data är värdefull! Senast vid projektets slut ska den och dess metadata (beskrivningen av den och dess tillkomst) arkiveras och/eller publiceras/öppnas på ett ansvarsfullt sätt. Observera att flera större forskningsfinansiärer kräver FAIR och öppna data, om det inte finns grunder att hålla materialet stängt eller förstöra det.

Du kan deponera materialet i en arkivtjänst som sköter om det och ser till att andra kan få tillgång till det. För vilka ändamål (enbart forskning och undervisning eller också annat?) och vem som får tillgång till materialet besluter du själv, liksom om du öppnar allt eller bara en del av dina data. Dessutom finns det t.ex.juridiska aspekter som kan begränsa hur och i vilken grad datat kan arkiveras, öppnas och publiceras.

Inom ett forskningsprojekt samlas stora mängder data/material in. Det lönar sig att redan i planeringsskedet fundera över vilka dataset kan vara användbara eller viktiga att spara. Forskaren ska också planera när och hur datat eventuellt ska förstöras.

FAIR data och öppen data

ÅA:s policy för öppen vetenskap stöder öppenhet och transparens och återanvändning av forskningsdata enligt FAIR-principerna, enligt vilka data borde vara finnbar, tillgänglig, interoperabel och återanvändbar (findable, accessible, interoperable and reusable). ​Enligt den nationella policyn om öppna forskningsdata och metoder (2021-2025) bör forskningsmaterial och -metoder vara så öppna som möjligt och så slutna som nödvändigt. Material hanteras på ett lämpligt sätt i syfte att uppfylla FAIR-principerna.

FAIR och öppna data är inte synonymer, även om begreppen används tillsammans. Forskningsdata kan vara FAIR utan att vara (helt) öppet, och data kan vara öppet utan att vara FAIR. Målsättningen är att göra ens data så öppet och så FAIR som möjligt efter att bl.a. juridiska och forskningsetiska aspekter vägts in. Metadata kan uppfylla FAIR-principerna, om man av någon orsak inte kan öppna datat helt (t.ex. känsligt data, patenter och innovationer). I många fall är det möjligt att efter anonymisering arkivera och/eller publicera/öppna data som innehållit personuppgifter och/eller känsliga data. I en del fall kan forskningsdata göras tillgänglig efter en embargotid.

Var kan jag arkivera och/eller publicera/öppna mina data efter projektet?

Hitta ett dataarkiv/repositorium för dina forskningsdata:

  • Kolla finansiärens krav på FAIR och/eller öppna data
  • Kolla förlagets/tidskriftens skribentinstruktioner eller data policy
    • En del förlag/tidskrifter rekommenderar eller kräver att författare arkiverar sina data in ett särskilt dataarkiv/repositorium. Mer information hittas oftast i skribentinstruktioner eller datapolicy.
    • En del förlags data policy finns listade på FAIRsharing.org.
  • Använd söktjänster för att utforska hurdana dataarkiv/repositorier finns:
    • Repository Finder med FAIR-filter (Datacites tjänst som bygger på Re3data)
    • Re3data - ett register över dataarkiv/repositorier
  • Var publicerar och arkiverar forskare inom ditt forskningsområde sina forskningsdata?
    • En tumregel är att publicera/öppna data i ett arkiv/repositorium där också du själv hittar relevanta och användbara forskningsdata. På så sätt kan du försäkra dig om att forskare inom ditt forskningsområde hittar också dina data.

 

Vid arkivering är det viktigt att

  • dina data får en persistent identifikator (DOI, Handle eller liknande) som fungerar som en permanent adress på nätet,
  • metadatan (beskrivningen) följer standarder och är tillräcklig så att andra hittar fram till det och förstår vad det är,
  • materialet förses med en öppen licens (Creative Commons, GNU osv) som säkrar goda återanvändningsvillkor och,
  • arkivet/repositoriet garanterar tillgängligheten i längden.

I första hand rekommenderas disciplinsspecifika dataarkiv eller -repositorier inom ens forskningsområde, om det finns sådana som följer FAIR-principerna. Så länge villkoren ovan uppfylls kan man bedöma att ett dataarkiv/repositorium är av god kvalitet. Om det inte finns relevanta disciplinsspecifika dataarkiv, kan man istället välja ett generellt dataarkiv/repositorium.

 

Några exempel på disciplinsspecifika data-arkiv eller -repositorier:

För humaniora, samhällsvetenskap, hälsovetenskaper, m.fl.:

  • Finlands samhällsvetenskapliga dataarkiv (FSD) / Tietoarkisto - är ett kuraterat arkiv. Arkivet erbjuder stöd i arkiveringsprocessen, korrekturläsning m.m. och data deponerad här följer FAIR-principerna. FSD tar emot både kvantitativa och kvalitativa data, men inte audio-visuellt data. Ta kontakt i god tid och erbjud dina data, så får du stöd och anvisningar.

Språkforskning:

Repositorier inom olika naturvetenskaper hittas via t.ex. följande resurser:

Tjänst för arkivering och delning av kod:

  • GitHub - plattform, använd av miljoner, där kod kan delas för samarbete och versionshistorik.

 

Några exempel på generella dataarkiv eller -repositorier (alla forskningsområden)

 Följande är gratis att använda för forskare och har god arkiveringspolicy:

  • Zenodo - pålitlig arkivering av allt material: "publications ("book, book section, conference paper, journal article, patent, preprint, report, thesis, technical note, working paper, etc.), posters, presentations, datasets, images (figures, plots, drawings, diagrams, photos), software, videos/audio and interactive materials such as lessons").
  • FAIRdata.fi - ett servicepaket bestående av IDA-tjänsten för lagring av stabila data (öppen eller stängd), både rådata och processerad data, QVAIN: verktyg för beskrivning av datan.   
  • EUDAT -  B2SHARE - europeiskt nätverk för lagring av data med servrar i Finland och senare även möjligheten att välja från olika serverlägen i Europa.
  • Figshare - enkelt publicering av all forskningsdata. Alla format, inklusive video och dataset. CC-licenser.

 

Övriga tjänster och verktyg för forskning

  • EOSC - European Open Science Cloud, en samling tjänster och verktyg för öppen vetenskap för forskare i Europa 
  • OSF.io - Open Science Framework, plattform för öppna arbetsflöden

Guider för publicering och öppnande av data

Varför öppna data?

Genom att öppna dina data gör du dem tillgängliga för återanvändning och tillämpning för andra forskare och för hela samhället. Det här främjar forskningens transparens och tillförlitlighet.

CC BY Danny Kingsley & Sarah Brown

Fairdata.fi - finländsk tjänst för FAIR-data

Fairdata-servicepaketet som erbjuds av CSC består av IDA för datalagring, verktyget Qvain för beskrivning och publicering av dataset, och portalen Etsin där man kan utforska olika dataset. Som minimiinsats lönar det sig att registrera en beskrivning (metadata) av ditt dataset i Etsin. Metadatat matas in med hjälp av beskrivningstjänsten Qvain/Qvain Light, vilket ger datasetet en ingångssida som gör det möjligt för andra forskare att hitta det och att hänvisa till det.

Öppna licenser för forskningsdata

Med en öppen licens informerar man andra om vilka rättigheter de har att sprida och återanvända ens forskningsdata. Utan licens riskerar man att potentiell återanvändning uteblir.

Hur kan man skydda data?

Man kan skydda eller begränsa andras användning av sina data med hänvisning till

  • avtalsvillkor (man begränsar användningsrätten i egenskap av ägare till den) 
  • som affärshemlighet (det kan innehålla affärshemligheter eller man kan sluta sig till sådana utifrån det)
  • som databas eller katalog 
  • som verk (copyright)

Att lägga ut datan på nätet med en mycket begränsande licens (CC-BY-NC-ND) är bättre än att hålla den på egen hårdskiva. 

Om man öppnar den med licensen CC-BY (eller CC0 med citationskrav) ger man rätt att återanvända den, vilket kan underlätta i längden eftersom den som vill använda datan inte riskerar att bli tvungen att leta upp många delägare på olika kontinenter för att be om lov.