Gå rett til innhold
<
<
ENVRI FAIR - forskningsinfrastrukturer som følger FAIR-prinsippene

ENVRI FAIR - forskningsinfrastrukturer som følger FAIR-prinsippene

NORCE har deltatt i et stort europeisk prosjekt der 13 europeiske miljøforskningsinfrastrukturersamarbeidet for å gjøre sine datasett og tjenester mer kompatible med FAIR-prinsippene. ENVRI-FAIR prosjektet pågikk fra 2019 til 2023, og NORCE deltok i en arbeidspakke for infrastrukturer som leverer geovitenskapelige data.

Hvordan hjelpe forskerne i å finne relevant data?

Selv om veldig mange datasett er tilgjengelig på internett kan det være vanskelig for en forsker å identifisere relevante data og så bruke dem i sin forskning. Grunner til dette kan for eksempel være at ulike datakilder beskriver og kategoriserer sine data med forskjellige termer og bruker ulike format for å lagre dataene.

Det kan også være vanskelig å finne ut hvilke betingelser som knytter seg til bruk av datasettene.

Derfor kom FAIR-prinsippene

Som et svar på behovet kom det i 2016 ut en publikasjon med tittel FAIR Guiding Principles for scientific data management and stewardship.

FAIR er en forkortelse for Findability, Accessibility, Interoperability og Reusability. Tanken var at ved å følge FAIR prinsippene kan datatilbydere gjøre det mulig for forskere å finne relevante datasett for sin forskning, forstå hvilke lisenser som regulerer bruken av datasettene, få tilgang til data og gjenbruke dem.

Det eksisterer flere initiativ for å implementere og spre kunnskap om FAIR prinsippene, se f.eks. force11.org og go-fair.org.

NORCE, Enlighten visualisering av data fra e-infrastrukturen EPOS: Use case 'Geo-scientific data around Vesuvius volcano'., Env enl data from ICS C, ,

Kilde:
NORCE

Enlighten visualisering av data fra e-infrastrukturen EPOS: Use case 'Geo-scientific data around Vesuvius volcano'.

ENVRI-FAIR følger opp

I dette ENVRI-FAIR prosjektet arbeidet 13 europeiske miljøforskningsinfrastrukturer sammen for å gjøre sine datasett og tjenester mer kompatible med FAIR-prinsippene.

Dette ville også forberede disse infrastrukturene for å kobles til European Open Science Cloud (EOSC). En av infrastrukturene var European Plate Observing System (EPOS), https://www.epos-eu.org/) som er en omfattende e-infrastruktur med en dataportal der forskere kan søke etter og laste ned geovitenskapelige data, spesielt knyttet til platetektonikk. EPOS inkluderer data fra ulike fagdisipliner, blant annet seismiske data, geodetiske data og data fra vulkanobservatorier.

I ENVRI-FAIR deltok EPOS i arbeidspakken for geovitenskapelige infrastrukturer. Her var mange europeiske forskningsinstitusjoner involvert, blant andre Institutt for Geovitenskap ved Universitetet i Bergen og NORCE.

UiB og NORCE har tidligere vært sentrale i utviklingen av den norske noden av EPOS-infrastrukturen.

NORCE sin rolle i ENVRI-FAIR

NORCE sin rolle i ENVRI-FAIR var knyttet til programvaren Enlighten-web. Enlighten-web er en web-applikasjon for interaktiv visuell analyse utviklet av NORCE. EPOS ønsker nemlig å gjøre forskjellige eksterne analyseverktøy tilgjengelig i dataportalen sin, for eksempel for visuell analyse av geovitenskapelige data.

NORCE sin rolle i ENVRI-FAIR-prosjektet var derfor å se på hvordan Enlighten kan gjøres tilgjengelig fra dataportalen i EPOS på en måte som følger FAIR-prinsippene. I EPOS benevnes slike verktøy og ressurser Integrated Core Services – Distributed, eller kort ICS-D.

Foruten Enlighten omfattet ICS-D i dette prosjektet to andre komponenter; SWIRRL er et rammeverk utviklet av KNMI (The Royal Netherlands Meteorological Institute) for definering og kjøring av arbeidsflyter. I ENVRIFAIR gjelder dette arbeidsflyter for forberedelse av data og oppstart Jupyter notebooks og Enlighten. Den siste komponenten er Jupyter notebooks, et verktøy for literær programmering (LiterateProgramming). Disse tjenestene utgjør til sammen et virtuelt forskningsmiljø (Virtual Research Environment (VRE)) for data analyse og visualisering.

Prosessen

Det ble gjort en gapanalyse av ICS-D komponentene med hensyn til FAIR-prinsippene. Gapanalysen resulterte i at det ble definert tre hovedaktiviteter for å gjøre disse komponentene mer kompatible med FAIR-prinsippene.

Den første var å definere metadata for ICS-D komponentene. Disse metadata skulle så inkluderes i EPOS-portalen, for å gi brukere av portalen mulighet til å oppdage og å bruke ICS-D komponenter som er relevante for deres behov.

NORCE definerte metadata som beskriver Enlighten-web og hva det kan brukes til. Metadataene ble definer ved hjelp av SHAPEness METADATA EDITOR som representerer slike data på en standardisert måte (Resource Description Framework, og EPOS-DCAT-AP metadata model, og EPOS Interoperationality).

Den neste hovedaktiviteten var å tilrettelegge for opprettelse og lagring av proveniensdata fra ICS-D. Proveniensdata er viktige for eksempel for at brukere skal vite i hvor stor grad de kan ha tillit til tjenester og data.

Konkret har NORCE laget maler som SWIRRL kan bruke for å registrere proveniensdata for Enlighten-web tjenesten. Disse malene bruker såkalt Provenance Notation, PROV-N. Vi har også tilrettelagt for at det kan lagres proveniensdata for Enlighten-web visualiseringer.

Den tredje og siste hovedaktiviteten var nødvendige utvidelser og tilpassinger av ICS-D programvaren. Det ble definert en arbeidsflyt i SWIRRL for å forberede data fra portalen for visning i Enlighten-web. NORCE laget et program for konvertering fra ulike dataformat brukt i EPOS-portalen til et format som Enlighten-web kan lese. Dette programmet kjøres som en del av nevnte arbeidsflyt i SWIRRL. En grunn til at vi valgte denne løsningen er hensynet til proveniens. NORCE måtte også gjøre noen mindre tilpasninger av Enlighten-web slik at den kan startes fra portalen ved hjelp av SWIRRL.

SWIRRL rammeverket er gjort tilgjengelig for testing av ICS-D-komponentene Jupyter Notebook og Enlighten-web. Arbeidet i dette prosjektet har gjort disse komponentene mer klare for å kobles mot EOSC gjennom bruk av standardiserte metadata og proveniensdata.

Resultatene er illustrert i en use case kalt Geo-scientific data around Vesuvius volcano. Denne inkluderer data fra historiske og moderne jordskjelv, satellittdata, data om forkastninger samt geologiske kart. Et skjermbilde fra Enlighten-web som viser disse datatypene er vist lenger oppe i artikkelen.

EPOS er langt fremme med å implementere FAIR prinsippene.

Kontaktperson

Tor Langeland

Seniorforsker - Bergen

tola@norceresearch.no
+47 901 42 945

Prosjektfakta

Navn

ENVRI-FAIR prosjektet

Status

ferdig

Periode

01.01.19 - 31.12.23

Sted

Bergen

Prosjektets hjemmeside

https://envri.eu/home-envri-fair/

Forskningsområder

Forskningsgrupper

Forskningstemaer

Prosjektmedlemmer

Se alle prosjekter

Hold deg oppdatert om forskning og innovasjon fra NORCE

Meld deg på vårt nyhetsbrev