Un documento con cui pensare in modo strutturato a tutto il ciclo di vita dei dati della propria ricerca. Da modificare e aggiornare all'occorrenza o a cadenza regolare.
Uno degli strumenti più importanti della gestione dei dati della ricerca è il research Data Management Plan, o DPM: un piano - compilato in anticipo, modificabile in seguito - con tutte le informazioni sui dati da raccogliere o usare all'interno di un progetto di ricerca e su come si intende gestirli.
Molti enti finanziatori richiedono espressamente di compilare un DMP per avere accesso ai fondi.
Idealmente il piano si redige già nella fase di stesura del progetto, perché è molto utile per mettere a fuoco i costi di gestione dei dati e dunque può aiutare a definire la proposta di progetto. E infatti alcuni enti finanziatori - tra cui la Commissione europea in Horizon Europe - lo richiedono già in questa fase. Tuttavia viene anche definito un "living document" perché va revisionato e aggiornato con cadenza regolare o ogni volta che ce n'è bisogno, anche in base alle richieste di enti finanziatori e istituzioni.
Il DMP è un modo strutturato di pensare ai propri dati: invece di improvvisare quando si crea una necessità, si fanno scelte ponderate su tutto il ciclo di vita dei dati.
Nel compilare un DMP si compiono azioni o scelte che possono in seguito far risparmiare tempo e risorse, e che comunque possono sempre essere riviste. Per esempio bisogna descrivere in dettaglio il tipo di dati da raccogliere o da analizzare; decidere in anticipo quali formati e quali software usare, se trasformare i dati e con quali tecnologie; come affrontare eventuali regolamenti e come trattare aspetti etici o legati alla protezione e confidenzialità dei dati stessi - per esempio se serve anonimizzarli e con quale strumento; dove e come depositare i dati dopo l’analisi, e fornire una stima dei costi.
Redigere un Data Management Plan significa riflettere tempestivamente su aspetti determinanti, prendendo decisioni meglio informate e non dettate dal caso o da una necessità estemporanea. Una buona pianificazione eviterà di perdere tempo su aspetti non rilevanti per la propria ricerca. Inoltre con l’uso di un Data Management Plan, non ci saranno sorprese nella gestione dei costi di deposito e conservazione.
Nel DMP si decide chi e come può avere accesso ai dati, se questi sono aperti e disponibili per chiunque, se sono ad accesso ristretto (cioè accessibili su richiesta oppure a discrezione, definendo chi, come e quando potrà avere accesso ai dati), il tipo di riuso consentito per i dati che si mettono a disposizione, o ancora se si prevede un periodo di embargo.
Inoltre molti tra enti finanziatori e istituzioni chiedono che sia revisionato con cadenza regolare e che sia aggiornato ogni volta che c'è qualche cambiamento rispetto al piano originario; per esempio se si produce un dataset non previsto all'inizio, se si cambia idea e si sceglie di depositare i dati in un repository diverso eccetera. Per questo nel piano si citano anche i documenti di riferimento, cioè i mandati o le policy che bisogna seguire su richiesta dell'istituzione di appartenenza o dell'ente finanziatore di cui si usano i fondi.
In sintesi, il DMP serve a:
- identificare i dati da usare nel progetto (sia originali sia provenienti da altre fonti)
- definire gli standard con cui verranno raccolti e/o descritti
- definire una strategia per organizzarli
- se e come conviderli (individuando eventuali ostacoli alla loro apertura)
- stima dei costi, cioè del tempo e del denaro necessario per la gestione dei dati.
La struttura del DMP va adattata al suo stesso contesto, cioè va adattata per esempio a normative di riferimento (se si trattano dati personali bisognerà tenere in considerazioni le leggi sulla protezione dei dati personali), alle policy istitutionali e ai regolamenti degli enti di cui si usano i fondi. Di seguito una lista di aspetti da tenere in considerazione al momento di redigere il piano, su cui bisognerà fornire informazioni o fare delle scelte.
1. Dati amministrativi. È la sezione in cui si forniscono i riferimenti del progetto: nome e abstract (in cui si chiarisce lo scopo della creazione/collezione di dati, o dell'analisi di dati esistenti), e i regolamenti da seguire in base al contesto in cui si sta lavorando.
2. Data collection. Si chiarisce la natura dei dati da usare (se saranno prodotti dati originali o se ne useranno di già esistenti), con quali standard si intende manovrarli, quali formati e quali software si useranno. Questo passaggio è utile anche per riflettere a come organizzare i dati su cui si lavorerà, dalle cartelle allo standard da seguire per nominare i propri file.
3. Metadati e documentazione di supporto. In questa sezione si entra nel dettaglio delle soluzioni per descrivere e rendere rintracciabili i dati che si useranno, cioè quali standard si useranno per i metadati o quale tipo di documentazione si creerà.
4. Aspetti etici e legali. Si prendono in considerazione le normative vigenti per il tipo di dati che si intende maneggiare e si stabilisce con quali strumenti si intende adempiere alle loro richieste (per esempio se c'è bisogno di un consenso informato da far firmare, o nel caso dei dati personali, come si intende proteggerli eccetera). Inoltre si stabiliscono le licenze d'uso con cui depositare i dati stessi.
5. Condivisione dei dati e backup. In questa sezione si riflette sulle risorse infrastrutturali ed economiche di cui disporre, chiedendosi per esempio se si riesce a conservare i dati localmente o si dovranno usare servizi di cloud, quali servizi si useranno, e con quali strumenti si condivideranno i dati con i collaboratori. Un altro aspetto da ponderare è quello dei backup dei dati: ogni quanto si intende fare un salvataggio generale e dove, nonché le strategie scelte saranno condivise tra vari partner del progetto.
29 September 2020