Data Management plan: strumenti e risorse utili

Gli aspetti da considerare e dove trovare materiale di riferimento
Sono un Ricercatore
e voglio informazioni su Gestione dei dati della ricerca

Uno strumento sempre più necessario, non solo perché richiesto da alcuni importanti enti finanziatori quali la Commissione Europea con i programmi di Horizon Europe, ma fondamentale anche per sé stessi. Ma da dove cominciare? Ecco alcune indicazioni.

Una corretta gestione dei dati è un aspetto ormai fondamentale della ricerca e uno degli strumenti più utili è il data management plan (DMP), un documento in cui si descrivono le azioni che si intende compiere rispetto ai dati del proprio progetto di ricerca: quali tipi di dati verranno raccolti, da quale documentazione verranno corredati, le eventuali implicazioni etiche, come verranno conservati, se saranno aperti e riutilizzabili, eccetera. Si tratta dunque di un documento di pianificazione, ma dinamico: cioè da aggiornare periodicamente in corso d’opera, man mano che il progetto di ricerca viene realizzato. 

IL DMP è richiesto da diversi enti finanziatori, tra cui la Commissione Europea con il programma Horizon Europe. In generale questo documento va strutturato nella fase di progettazione dell'attività di ricerca e, una volta ottenuto il finanziamento, si presenta una prima versione del DMP, pianificando accuratamente anche le successive revisioni periodiche. Il DMP dovrà inoltre essere aggiornato nel caso si verifichino importanti cambiamenti rispetto a quanto stabilito inizialmente. 

Un buon DMP è scritto anche in accordo con i principi FAIR (Findable, rintracciabili; Accessible, dove accedibile non vuol dire per forza aperti ma con metadati chiari sul tipo di informazione contenuta; Interoperable, dunque i cui metadati siano espressi in formati ampiamente accessibili; reusable, nel senso che contenga indicazioni chiare sulle licenze utilizzate, la possibilità e le condizioni di riutilizzo). 

I principali aspetti da considerare nel redigere un DMP sono:

  • Il dataset, cioè quali dati verranno raccolti e come si intende usarli
  • Standard e metadati: ad esempio formati, aspetti di interoperabilità, eventuali standard specifici per la disciplina (se non ce ne sono specifici di settore si può consultare questa pagina)
  • Condivisione dei dati: specificare nel DMP se i dati saranno ad accesso aperto oppure no. È sempre possibile non aprire i propri dati, a patto che ci siano valide motivazioni (per esempio etiche o legate alla sicurezza o per la possibilità di brevetti o altro) e che siano chiaramente riportate nel DMP. Tuttavia i dati devono comunque essere FAIR, dunque sono sempre da depositare in repository affidabili e devono essere corredati metadati che ne definiscono contenuti e caratteristiche, anche senza accesso aperto ai dati. 
  • Archiviazione e conservazione a lungo termine. Può essere utile considerare non solo aspetti quali storage e back-up dei dati, ma anche aggiornamenti e conversione dei formati e dei software necessari per processarli. 

Inoltre, nel redigere il DMP, è bene curare una serie di informazioni riguardanti la gestione dei dati del progetto:

1. I dati amministrativi. Descrivere in modo completo tutti i dati amministrativi del progetto (titolo, acronimo, ID e altri identificativi, abstract coon lo scopo della raccolta dei dati, riferimenti a procedure e policy.

2. Raccolta dei dati. Fornire dettagli su formati e software che si useranno; specificare se si useranno dati esistenti o si creeranno/raccoglieranno ex novo - e in questo caso con quale metodologia - descrivere come si intende strutturare le cartelle con i dati di progetto. 

3. Metadati e documentazione di supporto. Specificare se si userà uno standard per i metadati e quale, o se si useranno altri modi per descrivere i file di dati (per esempio se si userà un readme file)

4. Aspetti legali ed etici. Tenere in considerazione aspetti quali il consenso informato per la conservazione dei dati, come si intende proteggere i dati personali, quali licenze di riuso si applicheranno.

5. Conservazione e backup. Specificare come si intende conservare e condividere i dati con i collaboratori (per esempio attraverso servizi di cloud eccetera), se si pensa di fare delle copie di riserva dei dati e con quale regolarità.

6. Conservazione a lungo termine. Riflettere su quali dati dovranno essere distrutti (per esempio per via di accordi o questioni legali, quali altri dati invece dovranno essere conservati a lungo termine e potenzialmente resi pubblici per eventuale riuso. In questo passaggio è importante riflettere sui costi per mantenere i propri dati.

7. Condivisione dei dati. Specificare chi avrà accesso ai dati e in quale fase, o a quali condizioni, se ci sarà bisogno di restringerne l'accesso, e come saranno rintracciabili da altri potenzialmente interessati al loro riuso. Su questo aspetto può essere utile l'uso di Sherpa Juliet, database con le richieste dei vari enti finanziatori a proposito di condivisione dei dati. 

8. Responsabilità e risorse. Esplicitare chi sarà responsabile di implementare e tenere aggiornato il DMP, e l'eventuale necessità di strumenti specifici. 

Tutto cioè però non deve far pensare a un documento verboso e lungo, anzi. Andrà benissimo usare frasi chiare che veicolano informazioni precise.

Sono disponibili diversi strumenti e modelli con cui orientarsi nella compilazione di un DMP. 

Uno utile strumento è DMPonline, in cui sono disponibili diversi template e guide per creare e manutenere il proprio DMP, nonché una lista di risorse utili e materiali di riferimento. I DPM creati con questo strumento possono essere facilmente condivise ed esportati in vari formati. 

Altri strumenti utili per creare DMP possono essere Argos, EasyDMP o il Data Stewardiship Wizard

Inoltre sono state messe a punto diverse griglie con elenchi di aspetti da considerare nella redazione del DMP. Una griglia utile per l’Italia è quella redatta da IOSSG, l’Italian Open Science Support Group. 

 

Per approfondire

A Research Data Management Handbook. A primer on managing your research data, OpenAIRE

Ulteriori strumenti per il DMP e un paio di video tutorial 

Potrebbe interessarti anche
Che cos’è un repository e come scegliere quello giusto

Un repository è una piattaforma digitale con cui è possibile raccogliere, gestire e conservare articoli scientifici, dati, software, note di laboratorio o qualsiasi altro prodotto della ricerca. In sostanza è uno dei principi fondamentali della scienza aperta è tra i principali strumenti dell’open access.

Che cos'è il Data Management Plan

Un documento con cui pensare in modo strutturato a tutto il ciclo di vita dei dati della propria ricerca. Da modificare e aggiornare all'occorrenza o a cadenza regolare.