Costruire l'infrastruttura umana della scienza aperta: il percorso della comunità Data Steward del CNR

Image by Chris Briggs, Unsplash

Il Consiglio Nazionale delle Ricerche (CNR), la più grande istituzione di ricerca pubblica in Italia, ha intrapreso un percorso ambizioso quanto necessario: mettere a sistema le infrastrutture digitali e l’esperienza del proprio personale per trasformare la gestione dei dati e dei prodotti digitali della ricerca in un ecosistema aperto e condiviso. In questo percorso un ruolo fondamentale è quello di una nuova figura che si sta delineando: il Data Steward. 

Il cammino del CNR verso l'Open Science non è recente. Nel 2012 l’ente firma la Dichiarazione di Berlino, un impegno solenne per l'accesso aperto alla conoscenza. Tuttavia, la vera svolta operativa è avvenuta negli ultimi anni: nel 2022 è stata adottata la policy istituzionale e quella gestionale sull'accesso aperto e, nel 2023, è stata adottata la Roadmap per la Scienza Aperta.  

Per rendere concrete queste direttive, nel maggio 2024 è stata istituita la Sezione Open Science, all’interno dell’Unità Pianificazione, Programmazione e Biblioteca Centrale, in collaborazione con l’Ufficio Agenda Digitale e Processi del CNR, incaricata di tradurre le politiche in pratiche quotidiane attraverso un piano di implementazione che vede nei Data Steward uno dei pilastri fondamentali. 

Chi sono i Data Steward del CNR? 

Con circa 9000 dipendenti di cui il 58% formato da ricercatori e ricercatrici, il CNR è un ente altamente articolato e capillare sul territorio. È diviso in 7 dipartimenti ai quali afferiscono 88 istituti di ricerca con più di 200 sedi e laboratori.  

Per questo motivo il “dato” prodotto dalla rete scientifica del CNR è un concetto ampio, nel quale rientrano diverse tipologie di risultati in formato digitale, che riflettono la forte eterogeneità disciplinare dell’Ente. Si va da dati genetici, a modelli metereologici, fino a proprietà fisico-chimiche delle molecole a questionari di sociologia. 

A differenza di altre istituzioni che scelgono uffici centralizzati per la definizione di pratiche di scienza aperta e per promuovere la gestione consapevole dei dati e dei prodotti della ricerca, il CNR ha optato per un modello di governance distribuita, costituita dai Data Steward che lavorano negli Istituti e Dipartimenti del CNR. La costituzione di una comunità di Data Steward ha proprio l'obiettivo di riunire le persone che già si occupano della gestione di questi dati e di mettere a sistema le loro conoscenze per creare una linea di azione condivisa tra tutti gli attori, e creare un legame tra la gestione del dato, che avviene a livello locale del singolo laboratorio, e la governance. 

La comunità è animata da un gruppo di coordinamento composto da quattro coordinatori rappresentativi degli ambiti disciplinari (Life Sciences, Social Sciences and Humanities, Physical Sciences and Engineering) e da un membro della sezione Open Science.  

Ad oggi la comunità riunisce più di 60 “Data Stewards” che ricoprono questo ruolo in maniera non ufficiale e con vari livelli di inquadramento, rappresentando l’infrastruttura umana a supporto della gestione responsabile dei dati e dei prodotti della ricerca. Riconoscere che questa figura esiste all’interno dell’Ente, e che svolge un ruolo fondamentale di supporto alla ricerca, è stato un passo fondamentale per riconoscere le esigenze della rete da un lato, e per promuovere un percorso condiviso a favore di una scienza aperta, e quindi riproducibile, dall’altro. In quest’ottica, è possibile immaginare anche un percorso che preveda la possibilità di un reclutamento mirato di Data Steward come figura pienamente istituzionalizzata. 

I primi passi della comunità: dal Documento di Visione al meeting di Roma 

La rete Data Steward del Consiglio Nazionale delle Ricerche (DS@CNR) è concepita come una comunità di pratica, unita da un Documento di Visione elaborato tra la fine del 2025 e l'inizio del 2026. Tale documento, inteso come un "living document" in continua evoluzione, definisce l'identità dei Data Steward come figure chiave per raccordare le esigenze della rete tecnico-scientifica con la strategia istituzionale. 

L'attività della comunità DS@CNR si articola su quattro linee d'azione prioritarie definite nel documento di visione: 

  1. Mappatura di competenze e servizi: Identificare chi sta già svolgendo compiti di data stewardship (spesso senza un riconoscimento formale) e quali infrastrutture e servizi sono già disponibili nell'ente. 

  1. Formazione e allineamento: Definire un livello minimo comune di competenze, all’interno della comunità, basato su framework europei come quelli sviluppati nel contesto del progetto Skills4EOSC, e creare un gruppo di formatori interni capaci di supportare l'intera comunità scientifica. 

  1. Armonizzazione delle pratiche: Sviluppare template e linee guida comuni per i Data Management Plan e per la metadatazione, rispettando le specificità dei diversi ambiti che caratterizzano l’Ente. 

  1. Networking: Collegare il CNR ai network nazionali (come la Comunità Italiana Data Steward - CIDS) ed europei per favorire lo scambio di buone pratiche. 

Un momento cruciale di questo percorso in continua evoluzione è stato l'incontro in presenza tenutosi il 18 e 19 febbraio 2026 presso la Biblioteca Centrale del CNR a Roma. Circa 40 esperti di gestione dei dati si sono riuniti per trasformare la visione teorica in gruppi di lavoro operativi. L'evento ha visto il confronto tra la rete interna e speaker di istituzioni esterne, rafforzando l'idea che la gestione responsabile, accessibile e FAIR dei dati e dei prodotti della ricerca sia un pilastro strategico della competitività scientifica. La pubblicazione dei contributi presentati dalla comunità DS@CNR nella seconda giornata di lavori offre un quadro articolato e multidisciplinare delle attività di data stewardship in corso, mettendo in luce sia le sfide condivise sia le opportunità di crescita e consolidamento della comunità all’interno dell’Ente. 

Primo incontro in presenza della comunità DS@CNR, presso la Biblioteca Centrale del Consiglio Nazionale delle Ricerche, 18-19 febbraio 2026, Roma

Le sfide per il futuro: verso una nuova professionalità 

La sfida del CNR è ora quella di passare da una partecipazione su base volontaria a un riconoscimento formale della figura del Data Steward. Consolidare questa rete e riconoscere formalmente la figura del data steward all’interno dell’Ente non è solo un atto formale, ma una scelta strategica per garantire che la ricerca italiana resti competitiva a livello europeo e che i frutti della scienza siano davvero un bene comune, accessibile a tutti. 

Per maggiori dettagli: comunità Zenodo DS@CNR  

Riferimenti

Castelli, D., De Simone, G., Cancedda, F., Candela, L., Colcelli, V., Conte, R., Di Donato, F., Giannini, S., Lazzeri, E., Mangiaracina, S., Puccinelli, R., & Ranchino, M. A. (2023). Roadmap Scienza Aperta. Consiglio Nazionale delle Ricerche. https://doi.org/10.57665/BICE_ROADMAP2023

Ferretti, R., Licciulli, F., Provost, L., Tarallo, A., & Lazzeri, E. (2026). Documento di visione dei Data Steward del CNR. Verso una rete strutturata per la gestione dei dati e dei risultati della ricerca (Technical Report). Consiglio Nazionale delle Ricerche. https://doi.org/10.57665/BICE_DATA2025

Whyte, A., Green, D., Evangelinou, B., Gingold, A., Di Giorgio, S., Koteska, B., Linés, C., Rauste, P., Sokolova, E., Sowinski, C., Torres Ramos, G., van Leersum, N., & Lines Diaz, C. (2025). D2.6 Catalogue of OS career profiles and MVS - update. Zenodo. https://doi.org/10.5281/zenodo.15731870 

Caccavale, M., Degl’Innocenti, E., Dema, C., Ferretti, R., Lazzeri, E., Licciulli, F. V., Lo Giudice, C., Manconi, A., Miniello, G., Modolo, I., Natilli, M., Oggioni, A., Provost, L., Spadi, A., & Tarallo, A. (2026). Incontro in presenza della comunità Data Steward del CNR DS@CNR. Consiglio Nazionale delle Ricerche. https://doi.org/10.57665/BICE_DATASTEWARD_02_2026 

Roberta Ferretti

Roberta Ferretti, laureata in Fisica e con un dottorato in Scienze della Terra e del Mare, è ricercatrice al Consiglio Nazionale delle Ricerche presso l’Istituto di Ingegneria del Mare di Genova (CNR-INM), dove si occupa di monitoraggio ambientale mediante piattaforme robotiche marine, anche in contesti operativi complessi. La produzione e gestione di grandi quantità di dati l’ha portata a sviluppare un forte interesse per la gestione FAIR dei dati della ricerca. Attualmente coordina il gruppo di lavoro della comunità Data Steward del CNR (DS@CNR), è vice-coordinatrice del gruppo di lavoro “Gestione Dati” della Nave GAIA BLU del CNR ed è membro dello steering board della Comunità Italiana Data Steward (CIDS).

Tutti i contenuti dell'autore
Andrea Tarallo

Andrea Tarallo, attualmente al CNR-IRET, è il punto di contatto per la FAIRness delle Infrastrutture di Ricerca ambientali nel dominio della biodiversità all'interno del progetto ITINERIS. Biologo marino di formazione, la sua carriera si è presto focalizzata sul supporto scientifico e manageriale alle Infrastrutture di Ricerca Europee, con particolare attenzione alla gestione dell’accesso a dati e servizi. Contribuisce allo sviluppo dell’infrastruttura LifeWatch Italy, dove supporta il processo di mobilizzazione dei dati della ricerca dalla comunità scientifica, lavorando per garantire che i dati siano raccolti, archiviati e condivisi in modo efficiente e conforme agli standard FAIR (Findable, Accessible, Interoperable, Reusable). È Associate Editor di FAIR Connect.

Tutti i contenuti dell'autore
Lottie Provost ​​​​​​​

Lottie Provost lavora presso l’Istituto di linguistica computazionale (ILC) del CNR di Pisa, il suo lavoro ruota attorno alla promozione e al'implementazione di pratiche Open Science, principalmente nelle SSH. Ha una formazione in Lingue e Scienze Sociali e in Gestione di Progetti Internazionali. È coinvolta nel progetto TRIPLE in cui c'è un task dedicato alla formazione sull’Open Science e l’EOSC. Nell'ambito di questo compito lavora anche alla FAIR-ificazione dei materiali di formazione.

Tutti i contenuti dell'autore
Flavio Licciulli

Flavio Licciulli, laureato in Scienze dell’Informazione, si occupa di Bioinformatica dal 2001 come membro del gruppo di Bioinformatica del CNR di Bari, dove ricopre il ruolo di primo tecnologo. Le attività sono focalizzate nell’ambito del Research Data Management (RDM). Esperto in organizzazione dati e costruzione di database e strumenti per l’integrazione di dati omici e applicazione dei principi FAIR. Competenze in sviluppo di pipeline per l'analisi di dati trascrittomici, in particolare di non-coding RNA. Esperto in gestione di data center e piattaforme Cloud e HPC per l'archiviazione, elaborazione e fruizione di dati appartenenti alle Scienze della Vita. Partecipo attivamente alle attività dell’infrastruttura europea ELIXIR (ESFRI) per la gestione ed analisi di dati in ambito Life Science; il sottoscritto è responsabile della infrastruttura computazionale (CNR.BiOmics) del CNR dedicata alla gestione, conservazione ed analisi di dati e applicazioni parte della piattaforma Compute di ELIXIR-IT. 

Tutti i contenuti dell'autore
Potrebbe interessarti anche
Pratiche di gestione dei dati: uno studio sui progetti di ricerca europei all’Università di Bologna

Un recente studio condotto su un set di Data Management Plan dell’Università di Bologna evidenzia che, nonostante la varietà disciplinare, molte pratiche di gestione dei dati sono condivise. Le criticità più frequenti riguardano privacy, diritti e conservazione a lungo termine, mentre la natura interdisciplinare dei dati e le scelte di accesso e riuso evidenziano bisogni comuni di supporto e formazione. Ne emerge l’importanza strategica dei servizi di data stewardship

Mappare la data stewardship in Italia: risultati della prima indagine nazionale

Negli ultimi anni la gestione dei dati di ricerca è diventata un tema sempre più centrale per garantire una scienza più trasparente, riproducibile e aperta. In questo contesto sta emergendo anche in Italia la figura del data steward, ovvero il professionista che supporta ricercatrici e ricercatori nella cura dei dati lungo l’intero ciclo di vita. Proprio per capire quanto e come questa figura sia già presente nel nostro paese, l’Italian Computing and Data Infrastructure (ICDI), con il...