Studio della specie marina invasiva L. sceleratus attraverso il riuso di dati e algoritmi FAIR

Pratiche di Open Science
Hanna Morris Unsplash
Sono un Ricercatore
e voglio informazioni su Gestione dei dati della ricerca

Lo studio della diffusione di una pericolosa specie marina invasiva (L. sceleratus) nel Mediterraneo è stato condotto riusando dati e modelli di machine learning FAIR, con un approccio Open Science che ha permesso di strutturare un flusso di lavoro in cui ogni passaggio è ripercorribile e riproducibile. I risultati dello studio sono stati inclusi negli avvisi ufficiali della FAO per le nazioni del Mediterraneo

Di cosa si tratta 

Il lavoro aveva l'obiettivo di predire dell’impatto futuro (densità di zone colonizzate) sulle nazioni del Mediterraneo dell'espansione della specie invasiva L. sceleratus. Lo studio è stato condotto applicando un ensemble di modelli di machine learning per l’apprendimento delle caratteristiche ambientali favorevoli all’espansione della specie e la predizione dell’impatto futuro.

Per questo esperimento sono stati riusati dati FAIR di parametri ambientali, osservazioni di specie, e modelli aperti e riusabili di machine learning. Abbiamo inoltre utilizzato l’infrastruttura D4Science per collaborare. Alcuni degli autori non si sono mai incontrati fisicamemente ma hanno interagito grazie alle funzionalità di supporto al lavoro cooperativo offerto dal Virtual Research Environment dell’infrastruttura.

L'approccio è descritto nell’articolo: Coro, G., Vilas, L. G., Magliozzi, C., Ellenbroek, A., Scarponi, P., & Pagano, P. (2018). Forecasting the ongoing invasion of Lagocephalus sceleratus in the Mediterranean Sea. Ecological Modelling, 371, 37-49.

Enti e/o progetti di riferimento 

L’esperimento è stato sviluppato nel contesto del progetto europeo BlueBRIDGE (grant agreement no. 675680). Gli autori appartenevano ai seguenti istituti/organizzazioni: 

  • Istituto di Scienza e Tecnologie dell’Informazione “Alessandro Faedo” – CNR, Pisa, Italy

  • Food and Agriculture Organization of the United Nations (FAO), Rome, Italy

  • University of Vigo, Pontevedra, Spain

  • Cranfield Water Science Institute, Cranfield University, Cranfield, United Kingdom

Approccio Open Science 

Per realizzare questo lavoro sono stati usati dati e modelli machine learning FAIR messi a disposizione da altre infrastrutture. Inoltre, l’intero esperimento è stato condotto seguendo l’approccio Open Science. In particolare, l’esperimento è stato pubblicato come un Workflow  descritto da una successione di link a servizi aperti (processi) con  interfaccia standardizzata (Web Processing Service). Questa scelta permette la riproducibilità e la ripetibilità di ogni passo dell’esperimento stesso, i cui risultati sono stati pubblicati in maniera armonizzata su un catalogo dell’infrastruttura D4Science orientato al paradigma FAIR.

L’approccio OS è stato inoltre fondamentale per convincere i decision maker della FAO ad includere i risultati nelle loro direttive ufficiali per i paesi del Mediterraneo, essendo i risultati e la metodologia completamente trasparenti. 

Lesson learned 

L’approccio Open Science ha permesso di velocizzare la realizzazione dell’esperimento e di combinaree efficacemente le competenze complementari degli autori, che hanno dunque apprezzato e verificato le potenzialità dell’Open Science. Tuttavia, non esiste ad oggi un sistema premiale per chi sviluppa le proprie metodologie orientandole all’Open Science, per esempio un risultato scientifico oggi non viene valutato in relazione alla sua ripetibilità e riuso. 

Difficoltà o questioni aperte 

I tool per massimizzare la conformità delle metodologie al paradigma dell’OS sono troppo difficili da usare per chi non proviene da un ambito informatico. Affinché l’OS venga adottato da ampiamente dalla comunità scientifica, l’OS deve diventare una disciplina, abbandonando il suo attuale status preponderante di filosofia.

Riferimenti scientifici e materiali divulgativi

  • Articolo scientifico:

Coro, G., Vilas, L. G., Magliozzi, C., Ellenbroek, A., Scarponi, P., & Pagano, P. (2018). Forecasting the ongoing invasion of Lagocephalus sceleratus in the Mediterranean Sea. Ecological Modelling, 371, 37-49.

  • Materiali di disseminazione:

News del Cnr che ha rilanciato un’intervista su New Scientist dedicata all’argomento

News Cnr sulla selezione EOSC dell’esperimento

Report FAO che include i risultati descritti


Pratiche di Open Science è una raccolta di iniziative, buone pratiche, storie, prodotti o casi d’uso utili per raccontare l’implementazione dei principi della scienza aperta. L’intento è dare visibilità a casi concreti in cui si sia generato un esito virtuoso per i valori della scienza aperta, per esempio in termini di riuso, rielaborazione e costruzione di prodotti derivati eccetera. Per proporre un contenuto scrivere a info@open-science.it

 

Gianpaolo Coro

Gianpaolo Coro si è laureato in Fisica nel 2004 presso l'Università di Napoli "Federico II". Presso la stessa Università, nel 2007, ha conseguito il dottorato di ricerca in Informatica. La sua attività di ricerca è dedicata a Intelligenza Artificiale e sul Data Mining. In particolare, ha lavorato nel campo delle tecnologie linguistiche presso le Università di Napoli e Salerno e presso la Fondazione Ugo Bordoni di Roma. Dal 2013 è ricercatore presso l'ISTI-CNR, nel laboratorio InfraScience. Negli ultimi dieci anni si è occupato di applicazioni dell'Intelligenza Artificiale alla biologia computazionale, al monitoraggio della pesca e dell'ambiente, alle scienze cognitive e alle interfacce uomo-computer, in progetti europei e internazionali. Il suo approccio combina l'intelligenza artificiale con sistemi informatici distribuiti e utilizza il calcolo parallelo, il cloud e il grid computing in conformità con il paradigma dell'Open Science. È anche coinvolto in attività di insegnamento in università europee (Università Sorbona e Università di Pisa).

Tutti i contenuti dell'autore
Potrebbe interessarti anche
Cosa sono i principi FAIR

Documentazione, formati, identificatori persistenti, licenze, metadati. Tutti gli aspetti da curare per usare al meglio uno degli strumenti principali della scienza aperta.

Gestire i dati, un compito fondamentale per se stessi e per gli altri

Le decisioni prese (o non prese) nelle prime fasi di un lavoro di ricerca hanno effetti importanti sul lavoro stesso e sulla sua futura diffusione. Le tecnologie da usare, la licenza di riuso da applicare, gli aspetti etici sono alcune delle questioni da non trascurare.