I dati dalla ricerca tra protezione e licenze per il riuso

Aspetti legali dei dati scientifici
Immage from Pixabay
Sono un Ricercatore
e voglio informazioni su Gestione dei dati della ricerca

Il copyright può applicarsi ai database in quanto “forme espressive” - cioè in quanto creazioni intellettuali per cui gli autori hanno operato scelte creative nella organizzazione e disposizione del materiale. I dati in sé invece costituiscono porzioni di informazioni e frammenti di conoscenza e in quanto tali non possono essere coperti dal diritto d’autore. Esistono però degli  strumenti giuridici che disciplinano la protezione dei dati scientifici e dei diritti ad essi connessi. Vediamone i principali aspetti.

Partiamo dalle definizioni: innanzi tutto, che cos’è un dato?
I dati della ricerca sono informazioni raccolte o prodotte nel corso dell’attività scientifica. Di solito sono considerati elementi di prova necessari a convalidare conclusioni e risultati della ricerca, e possono essere classificati in vario modo. Si può distinguere tra dati grezzi o primari - cioè frutto diretto di misurazione o raccolta - e dati secondari, quando si riusano quelli prodotti da altri. I dati possono essere numerici, testuali, multimediali: per esempio, sono considerati dati le statistiche, le collezioni di immagini digitali, le registrazioni sonore, le trascrizioni di interviste eccetera. 
Dunque quando pariamo di "dati della ricerca" stiamo usando un termine generico che può riferirsi ad una varietà di informazioni e contenuti, espressi in diversi ‘formati’, e che possono avere carattere creativo o fattuale. 

In linea generale, i dati in quanto tali - così come i fatti, i principi, i concetti matematici, le idee, i metodi - non sono protetti da copyright, come comunemente si chiama la disciplina del diritto d’autore, che tutela gli aspetti patrimoniali e morali degli artefici di opere di ingegno e creative.

Tuttavia, possono essere diverse le ragioni per le quali si renda necessaria la protezione dei dati della ricerca e l’ordinamento giuridico prevede molteplici strumenti di tutela dei dati stessi e dei diritti ad essi connessi.

Per questa ragione è necessario sapere che

- Quando i dati sono raccolti in database possono essere protetti da copyright o dal diritto sui generis.

- I dati personali o sensibili sono protetti da norme specifiche come quelle del Regolamento sulla protezione dei dati - Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio del 27 aprile 2016 (GDPR).
- Alcuni dati possono essere protetti da contratti o regolati secondo policy istituzionali, aziendali, eccetera. O ancora, talvolta e in presenza di determinate condizioni, possono valere regole condivise all’interno di gruppi e comunità come, ad esempio, le best practices accademiche.
- Infine, taluni dati, in ragione del loro contenuto e dell’informazione che veicolano, possono necessitare di valutazioni etiche per essere utilizzati o ri-utilizzati.

 

Immagine da: Pavone, Gina, & Lazzeri, Emma. (2022, February 24). Open Science and Open Access. Why and how to guarantee openness to knowledge. Zenodo. https://doi.org/10.5281/zenodo.6257059

Dunque i dati sono informazioni che in sé per sé possono essere oggetto di molteplici strumenti e modelli di tutela. Tuttavia, il diritto d'autore può essere applicato alle banche dati in quanto “forme espressive”.

Cosa sapere sulla disciplina delle banche dati?
Secondo la normativa europea recepita in Italia, una banca dati è una «raccolta di opere, dati o altri elementi indipendenti sistematicamente o metodicamente disposti ed individualmente accessibili grazie a mezzi elettronici o in altro modo» (Direttiva 96/9/CE art. 1 n. 2). Più nello specifico, la Direttiva considera come banche dati anche le raccolte che “per la scelta o la disposizione del materiale costituiscono una creazione dell’ingegno propria del loro autore” (art. 3). Tuttavia, la tutela delle banche dati in base al diritto d’autore non si estende ai dati in essa contenuti, da cui deriva una distinzione tra una banca dati (o database) e il suo contenuto.

Le banche dati sono oggetto dei seguenti circuiti di tutela, quando:

  • la selezione e/o la disposizione dei contenuti sono una creazione intellettuale dell'autore, la protezione del copyright si applica alla struttura della banca dati e non al contenuto;
  • se c'è stato un investimento sostanziale per ottenere, verificare o presentare il contenuto di un database, si può applicare uno speciale diritto di proprietà intellettuale chiamato diritto sui generis database (SGDR).

Inoltre, è anche possibile che vi siano database di opere protette loro stesse dal copyright - si pensi a un database di articoli accademici pubblicati da editori commerciali - ma, in questo caso, non è la protezione della banca dati che si estende al contenuto: si tratta semplicemente di due diritti d’autore indipendenti applicati allo stesso database.


Ma definiamo meglio che cos’è il copyright.
La legge n. 633/1941 sul diritto d’autore protegge le opere dell’ingegno di carattere creativo - come opere letterarie, musicali, arti figurative, architettura, opere teatrali e cinematografiche - in qualunque forma espressiva e qualunque ne sia il modo. Sono protetti, altresì, i programmi per elaboratore (software) e le banche dati che per la scelta e disposizione del materiale costituiscono una creazione intellettuale dell’autore (art.1).

In Italia il diritto d’autore connesso alla creazione di un’opera comporta l’assegnazione di un diritto morale, inalienabile e senza scadenza, riferito alla paternità dell'opera, e un diritto patrimoniale, che comporta la possibilità di sfruttarla economicamente. Dunque il copyright assicura al proprietario (l’autore o gli autori) il diritto esclusivo di controllare certi diritti come la riproduzione, la ridistribuzione, la comunicazione al pubblico ecc. I diritti patrimoniali però si possono trasferire - ed è quello che succede quando gli autori di articoli scientifici firmano il cosiddetto copyright transfer agreement con editori commerciali.

E il diritto sui generis?
Il diritto sui generis rappresenta un diritto ad hoc sul contenuto della banca dati ed è diretto a tutelare il costitutore della medesima, cioè chi ha effettuato investimenti rilevanti per la realizzazione di una banca dati, per la sua verifica o la sua presentazione, impiegando mezzi finanziari, tempo e lavoro. La tutela riguarda la riproduzione e ri-disposizione dei dati memorizzati nella banca dati ove sono collocati, e si riconoscono al costitutore le prerogative per vietare l’estrazione e il reimpiego di una parte sostanziale o della totalità del contenuto della banca dati. Lo scopo del diritto sui generis è di salvaguardare adeguatamente le energie, il lavoro e i mezzi finanziari impiegati per realizzarla. Affinché la tutela attraverso il diritto sui generis sia operativa occorre che si realizzino le seguenti condizioni:

  • le risorse umane ed economiche, complessivamente intese come investimenti per la banca dati, devono essere rilevanti sia qualitativamente che quantitativamente;
  • il reimpiego ed estrazione dei contenuti della banca dati devono riguardare la totalità della medesima o una sua parte sostanziale.


Per quanto riguarda la durata della tutela,  per la protezione di un database o di parti sostanziali di essa mediante il diritto sui generis l’estensione temporale è di 15 anni, mentre il copyright, che riguarda le opere creative, è garantito per 70 anni con riferimento alla sua componente di sfruttamento economico, mentre rispetto al diritto morale, non vi è scadenza ed è sempre esercitabile dall’avente diritto. 

Sull’autore della ricerca.
C’è, inoltre, un altro importante aspetto da tenere in considerazione che riguarda gli autori scientifici: il titolare del copyright potrebbe essere, infatti, l’istituzione per cui il ricercatore lavora o in cui studia. A tal proposito, a seconda del contratto di lavoro e delle politiche di proprietà intellettuale dell'istituzione, la legge può riconoscere il copyright di un dipendente come proprietà del datore di lavoro. A questo possono aggiungersi eventuali contratti, per esempio con enti finanziatori. Un accordo di collaborazione o di finanziamento può, infatti, specificare che la proprietà della ricerca effettuata spetti al finanziatore, o che il finanziatore richieda l’uso di specifiche licenze. 

Come e perché usare una licenza?
Le licenze operano come strumento giuridico per stabilire le condizioni di utilizzo di prodotti da parte di altri seguendo il principio “alcuni diritti riservati”. Nel caso della ricerca, anche di quanto legittimamente protetto da copyright. Si tratta di formule contrattuali con cui il titolare di diritto concede al fruitore alcuni diritti sull’opera stessa. La definizione o la scelta della licenza dipende dalle circostanze e dai diritti vigenti sui dati. 
Per promuovere la condivisione e il riuso sono impiegate le licenze Creative Commons (CC), rispetto alle quali è necessario conoscere la struttura, il contenuto e la compatibilità o meno con l’Open Access con riguardo alla circolazione del materiale. È importante sapere che:

  • la versione NC - che sta per Non Commercial - vieta il riuso a fini commerciali. Per questo non è del tutto compatibile con l’Open Access.
  • attenzione all’uso di ND - che sta per Non Derivative- impedisce di distribuire l’opera derivata a seguito di trasformazione del materiale originale. In pratica, il materiale deve circolare intero, invariato e dando credito all’autore. Di conseguenza, a queste condizioni il riuso possibile è molto limitato. Tuttavia, ciò non esclude in automatico la compatibilità con l’Open Access. 
  •  lo schema SA - che sta per Share Alike- permette la diffusione di opere derivate, purché vi sia una licenza identica o compatibile con quella del materiale originale. Semplificando, il principio alla base di questa licenza è “condividi nella stessa maniera”. Pur limitando molto il riuso dell’opera, questa licenza non è incompatibile con l’Open Access e con le regole adottate dagli enti finanziatori che aderiscono a PlanS.
  •  il modello BY, che prevede la sola citazione dell’opera originale e dell’autore, consente di riusare e modificare liberamente. 

La versione CC-BY è, dunque, quella più coerente e in linea con i principi dell’Open Science.
In generale, nel caso di dati scientifici non strutturati in un database (su cui può esercitarsi il diritto d’autore), oppure per coloro che volessero favorire una loro maggiore circolazione e/o disseminazione delle informazioni, è possibile l’impiego della CC-0, destinando cioè l’opera (in questo caso i dati) al dominio pubblico attraverso la rinuncia a tutti i diritti.

 

In conclusione
L’approccio ai dati della ricerca può essere diverso a seconda di come questi siano gestititi e strutturati. Questo perché i dati, in sé per sé considerati, riferibili a isolate e singole informazioni, non prodotto di attività creativa o originale e non organizzati, sfuggono a una sola e unitaria disciplina. È quindi molto importante che si conoscano i diritti e le forme di tutela che l’ordinamento giuridico stabilisce quando i dati della ricerca sono utilizzati.
Il copyright e le licenze, rappresentano, ad oggi, i principali modelli di riferimento quando si tratta di dati della ricerca e, pertanto, qualsiasi strategia di gestione dei medesimi, anche attraverso il paradigma dell’Open Access, deve prenderne necessariamente in considerazione la disciplina.

Gina Pavone

Gina Pavone si occupa di Open Science e Open Access all'Istituto di scienza e tecnologie dell'informazione del CNR. Temi su cui svolge anche attività di formazione e supporto all’interno del Competence Centre di ICDI. Coordina il sito open-science.it, è giornalista esperta di analisi di dati, ha conseguito la laurea magistrale in editoria e giornalismo alla Sapienza di Roma e ha ottenuto il master di secondo livello in big data analytics and social mining all'università di Pisa. Ha partecipato a campagne per l'apertura di dati pubblici e per la trasparenza di istituzioni e amministrazioni pubbliche e ha lavorato come data analyst e data journalist.

Potrebbe interessarti anche
Gestire i dati, un compito fondamentale per se stessi e per gli altri

Le decisioni prese (o non prese) nelle prime fasi di un lavoro di ricerca hanno effetti importanti sul lavoro stesso e sulla sua futura diffusione. Le tecnologie da usare, la licenza di riuso da applicare, gli aspetti etici sono alcune delle questioni da non trascurare.

Cosa sono i principi FAIR

Documentazione, formati, identificatori persistenti, licenze, metadati. Tutti gli aspetti da curare per usare al meglio uno degli strumenti principali della scienza aperta.