martedì, Aprile 16, 2024
Uncategorized

Screen scraping e banche dati: il caso Ryanair contro Atrapalo

Il termine screen scraping non è certamente un concetto familiare ai più, ciononostante, la maggior parte degli utenti del World Wide Web è a contatto con tale fenomeno più di quanto si possa immaginare.

Difatti, è capitato a ciascuno di noi di voler prenotare una stanza di un hotel o un volo aereo, possibilmente con il prezzo più adatto alle proprie possibilità. In questo caso, invece di cercare nei siti web dei singoli hotel o compagnie aeree, è diffusa l’abitudine di utilizzare una delle piattaforme che forniscono, per ciascun hotel e tratta, tutti i prezzi disponibili nel web, al fine di permettere di scegliere il prezzo migliore.

Le piattaforme in questione[1] forniscono una lista di hotel e voli aerei, a volte comparando i prezzi proposti nei diversi siti web, utilizzando la tecnica dello screen scraping.

Dal punto di vista tecnico, lo screen scraping (o “web scraping”, “web harvesting”, o “web data extraction”) è una forma di data mining: è una tecnica informatica di estrazione di dati da un sito web[2]. Tale estrazione di dati viene effettuata grazie a un software che simula la navigazione effettuata da utenti reali, al fine di filtrare e acquisire informazioni, dunque dati, che non sempre sono di dominio pubblico. Tali dati estratti possono essere in seguito elaborati e, eventualmente, ordinati per formare un database.

Sono stati sollevati numerosi dubbi sulla liceità dell’operazione di estrazione di dati da siti web di terzi. Un primo approccio al tema è avvenuto da parte dei tribunali spagnoli nel caso Ryanair vs. Atrapalo, che, nei tre gradi di giudizio, ne ha affermato la liceità.

Il caso

Il caso in questione vede come attrice la compagnia aerea irlandese low cost Ryanair e come convenuta Atrapalo SL, agenzia di viaggi online. Quest’ultima, tramite la trecnica dello screen scraping, presenta sul sito atrapalo.com differenti offerte, consentendo agli utenti di prenotare stanze di hotel, acquistare biglietti aerei, biglietti del treno e, ex multis, prenotare ristoranti, ottenendo una percentuale su ciascun acquisto.

Uno dei siti web sui quali Atrapalo applica lo screen scraping è ryainair.com, estraendo dati sulle tratte aeree, gli orari e i prezzi.

1) Tribunal Mercantil di Barcellona, sentenza 11/2009

La società irlandese accusa Atrapalo di:

  • violare le condizioni di utilizzo del sito, vincolanti in base all’art. 5 della legge spagnola 7/98 sulle Condizioni Generali di Contrattazione, che vietano esplicitamente le attività di screen scraping;
  • violare il diritto sui generis e il diritto d’autore di Ryanair sui suoi database e di utilizzare tale banca dati indebitamente, non essendo un usuario legittimo, come descritto dalla legge spagnola sulla proprietà industriale;
  • concorrenza sleale, in quanto, la piattaforma si approfitterebbe in modo indebito della reputazione e degli sforzi di Ryanair.

Ryanair chiede dunque la cessazione della attività di screen scraping sul proprio sito.

La società convenuta, in merito alla prima accusa, sostiene la liceità dell’attività di screen scraping, in particolare poiché effettuata su dati resi pubblici dal titolare degli stessi, aggiungendo che condizioni di utilizzo che vietano tale pratica non sono valide. Segue sostenendo di non aver accettato le condizioni di utilizzo del sito ryanair.com, che dunque non sarebbero applicabili. Infine, afferma che Ryanair non può impedire che le offerte pubblicate sul suo sito siano considerate da un’agenzia di viaggi come Atrapalo.

In merito alla seconda accusa, la piattaforma online sostiene che Ryanair non avrebbe alcun diritto sui generis né diritto d’autore sulla sua banca dati, non avendo creato la base di dati, né avendo effettuato nessuna raccolta e ordine di dati.

Circa l’accusa di concorrenza sleale, sostiene che la sua qualità di usuario legittimo elimina l’ipotesi che si tratti di concorrenza sleale.

I giudici di primo grado del Tribunale Mercantile di Barcellona, con la sentenza 11 del 2009[3], affermano che:

  1. Atrapalo non è contrattualmente vincolato con Ryanair, dato che le condizioni di utilizzo del sito sono accettate dall’utente finale che acquista il biglietto, e non dalla piattaforma stessa. In assenza di vincolo contrattuale, non sussiste alcuna violazione delle condizioni da parte di Atrapalo. In aggiunta, il Tribunale sostiene che Ryanair, essendosi affidata ad internet per vendere i sui servizi, così come approfitta dei numerosi vantaggi della rete, allo stesso modo ne deve sopportare i rischi, come la perdita di controllo dei canali di commercializzazione dei voli.
  2. La banca dati di Ryanair non compie i requisiti previsti dalla legge per ottenere tutela del diritto d’autore, in particolare la necessità di trattarsi di una creazione intellettuale con il carattere di originalità. In aggiunta, dato che la compagnia presenta voli propri, non sarebbe incorsa in investimenti per ottenere o verificare i dati di terzi, che, come sostenuto dal Tribunale UE nella sentenza del 9 novembre del 2004, è un elemento necessario al fine di ottenere il diritto sui generis previsto dall’art 133 della legge spagnola sulla proprietà intellettuale. Inoltre, anche qualora Ryanair fosse titolare del diritto sui generis sul database, l’utilizzo effettuato da parte di Atrapalo non consisterebbe nel “porre a disposizione del pubblico della totalità o di parte sostanziale del contenuto del database”.
  3. Ryanair non ha il potere di controllare l’utilizzo che viene effettuato dei contenuti resi pubblici, in quanto tale potere non gli è attribuito da nessuna legge. In aggiunta, Atrapalo, essendo abilitata come agenzia di viaggi, attua legalmente come intermediatrice. L’utilizzo effettuato da Atrapalo del sito web di Ryanair non è dunque illegittimo, non violando concretamente nessuna legge, e non concreta la fattispecie di concorrenza sleale non creando alcun danno in capo alla compagnia aerea.

Il Tribunal, dunque, rigetta la domanda dell’attore, sostenendo la liceità dell’attività di screen scraping effettuata  da Atrapalo.

2) Audiencia Provincial de Barcelona, sentenza 15 dicembre 2009, 235/2009

I giudici del secondo grado di giudizio confermano quanto sostenuto in primo grado.

3) Tribunal Supremo, 9 ottobre 2012, 572/2012

Contro la sentenza della Audiencia Provincial viene proposto ricorso in cassazione innanzi al Tribunal Supremo.

Il Tribunal giunge a confermare[4] i due precedenti gradi di giudizio, posto che il ricorso non ha ad oggetto la revisione dei fatti, e l’assenza di database, nel senso giuridico del termine, è data come dato di fatto nella sentenza di primo grado.

Ciononostante, il Tribunal Supremo offre una lezione sul concetto di database, sul diritto sui generis e l’applicabilità del diritto d’autore alle banche dati, nonché sulla vincolatività dei termini e condizioni in casi simili.

L’esistenza di un database

In base alla Direttiva 96/9/CE, un database è una collezione di opere, dati o altri elementi indipendenti disposti in modo sistematico o metodico e accessibili individualmente per via elettronica o in altro modo.

Il Tribunale, al fine di interpretare la norma europea, si affida ad alcune pronunce della Corte Europea di Giustizia. In particolare, nella sentenza Fixtures Marketing C-444/02[5], la Corte sostiene che sussiste una base di dati nel caso in cui concorrano 4 requisiti:

  1. esista una raccolta di “elementi indipendenti”, cioè separabili l’uno dall’altro senza incidere sul valore del loro contenuto informativo, letterario, artistico, musicale o di altro tipo;
  2. che gli elementi costitutivi indipendenti della collezione siano disposti in modo sistematico o metodico;
  3. che la base di dati sia dotata di uno strumento tecnico, come procedure elettroniche, elettromagnetiche o elettro-ottiche, o un altro strumento, come un indice, un sommario, un piano o una modalità di classificazione che consenta di localizzare qualsiasi elemento indipendente contenuto al suo interno;
  4. che gli elementi siano individualmente accessibili.

La sentenza The British Horseracing Board e altri, C-203/02[6], chiarifica che la qualificazione di un database non dipende dall’esistenza di una creazione intellettuale del suo autore, in quanto tale elemento solo rileva al fine di determinare la possibile protezione conferita dal diritto d’autore alla base di dati.

L’applicabilità del diritto d’autore alle banche dati                                                          

Anche nel caso di un database, l’applicabilità del diritto d’autore è subordinata alla sussistenza dell’elemento dell’originalità. Tuttavia, l’originalità è da considerarsi in relazione alla struttura della banca dati, ossia la selezione o la disposizione del contenuto deve costituire una creazione intellettuale, come affermato dalla Corte Europea, nella sentenza Football Dataco Ltd e altri, C-604-10[7]. Dunque, l’autore, tramite la disposizione o selezione dei dati, deve esprimere la sua capacità creativa in modo originale con scelte libere e creative, dando in tal modo il suo tocco creativo.

Il diritto sui generis sui database

Al fine di fomentare la creazione di sistemi di archiviazione e trattamento di dati, la Direttiva 96/9/CE, all’articolo 7, ha riconosciuto ai creatori di database un diritto sui generis, legato non alla originalità della banca dati, ma piuttosto all’investimento in essa.

Come affermato nella Sentenza Fixtures Marketing Ltd[8] citata sopra, tale diritto sui generis è attribuito alle banche dati nel caso in cui l’ottenimento, la verifica o la presentazione del suo contenuto rappresentino un investimento sostanziale dal punto di vista quantitativo o qualitativo per il creatore. Tale investimento è da considerarsi, in modo generico, come lo sforzo per creare il database, sia dal punto di vista economico, di impiego di tempo o energia.

Il database non dev’essere necessariamente costituito da dati di terzi, bensì può essere legato all’esercizio di una attività principale e costituito di dati creati dal creatore del database stesso.

Il concetto di “estrazione” nello screen scraping

Il Tribunal, al fine di definire il concetto di “estrazione” richiama la sentenza della Corte europea Apis-Hristovich EOOD contro Lakord AD, C-545/07[9], dove viene affermato che il concetto di estrazione deve essere inteso in senso ampio, riferendosi a tutti gli atti di appropriazione, non autorizzati, di tutto o parte del contenuto di un database, a prescindere dal modus operandi seguito. L’estrazione è dunque un atto di trasferimento, permanente o temporaneo, che comporta l’incorporazione di tutto o parte del contenuto di un database in un altro supporto, diverso dalla banca dati originale, che può anche non essere un’altra banca dati.

Il Tribunal Supremo giunge a affermare la liceità dello screen scraping, partendo dal presupposto dell’inesistenza di una banca dati di Ryanair, sostenuta in primo grado. Su tale base, è possibile dunque affermare che l’attività di web scraping è lecita, qualora effettuata su un dataset[10] che non possiede le caratteristiche per essere definito giuridicamente come banca dati, o che, qualora le possieda, non sia tutelato da diritto sui generis o diritto d’autore.

Tuttavia, qualora i giudici avessero riconosciuto l’esistenza di un database, come avvenuto nella causa Ryanair contro Cheaptickets del 26 febbraio 2010 ad opera del Tribunale regionale di Amburgo, avrebbe potuto giungere ad una conclusione differente.

[1]Ciononostante, la comparazione di prezzi non l’unica funzione per cui è utilizzato il web scraping. Per ulteriori informazioni, si veda https://www.quora.com/What-are-examples-of-how-real-businesses-use-web-scraping-Are-there-any-types-of-businesses-which-use-this-more-than-others.

[2]https://it.wikipedia.org/wiki/Web_scraping

[3]Juzgado Mercantil de Barcelona, 21.01.2009, Sentencia 11/2009, procedimiento ordinario 214/2008, disponibile qui  https://www.scribd.com/document/19012491/Sentencia-Ryanair.

[4]Tribunal Supremo Civil, sala 1, sentencia nº 572/2012 9 de Octubre de 2012, disponible qui https://supremo.vlex.es/vid/desleal-ryanair-atrapalo-as-411388894.

[5]Corte Europea di Giustizia, grande sezione, 9 novembre 2004, Fixtures Marketing Ltd contro Organismos prognostikon agonon podosfairou AE (OPAP), disponibile qui http://curia.europa.eu/juris/liste.jsf?num=C-444/02.

[6]Corte di Giustizia, grande sezione, 9 novembre 2004, The British Horseracing Board Ltd e altri contro William Hill Organization Ltd., disponibile qui http://curia.europa.eu/juris/liste.jsf?language=it&num=C-203/02.

[7]Corte di Giustizia, terza sezione, 1 marzo 2012, Football Dataco Ltd e altri contro Yahoo! UK Ltd e altri, disponibile qui http://curia.europa.eu/juris/liste.jsf?num=C-604/10&language=IT.

[8]Corte di Giustizia, supra n. 5.

[9]Corte di Giustizia, Quarta Sezione, 5 marzo 2009, Apis-Hristovich EOOD contro Lakorda AD, disponibile qui http://curia.europa.eu/juris/liste.jsf?num=C-545/07.

[10] Un dataset è un insieme di dati, non ordinati a formare un database.

Lucrezia Berto

Classe 1992, piemontese di nascita ma milanese d’adozione, si laurea nel 2016 in giurisprudenza alla School of Law dell’Università Bocconi. Dopo l'inizio della carriera professionale negli Stati Uniti e la pratica forense presso uno dei principali studi legali milanesi, decide di seguire le sue passioni iscrivendosi all’LL.M in Law of Internet Technology dell’Università Bocconi. Attualmente vive in Spagna, a Barcellona, dove si occupa di consulenza in materia IP, IT e Data Protection a startup ad alto livello tecnologico. Appassionata di nuove tecnologie, proprietà intellettuale e big data, è un’amante dei viaggi e dello sport. Contatto: lucrezia.berto@iusinitinere.it

Lascia un commento