Scraping danych z internetu – jak to zrobić zgodnie z prawem?

pexels-thisisengineering-3861969
Arkadiusz Szczudło

Arkadiusz Szczudło

Jestem adwokatem, Partnerem Zarządzającym w kancelarii Creativa Legal, wiceprezesem fundacji Creativa Education, mentorem i twórcą internetowym. Specjalizuję się w prawie nowych technologii oraz prawnym wsparciu biznesu – w tym w szczególności e-commerce i biznesu online. Jestem ekspertem w zakresie prawnych aspektów technologii blockchain.

Spis treści

Rosnąca popularność narzędzi do scrapingu danych sprawia, że coraz więcej firm zastanawia się nad włączeniem do swojego biznesu nowych źródeł danych. O czym należy pamiętać wykorzystując scraping w swojej działalności przeczytasz w poniższym artykule.  

Podsumowanie na start 

Nie masz czasu na przeczytanie całego artykułu? Zapoznaj się z podsumowaniem na start! 

  1. Scraping nie jest wprost regulowany w polskim prawie. Nie ma także przepisu, który by wprost zabraniał jego stosowania.
  2. Scraping danych osobowych to rodzaj ich przetwarzania – wymaga posiadania podstawy prawnej i – co do zasady – spełnienia obowiązków informacyjnych oraz zapewnienia możliwości dochodzenia uprawnień przez osoby, których dane są przetwarzane. 
  3. Pozyskiwanie danych za pomocą scrapingu może wiązać się z kopiowaniem elementów objętych autorskimi prawami majątkowymi i osobistymi (grafiki, teksty). 
  4. Scrapowanie danych z platform aktywnie je gromadzących (własnym nakładem inwestycyjnym) może naruszać prawa producentów tych baz danych.  
  5. Regulamin platformy internetowej może mieć moc wiążącą nawet, gdy nie został przez Ciebie wprost zaakceptowany.  
  6. Jeśli scrapujesz dane z platformy, która wprost zabrania tego w swoim regulaminie – Twoje konto bądź połączenia z Twojego IP mogą zostać zablokowane.  

Scraping danych – o co chodzi? 

Scraping danych polega na zautomatyzowanym pobieraniu danych z platform internetowych przy wykorzystaniu dedykowanych narzędzi (oprogramowania). W ten sposób w krótkim czasie możliwe jest zebranie dużej ilości informacji, a następnie ich eksport, zestawienie z innymi danymi i dalsze wykorzystanie w biznesie.   

Efekty rosnącej popularności scrapingu danych możemy zaobserwować np. korzystając z porównywarek cen biletów lotniczych lub noclegów w hotelach. Dane pozyskane w ten sposób stanowią też istotne aktywo dla przedsiębiorców – pozwalają na analizę oferty czy polityk cenowych konkurentów.  

Co na to RODO? 

Zgodnie z art. 4 pkt 1 RODO, takimi danymi są „wszelkie informacje o zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej („osobie, której dane dotyczą”); możliwa do zidentyfikowania osoba fizyczna to osoba, którą można bezpośrednio lub pośrednio zidentyfikować, w szczególności na podstawie identyfikatora takiego jak imię i nazwisko, numer identyfikacyjny, dane o lokalizacji, identyfikator internetowy lub jeden bądź kilka szczególnych czynników określających fizyczną, fizjologiczną, genetyczną, psychiczną, ekonomiczną, kulturową lub społeczną tożsamość osoby fizycznej”.  

Zasada jest prosta. Jeżeli w grę wchodzą dane osobowe, przetwarzający je przedsiębiorca musi mieć podstawę prawną.  

W przypadku scrapingu danych takimi podstawami mogą być: zgoda osób, których te dane dotyczą (art. 6 ust. 1 lit. a) RODO) lub prawnie uzasadniony interes przedsiębiorcy (art. 6 ust. 1 lit. f) RODO). Pozyskanie zgód w praktyce byłoby jednak karkołomnym procesem. Z kolei opierając się na prawnie uzasadnionym interesie trzeba pamiętać o tym, że istnieje on tak długo, jak długo interes ten nie prowadzi do naruszenia praw osoby, której dane dotyczą, a jej dane są przetwarzane w sposób, którego racjonalnie mogła się spodziewać w danym kontekście. 

Z przetwarzaniem danych osobowych wiążą się także obowiązki informacyjne (art. 13 i art. 14 RODO) oraz obowiązki związane z zapewnieniem możliwości wykonania przez osoby, których dane dotyczą ich uprawnień, takich złożenie sprzeciwu wobec przetwarzania ich danych w celach marketingowych czy też zażądanie usunięcia danych.  

Uwaga: istnieje możliwość ograniczenia obowiązków informacyjnych, jeżeli będziesz w stanie wykazać, że ich wykonanie wymagałoby niewspółmiernie dużego wysiłku (art. 14 ust. 5 lit. b) RODO).  

Jeżeli scrapowane mają być duże zbiory danych osobowych, szczególnie danych „wrażliwych”, konieczne będzie także przeprowadzenie oceny skutków przetwarzania danych, dla osób, których dane dotyczą (art. 35 RODO). Ocena powinna uwzględniać w szczególności analizę ryzyka i konsekwencji naruszenia ochrony („wycieku”) danych dla osób, których te dane dotyczą.  

WAŻNE: uważajcie na narzędzia do webscrappingu, które umożliwiają przechwytywanie i analizę treści przesyłanych przez różne programy (aplikacje) pakietów danych (i np. powiązane z nimi keyloggery pozwalające na ustalenie, co użytkownik pisze na klawiaturze). Korzystanie z tego rodzaju oprogramowania to już nie tylko naruszenie przepisów RODO, ale może także skutkować odpowiedzialnością karną!

Prawa autorskie do scrapowanych treści 

Pozyskiwanie danych za pomocą scrapingu niekiedy wiąże się z kopiowaniem ze stron źródłowych elementów mogących stanowić przedmiot autorskich praw majątkowych, takich jak zdjęcia, grafiki lub teksty.  

Zgodnie z art. 1 ust. 1 Ustawy o prawie autorskim, utworem może być wyłącznie „przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażenia”. Utworami z pewnością nie będą dane takie jak cena towaru czy liczba ofert. Możemy natomiast mieć z nimi do czynienia w przypadku nazw produktów czy tytułów ofert, które mogą zawierać treści o charakterze twórczym.  

W tym kontekście jako ciekawostkę możemy przytoczyć wyrok Trybunału Sprawiedliwości Unii Europejskiej (dalej: „TSUE”) z 16 lipca 2009 r., C-5/08 w sprawie Infopaq International A/S przeciwko Danske Dagblades Forening, w którym TSUE stwierdził, że przechowywanie w pamięci komputera zawierającego jedynie 11 słów wycinka utworu podlegającego ochronie oraz na wydrukowaniu tego wycinka, może stanowić częściowe zwielokrotnianie utworu w rozumieniu przepisów o prawie autorskim.

Chcesz wiedzieć, czy Twój scraping będzie zgodny z prawem lub ryzykowny dla Twojego biznesu? Umów się na bezpłatną 15 minutową konsultację. Kliknij tutaj >

Ochrona baz danych 

Zgodnie z art. 2 ust. 1 pkt 1 ustawy o ochronie baz danych, baza danych to „zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody, indywidualnie dostępnych w jakikolwiek sposób, w tym środkami elektronicznymi, wymagający istotnego, co do jakości lub ilości, nakładu inwestycyjnego w celu sporządzenia, weryfikacji lub prezentacji jego zawartości”.  

Jeżeli scrapowane dane zostały zgromadzone na platformie gromadzącej je w sposób aktywny (poprzez ich poszukiwanie i włączenie do bazy, np. w formie encyklopedii), z dużym prawdopodobieństwem wymóg poniesienia istotnego nakładu inwestycyjnego jest spełniony.  

Natomiast jeśli baza powstała w sposób bierny, poprzez aktywność użytkowników – jej kwalifikacja jako baza danych podlegająca ochronie budzi istotne wątpliwości (choć nie można jej wykluczyć).  

Istotne z punktu widzenia scrappingu danych (choć raczej niekomercyjnego) wyjątki od zasady ochrony bazy danych wprowadza także art. 8 ust. 1 ustawy o ochronie baz danych, zgodnie z którym wolno korzystać z istotnej co do jakości lub ilości części rozpowszechnionych baz danych: 

  1. w charakterze ilustracji, w celach dydaktycznych lub badawczych (ze wskazaniem źródła), jeżeli takie korzystanie może zostać uzasadnione niekomercyjnym celem wykorzystania scrapowanej bazy; 
  2. do celów postepowań sądowych lub administracyjnych; 
  3. dla dobra osób niepełnosprawnych będących beneficjentami w rozumieniu przepisów o prawie autorskim i prawach pokrewnych, na zasadach określonych w tej ustawie – czyli w celu umożliwienia osobom niepełnosprawnym dostępu do twórczości.  

Powyższy zakres odstępstw od generalnego zakazu korzystania z cudzych baz danych potencjalnie może zostać rozszerzony na mocy nowej unijnej dyrektywy prawnoautorskiej. Projekt ustawy implementującej ww. dyrektywę przewiduje, że bazy danych będą mogły być wykorzystywane m.in. także w celu eksploracji tekstów i danych, chyba że uprawniony do nich podmiot zastrzegł inaczej i uczynił to w odpowiedni (zgodny z przepisami) sposób.  

Przepisy o świadczeniu usług drogą elektroniczną i regulaminy scrapowanych platform 

Korzystanie z platform internetowych (m.in. poprzez pobieranie zgromadzonych w nich danych) z zawarciem z jej właścicielem umowy o świadczenie usług drogą elektroniczną, której szczegółowe warunki będzie określał regulamin danej platformy.  

Taki regulamin wiąże nas nawet wówczas, gdy nie potwierdzimy wyraźnie jego akceptacji (art. 8 ust. 1 Ustawy o świadczeniu usług drogą elektroniczną).  

Powyższe sprawia, że naruszenie regulaminu będzie stanowiło nienależyte wykonanie zobowiązania po stronie podmiotu scrapującego, które może uprawniać właściciela platformy do zablokowania dostępu do niej oraz wystąpienia z roszczeniami odszkodowawczymi (co jednak wymagałoby wykazania poniesienia przez niego szkody na skutek scrapingu).  

CIEKAWOSTKA: Jak scraperzy starają się obejść zabezpieczenia? Najczęściej poprzez stosowanie VPN-ów, ustawianie zmiennych odstępów pomiędzy wysłanymi zapytaniami, ustawienie adresu ostatnio ustawionej strony na neutralną, np. google.com (tak, by symulować naturalny ruch z wyszukiwarki).  

Jak radzą sobie z nimi administratorzy? Ustawiają pułapki (honeypoty), tworzą czarne listy adresów IP, spam listy, captche, aby – niezależnie od prawnych aspektów scrapowania – wyeliminować aktywność potencjalnie negatywnie wpływającą na dostępność i funkcjonalność usług. 

Nieuczciwa konkurencja  

Zgodnie z art. 3 ust. 1 Ustawy o zwalczaniu nieuczciwej konkurencji, czynem nieuczciwej konkurencji jest „działanie sprzeczne z prawem lub dobrymi obyczajami, jeżeli zagraża lub narusza interes innego przedsiębiorcy lub klienta”. Aby zatem doszło do popełnienia takiego czynu, konieczne jest łączne wystąpienie następujących przesłanek:  

  1. sprzeczności danego działania z prawem lub dobrymi obyczajami oraz   
  2. naruszenia interesu innego przedsiębiorcy lub klienta.  

Przede wszystkim: żaden przepis nie zabrania scrapingu danych. Jak jednak sygnalizowaliśmy, scrapowanie danych, a następnie ich udostępnianie może zostać uznane za nieuprawnioną ingerencję w prawa właściciela platformy jako producenta bazy danych, co w konsekwencji prowadziłoby do przyjęcia sprzeczności przedsięwzięcia z prawem.  

Z naruszeniem interesu innego przedsiębiorcy lub klienta możemy mieć do czynienia m.in. w następujących sytuacjach: 

  1. scrapowanie danych z platformy, która wprost zabrania tego w swoim regulaminie (co wskazywałoby, że jej właściciel postrzega scraping jako działanie na swoją szkodę); 
  2. scrapowanie w sposób obciążający platformę, utrudniając lub uniemożliwiając jej prawidłowe działanie (np. obciążenie serwera); 
  3. wykorzystywania danych do stworzenia alternatywy dla usług oferowanych przez właściciela platformy (konkurenta).  

Skorzystaj z 15 minutowej
bezpłatnej konsultacji

Stoisz przed wyzwaniem? Szukasz najlepszego rozwiązania dla swojego problemu, który opisałem w tym artykule? 

Skorzystaj z 15 minutowej bezpłatnej konsultacji, podczas której udzielę odpowiedzi na Twoje pytania i sprawdzimy, czy mogę pomóc w rozwoju Twojego biznesu.

Napisz do mnie poprzez poniższy formularz lub na adres a.szczudlo@creativa.legal i umów się na rozmowę.

Administratorem Twoich danych osobowych będzie kancelaria Creativa Legal sp.p. Przeczytaj więcej w naszej Polityce prywatności.

Mam zescrapowaną bazę danych – co teraz?

Ocena prawnego ryzyka związanego z korzystaniem z zescrapowanych danych zależy przede wszystkim od celu, w jakim zamierzamy z nich korzystać. 

Jeżeli dane mają być wykorzystywane wyłącznie na własne, niekomercyjne potrzeby i nie zostały zebrane z naruszeniem prawa – ich dalsze przechowywanie czy analizowanie nie rodzi prawnego ryzyka. 

Jeśli jednak dane mają zostać wykorzystane w ramach prowadzonego biznesu, trzeba zachować szczególną ostrożność w kontekście omówionych wcześniej przepisów. 

Jednym z najpopularniejszych sposobów wykorzystania zescrapowanych danych jest cold mailing, czyli przesyłanie maili niebędących informacją handlową (której przesyłanie wymaga uzyskania zgody na gruncie Ustawy o świadczeniu usług drogą elektroniczną oraz Prawa telekomunikacyjnego) do osób, z którymi przedsiębiorca nie miał dotychczas żadnych relacji biznesowych. 

W praktyce często spotykany jest dwuetapowy cold mailingW etapie pierwszym przedsiębiorca „na miękko” zwraca się do potencjalnego klienta lub kontrahenta, zachęcając go do wyrażenia zgody lub wykazania zainteresowania ofertą handlową. W kroku drugim do adresata, który wyraził zainteresowanie, może zostać przesłana oferta handlowa. 

Chcesz wiedzieć więcej na temat mailingu i legalnego newslettera? Przeczytaj nasz kompleksowy poradnik: https://creativa.legal/legalny-newsletter-krok-po-kroku/

Na zakończenie 

Choć ryzyko jest nieodłącznym elementem biznesu, warto je minimalizować. Narzędzia umożliwiające scraping danych są coraz bardziej popularne, łatwo dostępne i mogą otworzyć nowe możliwości rozwoju Twojej działalności.  Zachęcamy jednak do weryfikacji sposobu ich działania, aby nie narazić się na „bana” lub odpowiedzialność odszkodowawczą. 

Mam nadzieję, że niniejszy artykuł ułatwi Ci przeprowadzenie kompleksowej oceny planowanego przedsięwzięcia. Jeśli jeszcze masz pytania, wątpliwości lub szukasz profesjonalnego wsparcia, zachęcamy do kontaktu z naszą Kancelarią. 

Artykuł powstał przy współpracy zespołu kancelarii Creativa Legal. 

Zdjęcie dodane przez ThisIsEngineering.

W czym mogę Ci pomóc?

Arkadiusz Szczudło

Jestem adwokatem, wspólnikiem w kancelarii Creativa Legal, wiceprezesem fundacji Creativa Education, mentorem i twórcą internetowym.

Specjalizuję się w prawie nowych technologii oraz prawnym wsparciu biznesu – w tym w szczególności e-commerce i biznesu online. Jestem ekspertem w zakresie prawnych aspektów technologii blockchain.

Pomagam przedsiębiorcom m.in. w sporządzaniu umów i regulaminów ochronie danych osobowych i własności intelektualnej oraz prawie reklamy i mediów. Wspieram w zwalczaniu nieuczciwej konkurencji – w tym na rynku chińskim.

Chcesz porozmawiać o swoich bolączkach?
Napisz do mnie na a.szczudlo@creativa.legal lub skorzystaj z przycisku poniżej i wypełnij formularz. Sprawdź, czy możemy pomóc w rozwoju Twojego biznesu.

Subskrybuj newsletter
i bądź na bieżąco!

Otrzymuj informacje o nowościach w prawie, nowych artykułach, produktach, usługach, czy szkoleniach od kancelarii Creativa Legal.

Dołącz do ponad 6000 innych osób, które już nam zaufało!

Przeczytaj, w jaki sposób przetwarzamy Twoje dane osobowe w naszej Polityce prywatności.

Nowe zmiany prawa dla e-commerce
od stycznia 2023!

Jeżeli prowadzisz lub zarządzasz sklepem internetowym, musisz być z nami. Weź udział w bezpłatnym szkoleniu, już 13 grudnia o 19:00!

Dowiedz się, jakie zmiany czekają na Ciebie – oraz jak się prosto, szybko i tanio do nich dostosować! Otrzymasz od nas gotowe rozwiązania!