Wydawcy całego świata — łączcie się! Jak bronić treści przed grabieżczymi botami AI

Najważniejsze wnioski w pigułce

Skala problemu:

Według Similarweb branża News & Media otrzymała w kwietniu 2026 jedynie 0,27% ruchu z chatbotów AI — mniej niż jedna trzecia procenta
Mimo że chatboty AI mają 100 milionów aktywnych użytkowników miesięcznie w USA, wydawcy praktycznie nie widzą z tego korzyści
Ruch z botów już przewyższa ruch ludzki w internecie, a trend ten będzie się tylko nasilał

Zagrożenia ze strony botów:

Wiele botów AI (np. Perplexity, Tavily, Exa) nie respektuje pliku robots.txt i stosuje różne techniki unikania wykrycia
Boty potrafią ominąć paywalle w 0,19 sekundy — szybciej niż mechanizmy JavaScript zdążą je zablokować
Pojedynczy bot może próbować uzyskać dostęp do strony ponad 564 000 razy w ciągu tygodnia

Google jako rosnące zagrożenie:

Od wprowadzenia AI Overviews w maju 2024 wydawcy zanotowali spadek kliknięć o 49%
Google przechodzi od modelu „dziesięciu niebieskich linków" do chatbota AI, co może drastycznie obniżyć ruch
Gdy udział ruchu z Google Search spadnie poniżej pewnego poziomu, wydawcy mogą rozważyć zablokowanie Googlebota

Dostępne rozwiązania:

Platformy jak Cloudflare, Akamai, Fastly oferują zaawansowane systemy ochrony przed botami
Rozwiązania do licencjonowania treści (TollBit, Prorata, x402) umożliwiają monetyzację dostępu dla AI
Należy przyjąć strategię „domyślnie blokuj, zezwalaj po uzgodnieniu" — kontrolować każdy bot według wartości, jaką przynosi

Dość grabieży — wydawcy muszą działać teraz

Generatywna sztuczna inteligencja stanowi bezpośrednie zagrożenie dla otwartego internetu, dziennikarstwa i całej branży mediowej. Relacja między dużymi modelami językowymi (LLM) a wydawcami ma charakter drapieżny i wykorzystujący — a gdy Google wprowadzi najnowsze zmiany w wyszukiwarce, degradując tradycyjne wyniki na rzecz konwersacyjnych chatbotów, kryzys może osiągnąć rozmiary egzystencjalne.

Wydawcy tacy jak People Inc. i The Atlantic już rozpoczęli agresywną strategię blokowania botów. To podejście pozwala szerszej branży wydawniczej rozwinąć strategię „blokuj domyślnie, zezwalaj po uzgodnieniu", zapobiec bezpłatnemu dostępowi złych aktorów do treści oraz stworzyć pozycję negocjacyjną do zawierania umów licencyjnych z laboratoriami AI.

Platformy takie jak Cloudflare, Akamai, Fastly, HUMAN czy DataDome oferują rozwiązania umożliwiające raportowanie i blokowanie botów. Inne firmy, jak TollBit, Prorata czy x402, rozwijają protokoły licencjonowania i monetyzacji. Rynek zidentyfikował potrzebę — i ekosystem narzędzi do ochrony praw własności intelektualnej wydawców zaczyna powstawać.

Generatywna AI — dar, który wciąż zabiera

Dane Similarweb z kwietnia 2026 pokazują brutalną rzeczywistość: generatywna AI odpowiadała za zaledwie 0,27% udziału w ruchu do całej branży News & Media w USA. To oznacza, że mimo prawie 100 milionów miesięcznie aktywnych użytkowników chatbotów AI w Stanach Zjednoczonych (prawie jedna trzecia populacji USA korzysta regularnie z chatbotów), wydawcy otrzymują znikomą wartość w zamian.

W ciągu 3,5 roku od uruchomienia ChatGPT jego adopcja eksplodowała, ale chatboty zostały zaprojektowane tak, by zatrzymywać użytkowników w swoim środowisku. Linki i odesłania do oryginalnych źródeł są traktowane po macoszemu. W porównaniu z dwoma największymi źródłami ruchu — bezpośrednim i organicznym wyszukiwaniem — linia trendu generatywnej AI wygląda jak płaska kreska, ledwo widoczna na wykresie.

Na tym minimalnym poziomie odesłań LLM-y są zagrożeniami bezpieczeństwa i „pożeraczami" zasobów, działającymi jako hurtowi złodzieje treści, nie dostarczając wydawcom praktycznie nic w zamian.

Postaw bramkarza przy drzwiach — wpuszczaj tylko VIP-ów

Gdy The Atlantic i People Inc. przeanalizowały ruch botów, obie doszły do tego samego wniosku: strategia otwartych drzwi była szkodliwa dla ich biznesu. The Atlantic stworzył dashboard botów, ocenił, które boty dostarczają wartość w postaci ruchu i subskrypcji, a następnie zablokował wszystkie, które nie spełniały kryteriów. W skrajnym przypadku The Atlantic zapobiegł pojedynczemu botowi, który próbował uzyskać dostęp do witryny 564 000 razy w ciągu siedmiu dni. Jon Roberts, Chief Innovation Officer w People Inc., powiedział Digiday, że ograniczenia botów zaowocowały blokowaniem dziesiątek milionów prób crawlowania dziennie w ich sieci.

Trzeba jasno powiedzieć — blokowanie botów nie jest zadaniem trywialnym. Deklarowanie wykluczeń botów w pliku robots.txt to tylko pierwsza i najbardziej podstawowa linia obrony. Niestety, jak donosi Cloudflare, platformy AI takie jak Perplexity nie respektują tej długo ustalonej normy, a nawet uciekają się do eskalujących poziomów podstępu — podszywania się pod przeglądarki Chrome, wykorzystywania wielu niezadeklarowanych adresów IP czy rotowania ASN. Cloudflare musiał przeprowadzić wyrafinowaną operację „honeypot", aby przyłapać Perplexity na gorącym uczynku.

Co niewiarygodne, Perplexity nie jest nawet najgorszym aktorem. Wiele botów wykorzystuje różnorodne techniki unikania wykrycia, co sprawia, że są coraz trudniejsze do zidentyfikowania. Te, które się przedostaną, często potrafią ominąć paywalle — więc najdroższe, najbardziej czasochłonne i najcenniejsze treści wydawców są również często grabione. Firmy prowadzące te boty, jak Tavily, otwarcie dokumentują swoją pogardę dla norm webowych: „Crawler wyszukiwania Tavily nie ogłasza zróżnicowanego user agenta, ponieważ musimy unikać dyskryminacji ze strony stron internetowych, które pozwalają crawlować tylko Google". Inne, jak Firecrawl i Exa, nie są dobrze znane, więc nie są wyraźnie blokowane. Na przykład tylko 4% z 220 wydawców zbadanych przez Define Media Group wyraźnie blokowało Exabota.

Te usługi istnieją po to, aby dostarczać treści firmom takim jak — zgadliście — LLM-y, oferując im dostęp „tylnymi drzwiami", nawet jeśli bot LLM został zablokowany przed crawlowaniem. Jeden z naszych klientów, korzystając z TollBit, był w stanie ustalić, że Exa był w stanie pobrać pełną wersję markdown artykułu za paywallem w ciągu 0,19 sekundy — szybciej niż mechanizmy oparte na JavaScript mogły renderować paywall, aby go zablokować. Nie dość, że łatwo jest botom kraść treści za bramką płatności, to jeszcze bezpośrednio na tym zarabiają, pobierając opłaty od platform AI za dostęp do zastrzeżonych materiałów. Wydawcy tymczasem mogą nawet nie wiedzieć, że to się dzieje.

I ty, Google?

Na początku 2024 Google był wciąż głównie wyszukiwarką. Ale uruchomienie ChatGPT w listopadzie 2022 postawiło giganta wyszukiwania w defensywie. Początkową odpowiedzią Google na to zagrożenie było hybrydowe podejście zwane AI Overviews (AIO), uruchomione w maju 2024. To generatywne podsumowanie zostało umieszczone na górze wyników wyszukiwania i, jak wszystkie treści generowane przez AI, syntezowało informacje z różnych źródeł. Pomimo publicznych oświadczeń Liz Reid, wiceprezes Google ds. wyszukiwania, i Sundara Pichaia, CEO Google, twierdzących inaczej, AIO pozostawiały niewielką potrzebę klikania przez użytkowników.

Widzimy bezpośredni wpływ w naszej kohorcie wydawców. Od uruchomienia AIO kliknięcia spadły o 49%. Jednak pomimo tej utraty ruchu wyszukiwania z powodu AIO, Similarweb donosi, że wyszukiwarki mają 23% udziału w ruchu, na drugim miejscu — po ruchu bezpośrednim — wśród wszystkich kanałów marketingowych. Google ma monopol na wyszukiwarki, więc zdecydowana większość 23% udziału w rynku wyszukiwania organicznego pochodzi od nich.

Od początku było jasne, że implementacja AIO przez Google była półśrodkiem i że Google intensywnie pracował nad prawdziwie AI-first doświadczeniem. Na konferencji Google I/O w maju Google ogłosił, że ta agentyczna aktualizacja zostanie wydana latem. Google Search zmienia się na zawsze, głęboko integrując generatywną i agentyczną AI w doświadczenie użytkownika. Google degraduje „dziesięć niebieskich linków", które były jego znakiem rozpoznawczym, redukując pojawienie się fundamentalnej jednostki, która pozwalała na sprawiedliwą relację między wyszukiwarką a wydawcami.

Jeśli Google w pełni przekształci się z wyszukiwarki w chatbota opartego na agentach, wydaje się nieuniknione, że spadki ruchu wydawców przyspieszą, a wraz z nimi rynek reklamowy i związane z nim przychody, na których w dużej mierze polegają. Udział wyszukiwania wynosi obecnie 23% — ale co, jeśli ta wartość dalej eroduje do 15%, 10% lub 5%? Istnieje punkt, w którym ekonomia jednostkowa pozwalająca Googlebotowi na dostęp do treści wydawców może już nie mieć sensu. Jeśli lub kiedy to nastąpi, wydawcy mogą być zmuszeni rozważyć coś, co kiedyś było nie do pomyślenia: umieszczenie Googlebota na liście zakazanych botów. Jeśli doświadczenie wyszukiwania AI Googlebota działa jak LLM-y — gromadząc użytkowników zamiast dzielić się nimi z otwartym internetem — to dlaczego miałby być traktowany inaczej niż jakikolwiek inny pasożytniczy bot?

Wyobraź sobie przyszłość, w której wydawcy mają kontrolę

Ruch botów już przekroczył ruch ludzki w sieci — stało się to szybciej, niż spodziewał się CEO Cloudflare. Aktywność botów w sieci będzie tylko rosnąć, zwłaszcza gdy agentyczna AI stanie się mainstreamem. Nietrudno wyobrazić sobie scenariusz, w którym 90% lub więcej całego ruchu internetowego pochodzi z botów, gdy agentyczna AI zostanie zintegrowana i będzie działać w tle najpopularniejszych platform konsumenckich.

Jesteśmy w punkcie zwrotnym. Wydawcy ponieśli ogromne straty. Ale wciąż jest nadzieja, ponieważ najbardziej wartościowy zasób dla laboratoriów AI — napisane przez człowieka słowo — nie jest i z definicji nigdy nie może być generowany przez duży model językowy. Firmy stojące za tymi botami uznają, że ludzka ekspresja jest siłą napędową ich produktu, dlatego są gotowi ją nabyć wszelkimi środkami.

Infrastruktura i organizacje są na miejscu, właśnie teraz, aby pomóc wydawcom regulować i chronić ich cenny zasób. Możemy wyobrazić sobie świat, w niedalekiej przyszłości, w którym kontrola botów jest ustandaryzowana w ekosystemie wydawniczym, gdzie dostęp do treści wiąże się z godziwą wartością kosztową dla laboratoriów AI, gdzie istnieje równoległa sieć dla ludzi i botów AI oraz gdzie ekonomiczne zachęty dla prawdziwych ludzi do tworzenia prawdziwych ludzkich treści są zachowane dla następnego pokolenia i dalej. Ale okno na manifestację tego świata się zamyka. To od wydawców zależy, czy zajmą stanowisko i sprawią, że to się stanie — teraz.

Źródło: Define Media Group, „Publishers of the World, Unite!", czerwiec 2026