Standardowym pytaniem, jakie otrzymuję podczas konsultacji, głównie od specjalistów SEO to pytanie czy robić content clean up. Faktycznie nie ma w branży zgody co do tego podejścia i rozumiem te rozterki, zwłaszcza że wielu szanowanych ekspertów SEO jest przeciwnych usuwaniu treści z serwisu. Moje doświadczenie z tego typu operacjami bazuje głównie na dużych serwisach mediowych, co nie znaczy że nie powinno podejmować się takich działań w e-commerce – wręcz przeciwnie. Decyzje o usuwaniu treści podejmowałem zawsze w oparciu o własne przemyślenia i dane oraz po jasnym określeniu tego co chcemy osiągnąć takim działaniem i jaki jest cel. Poniżej spisałem jak ja podchodzę do tego.
Czy robić content clean up
Odpowiedź jest krótka – TAK. Porządki tego typu w serwisie powinny być robione cyklicznie, zwłaszcza w czasach kiedy Google staje się coraz wybredniejszy na nasze treści i odpala update’y typu helpful content. Jeżeli tego typu działania nigdy nie były podejmowane, to ten pierwszy raz zawsze będzie wyzwaniem i trzeba do niego podejść ze szczególną ostrożnością i często sam proces usuwania rozłożyć na kilka etapów.
Jaki jest cel Content Clean UP
Usunięcie niewartościowych i nie aktualnych artykułów wymaga argumentów. Nie da się tego zrobić, bo tak po prostu trzeba, zawsze pojawi się pytanie co nam to da. Poniżej kilka argumentów, które mogą pomóc w przekonaniu nieprzekonanych.
Optymalizacja indeksowania – zwiększenie szybkości indeksowania nowych i zaktualizowanych treści przez wyszukiwarki, co przełoży się na szybszą widoczność dla czytelników. Względnie łatwe do zmierzenia – jeżeli artykuły w serwisie mediowym indeksują się dłużej niż 5 minut, to już powinna nam się zapalić lampka. Ten argument jest też bardzo skuteczny dla osób, zakręconych na punkcie time to market. Lampka powinna się też zapalić jeżeli rośnie nam w GSC metryka “Strona zeskanowana, ale jeszcze nie zindeksowana” dla artykułów, które miały widoczność – bardziej szczegółowo nad tym parametrem pochyliłem się we wpisie o Crawled – Currently Not Indexed w Google Search Console. Trzecim miernikiem po prostu są requesty Googlebota.
Wzmocnienie sygnałów jakościowych – podniesienie średniej jakości treści w indeksie Google, wzmacnia sygnały na poziomie całej witryny i poprawi wydajność wszystkich materiałów (obecnych i przyszłych). Trudne do zmierzenia, ale zawsze można to przedstawić jako argument budowania reputacji.
Poprawa doświadczenia użytkownika – zapewnienie odbiorcom dostępu wyłącznie do najwyższej jakości treści, wzmacnia pozytywne postrzeganie marki. Budowanie silnej marki w dobie Google Discover i AI często przewija się jako kluczowych argument w branży SEO. A jak przedstawisz działowi marketingu i PR takie argumenty, to będą skakać z radości.
Redukcja kosztów utrzymania – zmniejszenie zasobów potrzebnych do administrowania i aktualizowania treści poprzez skupienie się na mniejszej liczbie, ale bardziej wartościowych materiałów. Utrzymanie dużego serwisu jest kosztowne, utrzymanie cache na tym serwisie jest kosztowne, wszystko kosztuje, trzeba dobrze się zastanowić nad tym czy jest sens ponosić te koszty tylko dla Googlebota, skoro użytkownik z tych zasobów nie korzysta. Obniżenie kosztów utrzymania jest łatwe do zmierzenia i bardzo lubiane w dzisiejszych czasach.
Content Clean UP krok po kroku
Z pozoru proste zadanie w dużych organizacjach często przeradza się w półroczną krucjatę. Content Clean UP to nie tylko praca zespołu SEO, ale w mediach to przede wszystkim bliska współpraca z redakcją (nie chcemy usunąć istotnych czy wizerunkowych dla strategii redakcyjnej treści), działem sprzedaży (usunięcie treści sponsorowanych może się skończyć nieprzyjemnie) oraz produktem (przekierowania, 410 na usuniętych treściach etc. – czasem skomplikowane systemy, w oparciu o które działają serwisy medialne potrafią zaskoczyć nietypowymi przeszkodami).
Krok 1: Dane
- Lista kanonicznych adresów URL. Idealnie jeżeli jest wyciągnięta bezpośrednio z bazy danych. W razie problemów można korzystać z Google Analytics, Sitemap czy Google Search Console, ale zdecydowanie wolelibyście unikać tego typu zabawy.
- Data publikacji. Jak wyżej najlepiej bezpośrednio z CMS.
- Sesje – minimum w ostatnich 12 msc. W dużych organizacjach dane zawsze są w wewnętrznych systemach monitorujących, ale dane z Google Analytics też są jak najbardziej OK.
- Tytuł oraz Tytuł SEO
- Typ publikacji. W zależności od organizacji nazewnictwo może się różnić, więc tutaj zamieszczę trzy podstawowe: evergreen, news, sponsorowane. Jeżeli nie macie tego oznaczonego w CMS, to może być to wyzwanie, ale można się z tym uporać. Artykuły evergreen pisane pod SEO powstają w specyficzny sposób, dlatego można spróbować zidentyfikować je za pomocą wzorca (dlatego wyciągamy też tytuły i tytuły SEO). Innym sposobem na zidentyfikowanie artykułów evergreen jest analiza trafficu w rozbiciu długoterminowym. Nie można też zapomnieć o dobrodziejstwie, jakie daje nam AI.
- Kategoria. Powinniśmy mieć kontrolę nad tym czy przypadkiem nie wyczyścimy za bardzo jakiegoś działu, dodatkowo kategorie mogą stanowić naturalne przekierowanie dla artykułów oznaczonych do usunięcia.
- Autor. Podobnie jak w przypadku kategorii, chcemy mieć kontrolę ile treści danego autora zostanie usuniętych. Dodatkowo będzie bardzo dużo treści bez autora, co też jest istotnym wskazaniem do pozbycia się takiej treści.
- World Count. Liczenie słów jest w mojej opinii reliktem SEO, ale wszyscy kiedyś to tak robiliśmy, zlecając treści na ilość znaków, warto skorzytać z tej metryki jeżeli pojawiają się jakieś wątpliwości .
- Linki zewnętrzne. Ten element nadal jest istotny i treści z backlinkami nie powinny być usuwane, ani przekierowywane.
Krok 2. Łączenie sesji
W wielu serwisach są adresy kanoniczne, które powstały chociażby przez parametry czy amp. Te dane trzeba połączyć, tak żeby mieć pełny i wiarygodny obraz tego jaki jest realny ruch na danym artykule.
Krok 3. Świeże URL
URL-e, które zostały opublikowane w ostatnich dwunastu miesiącach usuwamy z naszej listy do analizy, na nie przyjdzie pora podczas kolejnych Content Clean UP.
Krok 4. Evergreen i sponsorowane
Treści, które oznaczyliśmy jako Evergreen przenosimy w inne miejsce, dla nich wykonana zostanie osobna analiza i w zależności od jej wyniku takie treści trzeba będzie zaktualizować w ostateczności także usunać.
Treści sponsorowane, które nie mogą być usunięte z powodu podpisanych umów usuwamy z listy do analizowania.
Krok 5. Określ próg trafficowy
Tutaj każdy musi już na podstawie danych określić własny „próg bólu”. Można zrobić to na zasadzie wyciągnięcia średniej i wszystko co jest 20% poniżej średniej kwalifikuje się do przekierowania lub usunięcia i tak te treści trzeba oznaczyć.
Jeżeli robisz to po raz pierwszy i skala jest duża, możesz w pierwszej iteracji skupić się na treściach bez ruchu.
Krok 6. Backlinki
Wszystkie artykuły, które posiadają backilinki powinny pozostać w serwisie.
Krok 7. Wpływ na kategorie i listy strony autorów
Nie powinno być sytuacji, gdy po przejściu przez punkt piąty okaże się, że jakaś kategoria zostanie z bardzo małą ilością treści lub zostanie całkowicie wyczyszczona. Wpłynie to negatywnie na doświadczenia użytkownika, ale też na klasyfikację. W tym przypadku trzeba będzie rozważyć progi trafficowe lub po ustaleniu z redakcją podjąć decyzje o zamknięciu kategorii, jeśli będzie to zgodne ze strategią wydawniczą.
Sytuacja z autorami jest podobna, przy czym tutaj zakładamy dwie opcje:
- Autor tekstu to syndykowane źródło np. PAP, Asociated Press etc.
- Autorem tekstu jest konkretna osoba
W przypadku sytuacji a) tego typu treści oznaczamy jako do usunięcia. W przypadku b) musimy określić skalę. Jeżeli nie jest duża możemy dla świętego spokoju podesłać listę adresów do usunięcia autorowi w celu konsultacji lub samemu ręcznie ocenić czego nie powinniśmy usuwać. Sytuacja nieco komplikuje się, gdy z danym autorem nie ma kontaktu lub jest tego bardzo dużo. Z reguły jednak redaktorzy często nie chcą się podpisywać pod newsami, wolą wtedy stosować akronimy lub inne formy, które nie wskazują bezpośrednio, że to oni sa autorem treści.
Krok 8. Konsultacje z redakcją
Gdy masz listę treści, które powinny zostać usunięte wyślij ją kontrolnie do redakcji z pełną informacją dlaczego takie działania są podejmowane. W teorii redakcja powinna przejrzeć te treści i potwierdzić lub wskazać treści, które nie powinny być usuwane. To jest teoria, praktyka mówi, że przejrzenie czasem kilku, a nawet kilkunastu tysięcy artykułów jest niemożliwe dla redakcji, dlatego jest krok 9.
Krok 9. Batchowa SEO Analiza treści
Krok ten można go wykonać wcześniej np. przed krokiem 8 (lub go zastąpić – nie każdy ma redakcję), aby nie zalać redakcji dużą ilością treści. W różnych firmach są różne dodatkowe narzędzia, które oceniają np. jakość treści. Są to często narzędzia autorskie, ale też jest mnóstwo narzędzi dostępnych na rynku do takiej analizy. Wykorzystaj te narzędzia. Jeżeli nie masz takich narzędzi możesz skorzystać ze sztucznej inteligencji i zbudować takie narzędzie, które oceni np. na podstawie wytycznych helpful content update jakość i przydatność treści, które masz oznaczone do usunięcia.
Krok 10. Decyzja
Masz już listę treści do usunięcia? Super. Oceń skalę. Nie usuwaj wszystkiego jeżeli wyszło na to, że większość treści się do tego nadaje (zdarza się). Podejdź do tego zadania etapami. Usuń część treści i obserwuj zachowanie Googlebota oraz metryk.
Krok 11. Usuwamy
Teraz przeprawa z IT, nie będzie tak łatwo. Przecież nie będziemy wrzucać wszędzie 410, to byłoby zbyt piękne. W pierwszej kolejności wykonać należy redirecty.
- Trzeba znaleźć treści z wysokim similarity score. W dobie AI to zadanie, które nie powinno być wyzwaniem. Tutaj znowu musicie zdecydować jaki similarity score będzie waszym progiem dopasowania na podstawie skali.
- Treści, które nie spełniają wymagań progu dopasowania możemy przekierować na kategorię lub pierwszy w kolejności wybrany tag.
Jakie treści oznaczam jako 410? Najczęściej „jednolinijkowce” lub sponsorowane z zerowym ruchem. Jak się okazuje nie jest tego mało.
Na co jeszcze zwrócić uwagę w przypadku redirectów:
- Upewnij się, że redirecty dotyczą też niekanonicznych wersji (amp, adresów parametrami)
- Upewnij się, że redirectów nie ma w sitemapach
- Unikaj łańcuchów przekierowań
- Pamiętaj żeby po jakimś czasie 6-12 miesięcy redirecty usunąć, a artykuły oznaczyć jako 410.
Krok 12. Analiza wpływu
W zależności od wielkości serwisu musisz ocenić ile czasu potrzebujesz na monitorowanie wpływu po wdrożeniu i zestawić z poprzednim okresem. Jak zawsze zwracam uwagę na następujące metryki:
- Crawled – currently not indexed – przewidywany spadek w tej metryce
- Reqesty Googlebota
- Impresje – przewidywany wzrost w metryce
- Wizyty z google (Search, Discover, News) – przewidywany wzrost w metryce
Ocena ile coś powinno wzrosnąć lub spaść jest uzależniona od wielkości serwisu, dlatego nie chcę podawać konkretnych liczb. Widziałem przypadki gdzie zmiany w metrykach były dwucyfrowe, ale były też przypadki jednocyfrowych zmian, co nie zmienia faktu, że były one mniej satysfakcjonujące.
Istotne jest to by danymi podzielić się szerszemu gronu odbiorców w twojej organizacji. Pomoże to zrozumieć pracę zespołu SEO, zrozumieć cel i zasadność działań SEO, zwiększyć zaangażowanie organizacji w procesy SEO oraz pozwoli budować PR zespołu SEO, często postrzeganego jak grupa magików pracujących nad czymś bardzo tajemnym.
Z mojego doświadczenia, ale też z dostępnej literatury tego typu porządki w serwisie zawsze przynosiły pozytywne efekty, jeśli zostały wykonane zgodnie ze sztuką. Uważam, że taki proces powinien być powtarzany przynajmniej raz w roku.