Wyciek danych Google. Wiemy, jak działają algorytmy SEO
W Internecie jest głośno o wielkim wycieku danych w Google, przez które lepiej poznaliśmy działanie algorytmów pozycjonujących. Wiele faktów i mitów dotyczących SEO możemy zweryfikować, patrząc wprost na ujawnione informacje.
Wyciek danych Google – co się właściwie stało?
Przypadkowo w serwisie GitHub roboty Google opublikowały wewnętrzną dokumentację referencyjną API Google Search’s Content Warehouse. To rzuciło więcej światła na funkcje, które decydują o widoczności stron w wyszukiwarce.
Choć zostało ujawnionych ponad 14 000 czynników rankingowych (!), nie wiemy, w jakim stopniu wpływają na pozycjonowanie ze względu na brak punktacji (ważenia).
Warto zauważyć, że wyciekła dokumentacja API, a nie kod źródłowy, zatem wiele z tych funkcji może nie być już aktualnych. Dane zostały opublikowane 27 marca 2024 r. i usunięte dopiero 7 maja 2024 r.
Nie wiemy, jak działają poszczególne moduły i jakie są asocjacje między nimi. Mamy za to szereg nazw dla czynników rankingowych wraz z krótkimi dopiskami, na przykład:
Wnioski z wycieku danych Google
Poniżej kluczowe wnioski SEO, które wynikają z wycieku danych Google.
Autorytet domeny ma znaczenie
W części “Compressed Quality Signals” mamy funkcję zwaną “siteAuthority”, która odpowiada za lepsze pozycjonowanie zaufanych stron.
Zaznaczmy ponownie, że nie wiemy, w jaki sposób funkcja jest mierzona i wykorzystywana w ogólnej punktacji SEO, ale mamy za to pewność, że taki parametr istnieje i jest używany jako czynnik rankingowy. Podobne zastrzeżenie odnosi się do kolejnych parametrów.
Kliknięcia wpływają na pozycje
Wiemy, że Google stosuje algorytmy oparte na uczeniu maszynowym. Już wcześniej podejrzewano, że kliknięcia są ważnym atrybutem dla zautomatyzowanego określania pozycji – w końcu atrakcyjne treści są chętniej odwiedzane, a więc powinny być wyżej. I rzeczywiście, Google wykorzystuje kliknięcia jako silną przesłankę w swoich systemach rankingowych.
W poniższej funkcji mamy zróżnicowane sygnały kliknięć, które wpływają na SEO:
O ile pierwsze sygnały są zrozumiałe, warto wyjaśnić resztę. Zgodnie z definicją Google, squashing jest funkcją, która zapobiega dominacji jednego dużego sygnału nad innymi. Innymi słowy, algorytmy normalizują dane dotyczące kliknięć, aby nie dopuścić do manipulacji rankingiem poprzez sztuczne, nadmiarowe kliknięcia.
Możemy więc zakładać, że system jest rozsądnie wyważony i oddaje naturalne zainteresowanie treścią przez odbiorców, a dodatkowe klikanie we własne treści nie pomoże w osiągnięciu wyższych pozycji.
Artykuły od niektórych autorów pozycjonują się lepiej
Jest to niemałe zaskoczenie dla branży SEO. Wiele mówiło się o czynnikach takich jak E-A-T lub topical authority, które odnosiły się do wizerunku strony, wpływając na jej ekspertyzę i zaufanie. Teraz wiemy, że takie samo działanie dotyczy… poszczególnych autorów!
Ocena autorów wydaje się być kompleksowa – na przykład jedna z funkcji sprawdza, czy autor strony jest równocześnie podmiotem reprezentującym stronę.
Umiejscowienie linku wpływa na jego siłę
Funkcja sourceType pokazuje relacje między wartością strony, a tym, gdzie się znajduje. Im wyższy poziom witryny i świeższa data podstrony, tym silniejsze linki z niej płyną. Najbardziej wartościowe odnośniki pochodzą ze strony głównej – szczególnie gdy jest ona regularnie aktualizowana.
PageRank strony głównej wpływa na podstrony
Wygląda na to, że każda podstrona zapożycza wizerunek strony głównej, zanim zbuduje własny PageRank (mierzony sygnałami kliknięć i innymi czynnikami behawioralnymi).
To oznacza, że nowe podstrony silnej witryny będą się wyżej pozycjonować, gdyż domyślnie są bardziej godne zaufania. Dopiero po czasie, na podstawie zachowania użytkowników, Google określa realną przydatność treści. W ten sposób może wypromować podstronę słabszej witryny, jeśli jej content jest faktycznie bardziej wartościowy.
Google patrzy na wielkość czcionki
To zaskakujące, jak Google ocenia każdy detal. Okazuje się, że średnia wielkość czcionki jest jednym z czynników rankingowych. Zapewne obie skrajności (zbyt mała lub zbyt duża czcionka) utrudniają czytelność, co skutkuje degradacją pozycji.
Co ciekawe, ocenie jest poddawana również wielkość czcionki dla anchor text.
Oryginalność tekstu ważna nawet dla krótkich treści
Nie tylko obszerne artykuły mają szansę na SEO. Poprzez funkcję OriginalContentStore Google ocenia zwięzłe treści pod kątem oryginalności – zapewne po to, aby pozycjonować również krótkie przydatne terminy, np. słowniki online.
Tytuł strony kluczowym parametrem
Z ujawnionej dokumentacji wynika, że dopasowanie tytułu do zapytania użytkownika zwiększa widoczność strony. Odpowiada za to funkcja titlematchScore.
Im świeższa data, tym lepiej
Od dawna wiadomo, że Google promuje świeże informacje. Teraz mamy potwierdzenie – i to wyrażone w kilku funkcjach:
bylineDate – data widoczna na stronie.
syntaticDate – data widoczna w adresie URL lub tytule.
semanticDate – data zawarta w treści strony.
Widzimy więc, że Google ocenia nie tylko datę publikacji, ale również daty używane w treści. Warto więc cytować aktualne raporty i badania, aby poprawić wyniki SEO.
Strony z filmami są traktowane inaczej
Funkcja isVideoFocusedSite wskazuje, że jeśli ponad połowa podstron zawiera filmy, Google ingeruje w pozycje strony; nie wiemy jednak, w jaki sposób.
Strony związane ze zdrowiem inaczej indeksowane
Istnieje parametr o nazwie ymylNewsScore, który odnosi się do stron mogących wpłynąć na zdrowie lub życie jej czytelników (YMYL – Your Money or Your Life). Wygląda na to, że strony YMYL są pozycjonowane według innych zasad.
Google przypisuje atrybut YMYL nie tylko do witryn, ale nawet do konkretnych zapytań.
Małe personalne strony są specjalnie traktowane
Dzięki wyciekowi danych Google poznaliśmy tajemniczy czynnik rankingowy „smallPersonalSite”. Nie wiemy, jak są zdefiniowane „małe, personalne witryny” i w jakim celu.
Możemy zgadywać, że małe biznesy otrzymują pomoc w początkowej fazie budowania widoczności, aby szybciej generować pierwszy ruch na stronie. Być może taka funkcja jest reakcją na aktualizację Helpful Content Update, przez którą mniejsze strony doznały znaczącego spadku widoczności na rzecz lepiej zoptymalizowanych witryn.
Google ocenia, czy piszesz na temat
Algorytmy cenią wyżej te treści, które są powiązane z tematyką strony. Funkcja „QualityAuthorityTopicEmbeddingsVersionedItem” sprawdza, czy publikujesz treści ze swojej dziedziny, czy też za bardzo odbiegasz od tematu.
Artykuł jest dużym streszczeniem publikacji iPullRank, które dokonało bezpośredniej analizy kodu. Jeśli chcesz poznać więcej szczegółów, odsyłamy do źródła, gdzie znajduje się więcej wniosków.
Podsumowanie
Otrzymaliśmy wiele wskazówek, jak działają algorytmy SEO. Nie trudno jednak odnieść wrażenie, że… w wycieku Google nie ma w nich żadnej wielkiej sensacji.
Od wielu lat Google wyraźnie wskazuje, na co zwraca uwagę przy ocenie witryny. Okazuje się, że ujawnione informacje są jedynie technicznym potwierdzeniem jego wytycznych. Wyciek danych tylko wzmocnił pogląd, że:
- Ważne jest tworzenie wartościowych treści i dbanie o wysoką jakość strony.
- Nie ma dróg na skróty – pozostaje regularna praca, rozwój contentu i stała optymalizacja witryny.
- Jeśli chcesz skutecznie pozycjonować stronę, musi ona rzeczywiście na to zasługiwać.
Badanie czynników rankingowych przypomina trochę analizę wiersza. Możesz analizować wers po wersie jego budowę, badać środki stylistyczne… ale to nie sprawi, że za chwilę napiszesz genialną poezję.
Podobnie jest z SEO – możesz zgłębiać teorię i czytać o każdej funkcji z osobna, ale dopiero działanie i stworzenie wartościowego contentu pozwoli zdobyć wysoką pozycję. Wbrew pozorom, więcej w tym sztuki niż technikaliów.
Oceń artykuł:
Dodaj komentarz