<<<< Zpět na články

Jak Google určuje sílu stránky a jak bojovat se strojovým učením?

Autor:
Četlo již:
880 očí
Téma:
SEO
Tags: ,

S novými updaty algoritmu, které se snaží potlačit obsah považovaný za nehodnotný nebo tzv. fake news, znova vyvstává otázka, jak vlastně Google hodnotí sílu vašeho webu? Jaká jsou základní kritéria? Co musíte udělat, abyste se dostali nahoru? Jaká je autorita vašeho webu? Problémem je, že nic jako jedna jednoduchá stupnice autority neexistuje.

PageRank

Kdysi dávno, před mnoha a mnoha lety jedna taková metrika existovala. Jmenovala se PageRank a její maximalizace byla svatým grálem SEO.

Vypočítávala sílu stránky na základě množství odkazů, jež na ni směřovali. Pokoušela se započítat i hodnotu těchto odkazů a jejich relevanci. Ani v těchto dřevních dobách však nebyl PageRank vše a Google hodnotil i obsah webu, a dokonce bral v potaz i metatag keywords (což se brzy ukázalo jako velká chyba, nicméně internet byl kdysi mnohem naivnějším médiem).

Každopádně veřejný PageRank byl naposledy aktualizován v prosinci 2013 a už předtím byla korelace mezi vysokým PageRankem a umístěním v Google velice nízká. I když je jisté, že neveřejný PR je stále součásti algoritmu a započítává se do něj, tak nemáme šanci zjistit jeho hodnotu a tím pádem je pro nás tato veličina pro další práci nepoužitelná.

Jak se vypočítává autorita dnes?

Podle slov samotných inženýrů v Google, je v současnosti součástí algoritmu víc jak 200 různých signálů. Samotné jejich složení je obchodním tajemstvím. Přesto některé známe a některé odhadujeme. Víme, že výskyt klíčových slov v titulcích a obsahu je důležitý, víme, že záleží na rychlosti webu a jedním z nich je i interní neveřejný PageRank.

Podle Searchengineland.com, jež má tuto informaci přímo od Google, se tyto signály nesčítají a nevytváří žádnou jednoduchou metriku autority. Místo toho používá souhrn několika signálů. Na první pohled to vypadá, že není žádný rozdíl, zda pracujeme s jednou hodnotou, nebo (zjednodušeně řečeno) součinem několika různých. Ale, je tu ale!

Rank Brain

Jedním ze způsobů, který Google využívá pro zlepšení výsledků ve vyhledávání je algoritmus, jež využívá strojového učení na základě zpětné vazby od lidských hodnotících.

Těch je více jak 10 000 a pravidelně dostávají seznam klíčových slov, na němž mají provést hledání a instrukce, jak jednotlivé položky ohodnotit. Které jsou užitečné, které ne a které jsou zavádějící nebo dokonce, které jsou pornografické.

Nově dokonce mohou označovat i obsah, jež je „upsetting-offensive“, tedy urážlivý. Jako příklad je pak v jejich instrukcích článek popírající holokaust, jež si takové označení zasluhuje. Kromě kvality výsledků se tak Google snaží bojovat i s tzv „fake-news“.

Tito hodnotitelé, ale neovlivňují pozice přímo. Nemůže se vám tedy stát, že by váš web ztratil návštěvnost poté, co se Bob z Marylandu špatně vyspí. Algoritmus DeepBrain místo toho vezme všechny výsledky a snaží se zjistit, co je spojuje a z toho pak určit „kvalitní stránky“.

Hodnotí se každá stránka zvlášť

Je třeba také vědět, že každá stránka je hodnocena zvlášť. Je to z důvodu, aby stránky jako Tumblr, Youtube nebo blogspot neovládly všechny výsledky hledání. To však neznamená, že zde nejsou signály, jež by neovlivňovaly celou doménu: rychlost, optimalizace pro telefony a spamové signály platí pro celou doménu či subdoménu.

Pokud tedy jakýkoliv nástroj hodnotí sílu domény, tak nejde o hodnocení Google, ale o hodnocení třetí strany a pak záleží, na kolik je daný nástroj sofistikovaný a nakolik koreluje s reálnými výsledky hledání. U nás jsou například mezi laickou veřejností velmi populární stránky seo-servis.cz, které ale podávají zavádějící údaje bez kontextu a s takřka nulovou souvislostí s reálnými pozicemi.

Co to všechno znamená?

Jak bylo již dříve předestřeno, Google pracuje se skupinou signálů. Tato skupina ale nemusí být vždy stejná. Rank Brain přiřazuje signálům váhu na základě kontextu jednotlivých dotazů. Dopředu tedy nikdy nevíme, jaké signály jsou vlastně důležité pro tu, kterou skupinu hledání. Samozřejmě jsou tady jisté obecné signály, které jsou užitečné vždy. Seo je mrtvé. Od roku 2010 už asi po deváté a stále mu to nijak nevadí. Co to tedy znamená?

Znamená to, že optimalizace je zase o něco těžší. Ne ale nemožná. RankBrain je stále jen algoritmus a dá se s ním pracovat. Důležitým krokem dobré optimalizace se tak opět stává ruční prozkoumání výsledků hledání. Je třeba se podívat na prvních 20 výsledků a snažit se rozpoznat, co mají společného. Na jaké signály jsou dané stránky silné. Hrají zde opravdu roli zpětné odkazy, nebo primárně jde o obsah?

Pokud naopak obsah není důležitý a většina stránek jej má mizivý, tak může hrát velkou roli i vnitřní prolinkování. Je třeba věnovat větší pozornost konkurenci a inspirovat se jejich úspěchem a ideálně přidat něco navíc.

Je třeba zase trochu změnit úhel pohledu při tvoření dokonalých stránek. Ne poprvé a rozhodně ne naposledy.  To, nás optimalizátory, ale na SEO tolik baví. Přeji vám hodně úspěchů při zvyšování hodnocení právě těch vašich signálů.

Hodnocení

Ohodnoťte tento článek. Již to udělali 4 uživatelé

O autorovi

Ondřej P.

Zeptejte se přímo autora

Odpovědět do diskuze