Autor Zpráva
Simon Grimmich
Profil
Když mám dvě stránky, které Google považuje za podobné, tak obvykle jednu z nich vyhodí pryč. Ale je možné, že když dvě podobné stránky, ale jsou jedna řekněme 1. a druhá 13., že ta 13. byla odsunuta právě kvůli podobnosti? Lze nějak přesně určit zda Google považuje stránku za podobnou? Moc děkuji za případné odpovědi.
Yuhů
Profil
Google se k podobnostem staví ještě složitěji než ostatní vyhledávače. Myslím, že rozlišuje podobnosti na dvou úrovních:

na úrovni indexace
na úrovni vyhledávání

ještě před tím je samozřejmě úroveň třetí, to jsou duplicity na úrovni crawlera.

Jednodušší na pochopení je podobnost rozlišená na úrovni vyhledávání. Tam se podobnost určuje podle okolí nalezených slov. Pokud jsou okolí stejná (to se dá vypočítat nějakým hashem), tak se z výsledků vyhodí (a objeví se pouze když se na poslední stránce dole klikne na odkazy "nefiltrovat").

Podobnost na úrovni indexace je pro mě černá skříňka a moc do ní nevidím, pouze si myslím, že existuje. Google stránky, které jsou hodně podobné jiným, sice ve výsledcích nechává, ale málo je aktualizuje a někdy si je přesouvá do tak-zvaných supplemental results (česky myslím dodatečný výsledek). To je napsáno u odkazu.

Zpět k dotazu -- pokud máš jednu stránku první a druhou třináctou, pak téměř jistě ta třináctá nebyla odsunuta kvůli podobnosti. Při podobnosti na úrovni vyhledávání by se ve výsledku totiž neobjevila vůbec, při podobnosti na úrovni indexace by se asi nedostala na třinácté místo, případně by u sebe neměla "supplemental result". Teoreticky může být postižena nějakým skrytým faktorem, který nikdo z nás nezná.

V jiných vyhledávačích ovšem podobnosti fungují jinak.
Simon Grimmich
Profil
OK, díky za vyčerpávající odpověď určitě mi pomohla.
Toto téma je uzamčeno. Odpověď nelze zaslat.

0