Autor Zpráva
Pilda
Profil
Dobrý den,
lámu si hlavu s teorií, kterou jsem slyšel třeba v v přednáškách Yuhůa o vyhledávačích. Ta teorie je, že čím je stránka hlouběji, tím je méně přínosná a má menší PR.

Podle mě je to ale přesně naopak. Čím hlouběji je, tím má vyšší informační hodnotu. A co víc, první dvě úrovně mají informační hodnotu většinou nula.

Příklad: Vezměte si třeba stránku jakpsatweb.cz. Vytáhnu si z ní tři úrovně:

1.) Homepage - informační přínos 0 (jsou tam pouze odkazy)
2.) 1. úroveň zanoření - to samé, také jenom odkazy a informační hodnota 0
3.) 2. úroveň zanoření - VLASTNÍ OBSAH - obrovská informační hodnota - to (jediné) co člověk chce najít

A takhle to je podle mě na drtivé většině webů. Chápu proč ty zanořené stránky mají menší PR, ale nemyslím si, že by to byly plívy, jak říká Dušan. Možná nám v tom videu Dušan neřekl všechno, protože takhle to opravdu nemá žádnou logiku pro určování hodnoty stránek.
Joker
Profil
Pilda:
To není tak docela pravda, třeba kdybych hledal „jak psát web“, chtěl bych se dostat právě na homepage s rozcestníkem.
Když budu hledat třeba „dovolená v Turecku“, asi budu chtít stránku se seznamem zájezdů do Turecka (což může být hlavní stránka nějaké kategorie, relativně málo zanořená), případně hlavní stránku cestovky. Na hodně zanořenou stránku třeba web/nabídky/turecko/konkrétní dovolená/konkrétní termín/diskuse naopak chtít asi nebudu.
A kdybych hledal třeba jen „Turecko“, asi bych chtěl spíš hlavní stránku oficiálního webu, než třeba text o Turecku v části Okolní země sekce Další informace na webu o Iráku.

Řekl bych, že ta zanořená stránka určitě má velký význam, ale pokud hledám konkrétní informaci. A na konkrétní informaci položím konkrétní dotaz, na který ta hlavní stránka nebude relevantní.
Například když budu chtít informace, jak odeslat formulář ze stránky na e-mail, asi budu zadávat dotaz typu „html odeslání formuláře na e-mail“, na který je relevantní až ta zanořená stránka.
Ale kdyby někdo napsal celý web o odesílání HTML formulářů na e-mail (který by byl podobně autoritativní jako JPW, podobné množství odkazů a tak), chtěl bych skončit raději tam.
Pilda
Profil
Joker: ano, výjimky existují. Třeba mě ještě napadly microsites, které mají užitečný obsah rovnou na homepage. Jde mi ale spíš o to co a kdy se bude indexovat, než o to co se hledá. Dušan na přednášce Úvod do vyhledávání 7, crawler říkal, že pokud se vyhledávač z nějakého důvodu rozhodne indexovat jenom část stránek, tak znevýhodní ty nejvíce zanořené stránky oproti méně zanořeným (+ tam je nějaký náhodný faktor) a to mi jde.

Nechápu teda proč by měl vyhledávač vysloveně úmyslně a s "dobrým pocitem" přidělovat nízkou prioritu (a případně je vůbec neindexovat) zrovna těm zanořeným stránkám. Představoval jsem si to spíš tak, že crawler přijde na stránku, zaindexuje homepage, pak jde na stránky první úrovně, u těch si zaznamená odkazy a jde dál po struktuře. Pokud z nějakého důvodu nechce indexovat všechno, tak dá přednost stránkám nejhlouběji zanořeným, protože nesou tu informační hodnotu a ty přednostně zaindexuje. Až se pak někdy vrátí a bude moct zaindexovat zbytek, tak zaindexuje i ty stránky 2. úrovně, co jsou akorát plné odkazů.
Davex
Profil
Pilda:
V dílu Úvod do vyhledávání 7, crawler mluví Yuhů o plívách od času 12:21 a věnuje se randomizaci při výběru stránek pro crawlování. Nemluví o vztahu informační hodnoty a ranku.

Problém je asi v tom, že stránek s málo zpětnými odkazy je strašně moc a do indexu se nemohou dostat všechny hned. Jen dostávají menší šanci a zpomaluje se jejich indexace. Obecně to nevadí, protože se budou měnit méně často a není potřeba je tolik aktualizovat.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: