Autor Zpráva
Pavel Szalbot
Profil *
Netušíte někdo, jak dlouho trvá Seznamu, než přestane neustále navštěvovat stránky, které vracejí HTTP 302? Teorie v informacích pro webmastery (http://fulltext.seznam.cz/url.py/infoScreen) je hezká, ale robot chodí i po měsíci tam, kam nemá.
Dejme tomu, že bych přimhouřil oko a začal vracet 404, který už mu vadí o poznání více, ovšem proč navštěvuje stránky, které jsou zakázány v robots.txt? A taky opakovaně... Google se chová, jak má, Webmaster Tools potvrzují správnost robots.txt.
Máte někdo podobnou zkušenost?
Marek Prokop
Profil
Proč by měl robot přestat navštěvovat URL, která vracejí HTTP 302? Kdyby je nenavštěvoval, jak by se dozvěděl, že vracejí HTTP 302? A jak to souvisí s robots.txt? Nezlobte se, ale Vašim dotazům vůbec nerozumím.
Pavel Szalbot
Profil *
Omlouvám se. Zkusím se zeptat lépe.

Indexuje robot Seznamu jako obsah stránky vracející HTTP 302 stránku, na kterou je přesměrován? Nějakou dobu mi totiž ve fulltextu Seznamu visí stará verze URL některých stránek a obsah přitom již odpovídá stránce nové. Nerozumím, co pak znamená odstranění takové stránky z indexu. Myslíte, že jsou stránky vracející 302 nějak penalizovány ve výsledcích?

SeznamBot mi také stále chodí na stránky, které jsou v robots.txt dlouho zakázány. Je to normální?
Marek Prokop
Profil
K přesměrování: Vyhladavače obvykle navštěvují a do výsledků vyhledávání zařazují ta URL, na která vedou nějaké odazy. Je-li URL A přesměrované pomocí HTTP kódu 301 nebo 302 na URL B, zpracují stránku nacházející se na URL B a URL B pak mohou (ale nemusí) zobrazovat ve výsledcích vyhledávání namísto URL A. Pro majitele webu to nepředstavuje žádný podstatný rozdíl, protože je zaindexovaný obsah stránky B a na stránku B také z vhledavače chodí návštěvníci.

Pokud vím, u dlouhodobého přesměrování Seznam (narozdíl od Googlu) po čase vždy nahradí ve výsledcích vyhledávání URL A za URL B, ale trvá to dost dlouho. Když se na to podíváte "očima" vyhledavače, je to přirozené. Zatímco pro Vás je změna URL jasně časově určená (dříve bylo jen URL A, od určitého okamžiku je už jen URL B), vyhledavač má k dispozici jen izolované vzorky dat z různých zdrojů a z různých časů, takže pro něj může být dost těžké poznat, které URL bylo dřív a které později, zda je přesměrování dlouhodobé apod.

K robots.txt: Záleží na tom, zda ty stránky máte zakázané správně a jak dlouho je máte zakázány. Roboty vyhledavačů si robots.txt mohou po nějkou dobu kešovat (udržovat svou lokální kopii), takže si změny nevšimnou hned.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: