Autor Zpráva
Yuhů
Profil
Lidé na mé weby často odkazují chybnými adresami. Například přidají na konec adresy čárku, nějaký escapovaný tag nebo podobné chybky. Google mi pak ve webmaster tools hlásí, že ty adresy u mě nenašel. Pár příkladů:

h ttp://www.jakpsatweb.cz/</p>
h ttp://www.jakpsatweb.cz/css/css-ver...-solution.html
h ttp://www.jakpsatweb.cz/heslo.html</td
h ttp://www.jakpsatweb.cz/css.
h ttp://www.jakpsatweb.cz/php/easyphp.html).
h ttp://www.jakpsatweb.cz/css/css-vertical-center-solution.ht


Dotaz zní: myslíte, že bych se měl pokusit (asi pomocí mod_rewrite) takové odkazy přesměrovávat na správnou verzi? Nezpůsobím si tím víc zmatku než užitku?

A za druhé: myslíte, že by se o kanonizaci takto zřejmě chybných URL měl pokusit rovnou Google (nebo jiný vyhledávač, např. Seznam)?

(Mezery mezi h a ttp jsem dal jenom kvůli tomu, aby tu nevznikly odkazy.)
Petr ZZZ
Profil
Odpovědi nemám, ale mám otázky. :) Jak jsou ty odkazy staré? Nedalo by se předpokládat, že si toho dřív nebo později autor všimne a sám chybný odkaz opraví? Jak kvalitní jsou weby lidí, schopných sekat takovéto chyby? Jak jsou takové weby navštěvované a jakou váhu mají odkazy z nich? Snaží se na tvůj web dostat přes takové chybné odkazy tolik lidí, aby dávalo smysl se tím zabývat?

<OT>Mezery mezi h a ttp myslím nejsou nutné, když je to v [pre]:
http://www.jakpsatweb.cz/css.</OT>
Moderátor Chamurappi: Odkazy se z [pre] vyhazují jen v sandboxu a jen z blokového [pre], což v tomto příspěvku není ukázáno.
jenikkozak
Profil
Yuhů:
myslíte, že bych se měl pokusit (asi pomocí mod_rewrite) takové odkazy přesměrovávat na správnou verzi?
Selský rozum mi říká, že pokud na můj web bude odkazovat významný web (tím jsem se prozradil, že o sobě nemluvím), najde se někdo, kdo správce webu upozorní na to, že má odkaz špatně. Že na mne odkazuje špatně nějaký blogísek, mi vzniká podobná ztráta odhadem jako to, že mi hosting nabízí dostupnost „pouze“ 99,9%.
Já bych na správnou verzi nepřesměrovával. Chybná adresa by podle mne měla vracet chybu 404. Když se budu snažit vymýšlet si, na co asi autor odkazoval, může se stát, že budu čtenářům podstrkávat úplně něco jiného, než co on zamýšlel. A je možné, že pokud by používal nějaký nástroj, který by mu zjišťoval nefunkčnost odkazů, které na svém webu publikuje, že by mu chybu nenahlásil. (Ale to je jen spekulace, žádný takový nástroj nepoužívám.)

A za druhé: myslíte, že by se o kanonizaci takto zřejmě chybných URL měl pokusit rovnou Google (nebo jiný vyhledávač, např. Seznam)?
Jejich autoři by spíše měli věnovat úsilí do vývoje užitečnějších věcí. ;-) Například vysvětlení vyhledávači, že pokud nějaká úvodní stránka má ve zdrojovém kódu 99× (a to je konkrétní případ, teď jsem to počítal) totéž klíčové slovo, že vážně asi nebude tím, co uživatelé hledají. A že tedy rozhodně nemá co dělat na prvních pozicích.
Chamurappi
Profil
Reaguji na Yuhůa:
1) Optimální by byla inteligentní chybová stránka, která jednak návštěvníkovi jasně oznámí, že přišel na špatnou adresu, a jednak mu nabídne možnosti, kam asi chtěl jít.
2) Myslím, že většina běžných brouzdalů se skrz špatný odkaz nedostane k cíli, maximálně dokážou odmazat tečku či čárku z konce. Vyhledávač by v tomto neměl být o moc chytřejší.
Yuhů
Profil
Děkuju za odpovědi. Nakonec jsem tam nasázel nějaká pravidla přes mod redirect. A všimnul jsem si, že odstranění tečky a čárky za "html" na konci URL už tam mám asi šest let.

Taky jsem si trochu předělal chybovou stránku na jpw, aby tam byl chytřejší formulář na hledání.
Yuhů
Profil
Jinak ještě teoreticky: souhlasím, že nemá smysl řešit odkaz z každého blogísku. Ale když mi jich GWT hlásí pro jednu chybnou adresu třeba deset, tak už myslím, že by se to mohlo začít vyplácet. A pak... já si vlastně vážím každého odkazu, i toho zmatlaného.
jenikkozak
Profil
Yuhů:
A pak... já si vlastně vážím každého odkazu, i toho zmatlaného.
Já také. Ale těch z významných webů si vážím víc. :-)
Když už jsem výše tuto chybu přirovnal k výpadkům serveru, tak já rozhodně svými návštěvníky nepohrdám (abych měl tu drzost jim třeba psát, že používají starý prohlížeč, tak ať táhnou) a nedostupnost po desetinu procenta času, která obnáší skoro 9 hodin ročně, mě může mrzet. Ale abych si platil zrcadlení webu, abych se dostal blíže k těm sto procentům, to přece jen neudělám. A nemyslím, že by to mělo být chápáno jako neúcta k lidem, kteří si můj web oblíbili (či se na něj mohli dostat náhodou).
Str4wberry
Profil
1) Pokud má web nějaká pravidla ohledně adres, je poměrně vhodné a snadné zkusit z adresy části, které je nesplňují, automaticky odstranit. Případně stránku (stránky) podle useknuté adresy domyslet. Nenapadá mě situace, za které by to mohlo zmatek způsobit.
2) Vyhledávač strukturu a pravidla adres daného webu nezná, takže tu existuje nepatrné risiko, že bude moc snaživý a adresu naopak zmrší.
dedouch
Profil
Uvedené příklady má často na svědomí chybná automatická konverze textu na odkaz, takže většinou nejde o jednotlivé odkazy, ale existuje chybných odkazů ve stejné podobě více (obvykle úměrně tomu, jak často je dotyčný web propírán v různých diskusních fórech). Varianty, které se dají odchytit nějakým pravidlem, bych určitě na vlastním webu přesměroval na korektní URL.
Co se týče vyhledávačů, tam pro uživatele nevidím zcela jasný přínos, protože IMHO velká většina cílových stránek těchto chybných odkazů bude mít i odkazy ve správné podobě a v indexu vyhledávače tak bude.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Odkud se sem odkazuje


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0