Autor Zpráva
niCe
Profil
Ahoj, chci se nejdřív zeptat, jestli je korektní postup udělat to, co chci udělat, protože v případě, že by to byla chyba, by mohla reindexace mého webu trvat i měsíce.

Problém je v tom, že mám 10 jazykových verzí svých stránek. Automatická detekce jazyka samozřejmě vybere vhodnou jazykovou verzi pro příchozího návštěvníka. Vyhledávacího bota nevyjímaje.
A tak třeba google indexuje web v angličtině, jyxo v četině atd.
Problém je ale právě s tím google, protože chci být k nalezení i na česká slova, ale třeba i na holandská

A protože nevím jak to jinak zařídit, myslel jsem, že bych v případě googlebota nastavil náhodný výběr jazyka (podle čísla od 1 do 10), který by se chvíli pásl česky, chvíli holandsky.

Myslíte, že je to korektní postup? Jak byste to případně řešili vy?

Předem děkuji za pomoc, pěkný den,
niCe
Dero
Profil
niCe: Do hlavičky bych zahrnul odkazy na jednotlivé jazykové mutace a postaral bych se, aby jejich obsah měl unikátní URL.

Např:

http://www.server.cz/cz/jak-rozcilit-sefa/
http://www.server.cz/en/how-to-upset-your-boss/

Automatická detekce jazyka je v pořádku, pokud má uživatel /a s ním i bot/ možnost se mezi jednotlivými verzemi přepínat.
niCe
Profil
Máš pravdu, tohle by v podstatě mělo stačit. Úplně jsem zapoměl, že tam vlastně odkazy na jazykové verze už mám, takže se pak robot přemístí na titulku v tom a v tom jazyce a napase se toho jazyka.

Jenže v mém případě to nefunguje. Indexuje mi jen anglickou verzi stránek.
Ty odkazy na jednotlivé jazykové verze mám v divu, který má hodnotu atributu visibility na hidden a javascriptem se "rozsvítí", ale to je robotovi jedno, ten div vidí v každém případě.

V čem by tedy mohla být chyba?
Uvedu zde adresu stránky: vivamusic.org
a odkaz na seznam indexovaných stránek http://www.google.cz/search?hl=cs&q=site%3Avivamusic.org&lr=.
Sami vidíte, že v indexu je přes 5000 anglických stránek a na patřičné jazykové verze se robot vyplivnul. Opravdu netuším, co je příčinou problému.
Marek Prokop
Profil
Google má sice v indexu přes 5000 stránek, ale skoro všechny v supplemental. Něco se mu na nich nelíbí. Nevím co, protože web je momentálně nedostupný (i to může být důvod).
niCe
Profil
Marku díky za upozornění, nevšiml jsem si, že jsou ty stránky v podpůrném indexu.

Ale zpět k původní otázce. Když přece najde, více odkazů typu "index.php?lang=xx", tak přece dané stránky google neignoruje a v tomhle případě půjde na odkaz třeba index.php?lang=cz. Ikdyž tam nemám "cool uri", tak by tohle měl google respektovat a indexovat tu stránku v tom jazyce. Proč tedy zůstal jen u anglické verze opravdu netuším. Odkaz na tu českou verzi má asi stejnou váhu jako těch xx dalších odkazů, díky nimž zaindexoval teď již přes 7000 stránek.

Nevidím to jinak, ale pro google ip adresu budu muset upravit algoritmy na detekci jazyka tak, aby googlebotovi rázně vnucovaly náhodnou jazykovou verzi, aby se také dostalo i na ostatní jazyky. Doufám, že to nebude brané jako podvodná techinka či co.

Pěkný den, niCe

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0