Autor Zpráva
Jansvabik
Profil
Ahoj,
Mám takový (malý) problém... Měl jsem v metatagu description chybu - místo "České" tam bylo "Česěké" a Google to zrovna zaindexoval. Na mém webu byl GoogleBot naposledy 1. 8. 2013 a potřeboval bych, aby vše aktualizoval. Ještě větší problém je, že to "Česěké" tam má Google, Centrum + Atlas, i Seznam ... Na Googlu jsem v nástrojích pro webmastery našel tlačítko "Načíst jako Google", ale nevím k čemu to je a jestli by to zabralo. Prý to tlačítko mohu použít jen 500x. Do Seznamu a Centrumu/Atlasu bych asi napsal... Nebo máte lepší řešení? Všem budu vděčný za pomoc...
jenikkozak
Profil
Dej tomu čas, vyhledavače si po pár návštěvách změny určitě všimnou.
Jansvabik
Profil
Dobře... Děkuji za reakci... Ještě jsem do htaccess přidal zákaz cacheování. Jakmile to bude v pořádku, tak ho zapnu. Po jaké době to mám čekat u Centrum/Atlas? Nepovažuji to za vyhledávače :D
jenikkozak
Profil
Vzhledem k tomu, že Centrum na vyhledávání využívá Google, tak asi hodně podobně.
Jansvabik
Profil
Tak to by mě nikdy nenapadlo. To to mám hned lehčí. :-) Ještě jednou velké díky!


A nevíte ještě k čemu slouží ono tlačítko "Načíst jako Google"?
Davex
Profil
Nástroj Načíst jako Google umožňuje zobrazit stránku tak, jak ji vidí Google. To je užitečné především v případě, že odstraňujete problémy se špatným umístěním stránky ve výsledcích vyhledávání. Pokud například používáte k zobrazení obsahu multimediální soubory, nástroj nemusí vrátit stránky s tímto obsahem, nedokáže-li je Google efektivně procházet. Stránku můžete zobrazit tak, jak ji vidí webový prohledávač Google, nebo, pokud publikujete mobilní obsah, jak ji vidí naše prohledávače mobilního obsahu.
Viz support.google.com/webmasters/answer/158587?hl=cs
Jansvabik
Profil
Ok, díky. Včera jsem tlačítko stiskl, web se znovu odeslal do indexu Googlu, všechny změny načetl, ale tu v metatagu ne...

Ještě to zkusím vytáhnout z include souboru, a vložím to normálně do souboru (mimo PHP)...
jenikkozak
Profil
To nic neudělá. Z tohoto pohledu je Googlu úplně jedno (resp. nemá jak zjistit), jestli konkrétní text byl na stránku psán ručně, nebo byl vložen pomocí PHP.
Jansvabik
Profil
Ok


Ještě mám jeden dotaz - na tom daném webu mám subdoménu (ray.example.com) a potřeboval bych zakázat vyhledávači, aby o ní jakkoliv věděl. Jsem na Wedosu a tam jsou subdomény ve složce /subdom. Zabere, když přidám do .htaccess v rootu webu řádek:

Disallow: /subdom/ray

? Díky (samozřejmě tam již mám User-agent: *)
Chamurappi
Profil
Reaguji na Jansvabika:
Prohlížečům (a tedy i robotům) je úplně jedno, jaká je vnitřní struktura adresářů na serveru, zajímají je jen URL. Do robots.txt umístěného v kořenu domény, ke které se vztahuje, se tedy také píšou jen URL.
Jansvabik
Profil
Takže když přidám onen řádek Disallow: /subdom/ray, zakážu mu přístup na subdoménu ray.example.com?
Chamurappi
Profil
Reaguji na Jansvabika:
Ne. Přečti si znovu, co jsem napsal. Pokud ten řádek dáš do example.com/robots.txt, zakážeš mu example.com/subdom/ray.
Jansvabik
Profil
Já to právě moc nepochopil :-/ Takže to nejde zakázat?


Protože soubor robots.txt, který není v rootu někdy vyhledávače ignorují...
jenikkozak
Profil
Vlož druhý robots.txt do složky subdom/ray a v něm zakaž vyhledavačům vstup na všechny adresy. Vyhledavač ho ignorovat nebude, protože každou subdoménu bere jako samostatný web.
Chamurappi
Profil
Reaguji na Jansvabika:
Takže to nejde zakázat?
Jde. Když bude chtít robot stahovat z ray.example.com, tak si nejprve stáhne ray.example.com/robots.txt, aby se podíval, kam může a kam ne.
Opravdu nezáleží na tom, jak jsou subdomény řešené na FTP. Když chceš v kódu stránky odkázat na tu subdoménu, tak přeci také neodkazuješ href="/subdom/ray".

soubor robots.txt, který není v rootu někdy vyhledávače ignorují
Vždy. (Bavíme se o rootu domény v URL, ne o rootu na FTP.)
Jansvabik
Profil
Jj, tak díky za řešení mých banálních problémů :-)


Možná jsem to ale nerozepsal úplně, já tam tu subdoménu nemám, složka tam není, ale vyhledávač to stejně i po měsíci indexuje.
jenikkozak
Profil
Jansvabik:
já tam tu subdoménu nemám, složka tam není, ale vyhledávač to stejně i po měsíci indexuje.
Protože jistě správně při pokusu o stažení souboru z té subdomény vracíš stavový kód 404, robot po čase „pochopí“, že tam nemá lézt.
Pokud ti jde o Google, můžeš mu pomoci tím, že konkrétní stránky vyházíš přes Nástroje pro webmastery.
Jansvabik
Profil
Problém je, že jelikož je to subdoména, přesměruje se to na domovskou stránku "example.com", takže si Google myslí, že to je to co chtěl najít a je to taky ten problém, proč to stále indexuje...
Joker
Profil
Jansvabik:
jelikož je to subdoména, přesměruje se to na domovskou stránku "example.com", takže si Google myslí, že to je to co chtěl najít
Od toho jsou právě ty stavové kódy HTTP.

Kdyby stránka vracela 404 (nenalezeno), Google ji nebude zobrazovat i když na ní bude obsah.
Kdyby stránka vracela 301 (trvale přesunuto), Google ve výsledcích zobrazí jen novou adresu.

Doplnění:
Jestli stránka vrací 200 (OK) a na stejné adrese jen zobrazí obsah hlavní stránky, logicky vyhledávač nemá jak poznat, že to nemá indexovat.
Jansvabik
Profil
Adresář jsem vytvořil a přidal index.php, ve kterém je:

<?php
  header("HTTP/1.0 404 Not Found");
?>

jinak nic. To už zabere, ne?

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: