Autor Zpráva
Aajx
Profil
Zdravim vsechny!

Mam dotaz. Psal jsem zivnostnikovi velmi jednoduche stranky. Pred tim mel nejaky redakcni system s phpBB o ktery se nikdo nestaral a ktery byl zaspamovan pornem a podobnyma vecma. Jsou to dva mesice, co jsme mu nasadili novy web, ale google podle nastroju pro webmastery stale zna jen tu starou stranku. Hlasi spoustu nefunkcnich odkazu (do toho fora) a pri vyhledani firmy pise v popisu stale stare informace. Nove stranky ale zna. Co s tim? Jak ho donutit, aby vsechno smazal a naindexoval znovu?

Diky moc za info!
Ajax!
Dranel
Profil
Aajx:
Mrkni do nápovědy, kontaktuj podporu. Nějaké řešení určitě najdete.
nightfish
Profil
Aajx:
dali jste na staré (nyní nefunkční) adresy přesměrování na nový web? máte u Googlu přiřazenou sitemapu?
Marek Prokop
Profil
[#1] Přátelé, posílejte vždy odkaz na stránky, kterých se vaše otázky týkají. Jinak je to jen věštění z křišťálové koule.
Aajx
Profil
Marek Prokop: Omlouvam se. www.oubcom.net

nightfish: prave ze presmerovani nebylo. Stary web se zrusil a nahradil se kompletne novym na stejne adrese, serveru,... Stary web neni dostupny. Sitemap mam a google ho zna..

Dranel: napovedu jsem prolezal, diskuze jsem prolezal a nepodarilo se mi nic najit. Podporu kontaktuju az ve chvili, kdyz se tady nic nedozvim. :)
mattyZEM
Profil
Marek Prokop:
Jinak je to jen věštění z křišťálové koule.
Neříkej že jsi se to za ty roky nenaučil :P:)
Plaváček
Profil
Aajx:

"Starý web se zrušil a nahradil se" je dost špatná metoda. Obvyklé bývá lepší pro vyhledávače i pro lidi, když staré URL přesměrujete na nové (pokud to nejde nějak lehce, pak alespoň vše staré směřovat na úvodní stránku webu). Ale na to už je asi pozdě.

Takže rozumným řešením v této situaci se jeví posílat vyhledávačům chybovou stránku 404 (což nemáte - viz třeba http://www.oubcom.net/nic).
Aajx
Profil
Plaváček:
Trochu nerozumim. Nechci zakladat novou domenu, na kterou bych provoz presmeroval.. Chci, aby novy web bezel na stare domene.. Jak by se to dalo ciste udelat, kdyz ne nahrazenim?
A co se tyce druhe casti.. On vraci 404-ku, jinak by prece browser nenapsal, ze dokument neexistuje, neni tomu tak?

EDIT: Dobra, udelal jsem vlastni 404. Ale ma to vliv na google?
Dranel
Profil
Aajx:
OT: Vau, ta chybovka je luxusní. To jsi dělal sám? Opravdu pěkný nápad...
Chamurappi
Profil
Reaguji na Aajxe:
Dobra, udelal jsem vlastni 404.
Ne, udělal jsi přesměrování na obyčejnou stránku jménem 404.php zasílanou s HTTP kódem 200 (tj. OK, nikoliv Not found).


Reaguji na Dranela:
Viz 404 Error Pages, One More Time, mezi tamními nápady je i tato díra.
Plaváček
Profil
Aajx:

Nahrazením ano, ale původní URL stránek (zaindexované vyhledávači) je nutné nějak ošetřit.

Na to se používá právě přesměrování ( http://www.jakpsatweb.cz/presmerovani.html ), čímž řeknete vyhledávači, že nové stránky najde pod jinou URL a on tu starou časem "zahodí" (vyřadí z indexu), přičemž ranky z původních stránek se vám časem přenesou, stejně tak zůstanou funkční i případné zpětné odkazy vedoucí na starý web

Chybová stránka by měla být nedílnou součástí každého webu, více o tématu třeba zde: http://timy.blog.cz/0510/chybova-stranka
Aajx
Profil
Dranel: Presne tak, narychlo jsem to opraskl (viz odkaz od Chamurappi). Tted neni cas neco vymyslet..

Plaváček: Nejaky napad jak to udelat, kdyz ma google naindexovano zhruba 400 mrtvych linku do diskuze? Myslim tim jinak, nez tak, jak jsem to udelal? A mam to udelat jinak? BTW: tim, ze jsem vsechny mrtve stranky ted presmeroval na svoji 404 stranku jsem to vyresil tak, jak jsi rikal, ne? Nebo jak to mam resit? Pouzil jsem presmerovani jako direktivu apache (stejne, jako v nabizenem linku)..

Puvodne jsem myslel, ze informace 404 (stranka nenalezena), kterou posilal googlu muj webserver staci na to, aby google vedel, ze ju ma vyradit, neni to tak? Ja to porad nechapu. :( Muzes poslat nejaky link, nebo vysvetlit?
nightfish
Profil
Aajx:
Nejaky napad jak to udelat, kdyz ma google naindexovano zhruba 400 mrtvych linku do diskuze?
Všechny mrtvé linky (comment.php*, /phpBB3/*, view.php*, ...) přes HTTP kód 301 přesměrovat buď na odpovídající stránku nového webu (existuje-li), nebo na úvodní stránku webu.
Dále je pak mít vhodné stránku 404, na kterou se dostanou všichni ti, kteří se buď překlepli v adrese nebo následovali chybný odkaz.

V tomto okamžiku je důležité zmínit, že nemusí být úplně jednoduché zhodnotit, jestli pro konkrétní adresu máte vrátit kód 301 (protože stránka dříve existovala) nebo 400 (protože nikdy neexistovala). Možná by šlo využít služeb Google k alespoň částečné rekonstrukci původních adres.
Kajman_
Profil *
Mrtvé linky (fórum, komentáře, co nemají novou adekvátní) by mohly vracet kód 410 (odstraněno) a v google webmaster tools je odstranit (Site configuration - Crawler access - Remove URL).
Aajx
Profil
Kajman:
Tohel presne jsem chtel vedet!! :) Super! Te volby odtranit linky z google webmaster tool jsem si vubec nevsiml, to je presne to, co jsem potreboval. Diky diky diky moc. A s tou 410 taky. :)


Takze jen pro jistotu pro ostatni, kdyby to nahodou nekdo hledal, muj postup:

1. Pridal jsem redirect na 404 stranku (spis pro spravny chod webu nez pro reseni problemu:
ErrorDocument 404 http://www.mujweb.cz/404.php


2. Pridal podminku na stare forum (posle kod, ze stranky jsou odstraneny):
RedirectMatch 410 ^/adresar_pro_odstraneni


3. Pridal jsem redirect na 410 page (Kdyby nekdo mel odkaz na ty stare stranky):
ErrorDocument 410 http://www.mujweb.cz/410.php

Samozrejme je nutne vytvorit 410.php a 404.php a dat je do korenu webu. A taky nezapomente mit soubor robots.txt, nebo si google nacte vasi 404 page.

Pokud je to spravne, dekuju vsem za pomoc, pokud ne, napiste, at se jeste neco priucim..
Chamurappi
Profil
Reaguji na Aajxe:
Nevytvořil jsi chybové stránky, vytvořil jsi přesměrování na zcela obyčejné stránky — zasílané s kódem 200, nikoliv 404 nebo 410.
Aajx
Profil
Chamurappi:
Tak tomu stale nerozumim. :( Driv jsem googlu posilal 404, ted mu posilam 200. Pred tim to bylo spatne, ted to je spatne.. Co je teda spravne, co mam teda udelat?

Profil *
Aajx:
Informácia o kóde chyby je v hlavičke HTTP, nie v dokumente HTML, viď: http://php.net/manual/en/function.header.php
Aajx
Profil
Ale to ja prece vim, ale pred tim jsem posilal 404 a bylo to spatne (a google po dvou mesicich odstranene stranky neodebral z indexu) a bylo mi porazeno: udelej stranku 404. Ted je zase stranka s kodem 200 spatne. Co mam teda delat?

BTW: odstraneni stranek z googlu podle rady uzavetele kajman_ musi byt podepreno souborem robots.txt, jinak ho google zamitne. Prave odzkouseno..
Marek Prokop
Profil
Promiňte, ale moc nechápu, co tu všichni (a zejména Aajax) řešíte. Pravidla jsou přeci vcelku jednoduchá:

1) Pokud přestěhuji stránku na jinou adresu, z původní přesměruji stavovým kódem 301 na novou. To se zde zřejmě nestalo.

2) Pokud stránku zruším (to by ovšem na webu měla být velmi mimořádná situace), vracím 404 (případně důsledněji ale s určitými riziky 410).

Nic jiného není třeba řešit. Proč Vám, proboha, vadí, že má Google ve výsledcích hledání nějaké neexistující stránky? To je přeci jen jeho problém, ne Váš. Váš problém by to byl jen v případě, že ty stránky mají ve skutečnosti existovat. Pak je to ale případ (1) výše.
Aajx
Profil
Marek Prokop:
No, je to jednoduche proc to resim (viz bod 2):
ad 1) Jeste mi nikdo nerekl jak. Pomoci PHP header? Nebo direktivou apache?
ad 2) To neni vubec mimoradna situace. Bylo forum a uz ho nechci mit. Bylo v nem neco, co me poskozuje a nic neprineslo, tak ho zrusim. Co je na tom mimoradneho? A znovu. Jak vratim 404? A urcite 404?Vracel jsem 404 a bylo to pry spatne. Ted vracim 200 a je to taky spatne. Tak co je teda pravda? A jaka jsou rizika 410?

A to, ze na moje stranky vedou linky poker, a***l a kdo vi co jeste je opravdu vec, kterou bych chtel resit. Muj problem, ne googlu. Ale to je spis filozoficka otazka. Zkratka chci, aby google predkladal hledajicim aktualni stav stranek, coz zatim nedela, to je vse.
Kalda
Profil
Ad 1) Je úplně jedno, jestli ten kód pošleš direktivou Apache nebo pomocí PHP Header, hlavní je, že ho pošleš
Ad 2) Pro vyhledávače nebylo špatně, že jsi vracel 404ku. Špatně bylo pro uživatele, že jsi vracel JEN tu 404ku bez toho, aniž byste uživateli ukázal nějakou stránku spolu s vysvětlením. A ačkoliv je takhle stránka celkem pro lidi z IT úsměvná, tak bohužel zase nefunguje pro běžné lidi - ideální je zastadit ji do vzhledu webu a nějak srozumitelně jim vysvětlit, co to je za chybu, jak k ní mohlo dojít (např. že se změnil web) apod. Viz. např. http://www.megapixel.cz/nic
Na současném stavu je špatně, že ta stránka pošle nejdřív 302 přesměrování na tu 404.php, ta pak vrací 200ku. Upravte si .httacces na:
ErrorDocument 404 /404.php

3) Jinak se tak trochu ztotožňuji s Markem Prokopem, ale pokud opravdu máte potřebu odstranit stránky z indexu Googlu, tak je zde nástroj Google Webmasters Tools, kde můžete požádat o odebrání konkrétních stránek nebo adresářů z indexu. Buďte ale obezřetný, abyste si neodebral to, co na Googlu opravdu chcete mít...
Marek Prokop
Profil
Jeste mi nikdo nerekl jak. Pomoci PHP header? Nebo direktivou apache?

Z pohledu vyhledavače to je přeci úplně jedno. Klientské zařízení (tedy i robot vyhledavače) vidí jen ten stavový kód, nikoli to, jak vznikl.

Bylo forum a uz ho nechci mit. Bylo v nem neco, co me poskozuje a nic neprineslo, tak ho zrusim.

OK, tak ho zrušte a na všech zrušených stránkách vracejte stavový kód 404, nebo 410.

Co je na tom mimoradneho?

Obsah zpravidla představuje nějakou hodnotu, které je škoda se zbavovat. Je to stejně mimořádná situace, jak kdybyste postavil dům a po čase ho bez náhrady zboural. Ale to je Vaše věc a s podstatou této diskuse to nesouvisí.

Jak vratim 404?

Zeptejte se v sekci Konfigurace webového serveru, poraďte se se svým webmasterem nebo hostingovou společností.

Vracel jsem 404 a bylo to pry spatne.

Já jsem to osobně nekontroloval, ale podle jiných účastníků této diskuse jste 404 nikdy nevracel. Z pohledu vyhledavače není důležité, co je napsané na chybové stránce, ta je pro lidi. Důležitý je skutečný stavový kód protokolu HTTP. Ten si můžete ověřit např. zde: http://web-sniffer.net/

jaka jsou rizika 410?

Pokud URL vrací 404, robot vyhledavače ho vyřadí z indexu až po čase a občas se na něj znovu podívá, zda tam opět něco není. Pokud použijete 410, nemusí se robot na to URL podívat už nikdy, nebo až za velmi dlouhou dobu. Můžete tedy mít problém, pokud se to samé URL rozhodnete později použít pro něco jiného. Reakce na stavové kódy HTTP se ale může lišit podle robota i v čase.

A to, ze na moje stranky vedou linky poker, a***l a kdo vi co jeste je opravdu vec, kterou bych chtel resit.

Pokud to jde, řešte příčinu a ne následek.

chci, aby google predkladal hledajicim aktualni stav stranek

Návod už jste dostal (4nn, nebo 301). Víc pro to udělat nemůžete a ani to není potřeba.
Marek Prokop
Profil
[#22] Minuli jsme se :-)

Jen poznámka k tomu nástroji ve Webmaster Tools -- ten je samozřejmě primárně určen pro existující stránky. Použít ho pro neexistující nedává moc smysl.
Aajx
Profil
A uz je to zase tady.
Chamurappi
Nevytvořil jsi chybové stránky, vytvořil jsi přesměrování na zcela obyčejné stránky — zasílané s kódem 200, nikoliv 404 nebo 410.
Kalda:
Upravte si .httacces na: ErrorDocument 404 /404.php

To jsou dve veci, ktere si odporuji. Mam direktivu presne jak je napsano, Chamurappi tvrdi, ze to je spatne a o par prispevku nize kalda tvrdi, ze to je dobre. Tak ja uz nevim. :( CO JE TEDY SPRAVNE??

Marek Prokop
Já jsem to osobně nekontroloval, ale podle jiných účastníků této diskuse jste 404 nikdy nevracel.
Samozrejme, ze jsem vracel 404. Byla to stranka, ktera se vzhledem lisila podle prohlizece a bylo na ni napsano 404. A podle rady uzivatele Plaváček jsem zacal posilat browseru vlastni.

Pokud to jde, řešte příčinu a ne následek.
Majitel webu rekl: diskuze je mi na nic. Nechci ju tam. Kdyby byla diskuze v me moci, resil bych pricinu, samozrejme.

poraďte se se svým webmasterem nebo hostingovou společností.
Web (ted, ne predtim) spravuju komplet vc. hostingu. Ja se neptal na to jak, ale co udelat. Coz se ptam tady celou dobu a dostavam rozdilne odpovedi. :(

Pochopil jsem tedy dobre, ze direktiva RedirectMatch 410 ^/adresar_pro_odstraneni neposle browseru (botovi) kod 410?

Marek Prokop
Profil
[#25] Aajaxi, maříme tady zbytečně čas. Vše, co se týká SEO, už bylo řečeno aspoň třikrát. Ještě jednou odkaz na: http://web-sniffer.net/ -- tím si můžete kdykoli ověřit, co kterékoli URL přesně vrací. Otázka *jak* nastavit server nebo jak posílat HTTP hlavičky v nějakém programovacím jazyku nepatří do sekce o SEO.

Zamykám.

Kalda pokračuje zde: http://diskuse.jakpsatweb.cz/?action=vthread&forum=31&topic=107482 Díky!
Toto téma je uzamčeno. Odpověď nelze zaslat.

0