Autor Zpráva
Ivy
Profil
Při vyhledávání obrázků na mojí doméně Googlem se mi vrátí pouze obrázky, na které odkazuji. Z mých originálních fotografií není zařazen ani jeden. Stránka jede pod redakčním systémem phpRS. Mám tedy dva problémy:
1. Nechci aby se ve vyhledávání obrázků z mojí domény zobrazovaly obrázky z jiných stránek - v roli zloděje obrázků se necítím příliš příjemně. Uvažovala jsem že by mohlo pomoci nofollow, ale zase mi to v případě hezkých stránek připadá škoda.
2. Potřebovala bych zjistit a odstranit důvod proč se ve výsledcích vyhledávání nezobrazuje ani jeden můj originální obrázek.

Výsledky vyhledávání obrázků z mojí domény

Příklad 1 - článek Typy přírodních stanovišť Ani jeden z mých obrázků se neobjeví ve výsledcích vyhledávání. Obrázky na které v tomto článku odkazuji ve vyhledávání jsou, například písečné duny, (první odkaz ve sloupci Obrázky) nebo křoviny s klečí. (sedmý odkaz ve sloupci Obrázky). Pokud by mi chtěl někdo napsat že si mám schovat formát tabulky do css tak je to fakt příšerné, vím o tom a jakmile budu mít čas udělám to.

Příklad 2 - článek Biotopy Moje obrázky ve vyhledávání opět nejsou (v tomto případě jde o náhledy), odkazované obrázky ve vyhledávání jsou, například M1.8 vápnitá slatiniště nebo M4.2 štěrkové náplavy se židoviníkem.

Příklad 3 - článek Křoviny skal... Moje obrázky jsou opět náhledy, ani jeden ve výsledcích vyhledávání. Odkazované obrázky jsou, například růže májová v tabulce, druhý řádek, druhý sloupec.

Budu vděčná za jakékoliv nasměrování, nejsem programátor takže možná trošku polopaticky. Díky za pochopení.
Plaváček
Profil
Ivy:

V robots.txt máte tento zápis:

Disallow: /gallery/


Google tedy velmi pravděpodobně obrázky z vaší domény neindexuje.
LudekBrno
Profil
Ivy:

celkově toho je v robots.txt zcela zbytečně mnoho.

1) zejména nemá žádný smysl dávat disallow některých složek nebo konkrétních souborů *.php, na které nevede z webu přímý odkaz, vyhledávače je bez nich nemůžou najít a indexovat

a 2) je dokonce vyloženě nebezpečné v robots.txt zakazovat přístup do administrace, protože jediný výsledek kterého se tím dosáhne je ten, že každý amaterský hacker má jako na talíři předložené URL, na kterém si může zkoušet prolomení hesla. Pokud by se URL pro vstup do administrace přejmenoval na něco netypického a nebyl uveden v robots.txt, nebude hacker mít od čeho se odpíchnout.

3) nemluvě o disallow gallery a disallow galerie.... to už se potom nemůžete divit, že google galerii vůbec neindexuje :-)
Ivy
Profil
[#2] Plaváček
Díky, odstraněno. Problém 2 vyřešen.
Plaváček
Profil
Ivy:

Odstraněním problému 2 se pravděpodobně vyřeší i problém 1. Nevím přesně, jakým způsobem zobrazuje Google výsledky hledání obrázků s parametrem site:, ale tipnul bych si, že v okamžiku, kdy na vaší doméně žádné obrázky nenašel, sáhnul si pro obrázky, na které v rámci svého webu odkazujete (to znamená do jiných domén). Je to pouhá moje spekulace, ale dává mi smysl :)
Ivy
Profil
[#3] LudekBrno
Díky za rady, podívám se i na přístup do administrace. Radil byste mi abych to dala pryč všechno?
LudekBrno
Profil
Ivy:

Můžete dát pryč všechno, na co neexistuje přímý odkaz z veřejně dostupných částí webu, protože to vyhledávače tak jako tak nenajdou, neprocházejí a tedy ani neindexují. A případným útočníkům tak neposkytnete návod, kam se dívat.
Petr ZZZ
Profil
LudekBrno:
Můžete dát pryč všechno, na co neexistuje přímý odkaz z veřejně dostupných částí webu
To není spolehlivé řešení, pokud je cílem, aby vyhledávače části webu neindexovaly. Někomu se stránky líbí a odkáže třeba bez ptaní. Pak ale myslím spolehlivé řešení stejně neexistuje, protože ne všechny vyhledávače noindex respektují (i když google to pokud vím respektuje).
jenikkozak
Profil
Petr ZZZ:
Někomu se stránky líbí a odkáže třeba bez ptaní.
To ale asi není moc pravděpodobné, že by někdo odkazoval na administraci. Vždyť pokud na ni nevede přímý odkaz, jak uvádí LudekBrno. Jak by se ten nějaký horlivý uživatel na danou adresu dostal?
Petr ZZZ
Profil
jenikkozak:
Dobře, je pravda, že nevede-li do administrace žádný odkaz, nemá se tam kdo jak dostat a pak ani nemůže odkazovat. Pokud jde o jiné stránky, které třeba nemají být veřejně dostupné, ale jsou nějak zajímavé, je zapotřebí si to ohlídat. V podstatě stačí poslat někomu odkaz mejlem, ten to odkáže ze svých stránek a je po tajemství. Tam by bylo možná vhodné dát noindex do hlavičky konkrétní stránky a v robots.txt stránku neuvádět. A ošetřit heslem přímou návštěvnost ze stránky s "neobjednaným" odkazem.
Ivy
Profil
Petr ZZZ:
Tam by bylo možná vhodné dát noindex do hlavičky konkrétní stránky a v robots.txt stránku neuvádět.
Díky, tohle je pro mě také uižitečná rada.

LudekBrno:
A případným útočníkům tak neposkytnete návod, kam se dívat.
Ještě se chci zeptat na toto: Pro hackera přece nemůže být takový problém zjistit si obvyklou strukturu konkrétního redakčího systému.
LudekBrno
Profil
Ivy:
Jistě není, proto se doporučuje (tam kde je to možné) i u standardního redakčního systému strukturu alespoň trochu pozměnit, aby nebyla v defaultním tvaru. RS většinou mají přístup do administrace jako "doména.cz/admin/" a podobné snadno uhodnutelné složky. Pokud je to technicky možné (nemělo by to být obvykle nic složitého), velmi to útočníkovi ztíží přejmenování složky administrace. Aby přístup do ní byl potom vypadal například takto: "doména.cz/mujweb/". Já používám mimo jiné shop zencart a tam stačí složku administrace libovolně přejmenovat a přepsat to jméno na pár řádcích v konfiguračních souborech. Potom i když útočník pozná, co je to za redakční systém, moc mu to nepomůže, protože nezná složku administrace.
Ivy
Profil
LudekBrno: vstup do administrace pozměním, i když to pro mě nebude asi až tak jednoduché.

V souvislosti s hledáním obrázků mám ještě jeden dotaz: Hledám na Googlu, zadám hledání jména pampeliška pozdní. Při hledání pomocí googlovské funkce Obrázky se z mojí domény nevyhledá žádný obrázek, což bylo způsobeno triviální chybou disallow gallery v robots.txt. Ale při hledání googlovskou funkcí Web jsou obrázky z mojí galerie na čtvrté a páté pozici a v roce 2009 byl obrázek z mojí galerie dokonce na první pozici. Hovořím o stavu kdy v robots.txt bylo stále disallow gallery. Byl to také důvod, proč jsem problém nehledala v robots.txt. Měl by někdo nějaké vysvětlení? Může to být tím že obrázky jako takové hledá jiný robot?
Petr ZZZ
Profil
Ivy:
při hledání googlovskou funkcí Web jsou obrázky z mojí galerie na čtvrté a páté pozici

Já bych řekl, že vyhledávač nenašel obrázky, ale stránky. Stránky s obrázky a texty. Našel je přes hledání textu a jsou na nich holt kromě textu ještě obrázky.
Ivy
Profil
Petr ZZZ:
Díky za vysvětlení.

Vyhledávání obrázků z mojí domény: při dnešní kontrole jsem zjistila, že Google obrázky z mojí domény již zařazuje. Tři obrázky mají hlášku "Před 4 dny", třináct obrázků "Před 3 dny" a dva obrázky "před 2 dny". Znamená to, že Google začal indexovat obrázky už druhý den po odstranění disallow z robots.txt. Docela mě překvapuje ta rychlost, počítala jsem s tím že to vezme tak dva až tři týdny. Ještě mi připadá zajímavé, že při včerejší kontrole jsem tam nově zaindexované obrázky ještě neviděla, byly tam stále jen ty cizí.

Všem ještě jednou děkuji za všechny rady.

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0