Autor Zpráva
Desaster
Profil
Dobrý den, asi budu vypadat jako ignorant, ale potřebuji teoretický rozbor...
Mám stránky offline na notesu takže nemůžu robots.txt vyzkoušet online a offline tester sem žádný nenašel.
Web funguje tak že obsah ve složce "www.vasweb.cz/src/" je includovaný přes indx.php v kořenu webu (www.vasweb.cz/index.php), ale bez indexu samostatný obsah nefunguje správně. Takže sem zakázal pohlížet vše ve složce "src".
A teď to co mě trápí... bude indexován obsah všech stránek ze složky "src" který je includovaný funkcemi přes index pomocí "Cool URI" (www.vasweb.cz/galerie/2012/1/ => www.vasweb.cz/index.php?obsah=galerie&rok=2012&strana=1), nebo bude ostatní obsah ignorován a zaindexuje se jen původní obsah index.php?

Díky za jakoukoli odpoveď. :-)
ShiraNai7
Profil
Bude se indexovat to, kam se vyhledávač dostane. Pokud do src nebo na index nepovedou žádné odkazy, tak se indexovat nebudou. Nejlepší postup je:

1) do src zakázat přístup úplně (htaccess deny from all)
2) v index.php detekovat, zda se jedná o přepsanou adresu a pokud ne, tak na ni přesměrovat s hlavičkou 301

Pro detekci "správné" adresy lze použít $_SERVER['REQUEST_URI'] a funkci parse_url().
Desaster
Profil
Díky.
Veškeré odkazy jsou ve formátu "www.vasweb.cz/hlavni_strana/novinky/" a nenapadá mě způsob jak by se kdokoli dostal k formátu "www.vasweb.cz/index.php?obsah=hlavni_strana&strana=novinky", ale pro klid duše tam tu detekci určitě přidám.
Takže jestli to chápu správně, když v indexu robot najde odkaz "www.vasweb.cz/galerie/2012/" podívá se tam a je mu jedno že mod_rewrite podstrčí adresu na index s příslušnými parametry.

Mělo by tedy vše fungovat správně.

Děkuji za vysvětlení a za radu.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: