Autor Zpráva
Pavel W.
Profil *
Co teď dělám statistický server chtěl jsem měřit i aktivitu vyhledávacích botů jako googlebot, Jyxobot, SeznamBot a mnoho dalších
jenže... měření které probíhá vložením externího javascriptu do stránky boti vůbec nenačítají a nepodívají se ani na obrázek v noscript části.
Jestli jde o bota zjištuji z proměnné $_SERVER['HTTP_USER_AGENT'].
Doufal jsem že obrázek zabere ale teď co už je u stránek načten nový obsah i v archivu google a statistiky nevykazují návštěvu bota na me dopadla znepokojující skutečnost že to stále nefunguje. Takže:
Jsou nějaká externí data co by boti načetli ze serveru 3. strany?
Nebo bude pro toto měření spustit nějaký php script už na serveru 2. strany (tedy tom, který měřím)?
Aleš Janda
Profil
Uvědom si, co ti roboti dělají. JavaScript neumí, obrázky je (většinou) nezajímají, zvláště ty, u kterých je width="1" height="1". Proč by je měli načítat?

Pokud to jsou ale vyhledávače, zajímají je odkazy. Čili zkus na ten měřící kód dát normálně odkaz. Ovšem pak se ten odkaz bude brát jako jiná stránka, a pokud se např. nebude jeho obsah měnit, sotva se ten robot bude vracet (kdežto na tvoji stránku ano - nezávisle na měřícím kódu).

Čili zdaleka nejlepší řešení je měřit už přímo u sebe a nespoléhat na další aktivitu robota.
Dominick
Profil *
Boti ale stahují například css soubory... pokud vím tak všichni, takže je můžeš odchytávat vložením css
Marek Prokop
Profil
Pavle, neznám žádný systém založený na vloženém klientském kódu, který by uměl měřit roboty. Z toho usuzuji, že to nejde.
Pavel W.
Profil *
No právě systémů je dost a jsou už celkem rozšířené, pokud dělám další mohl by umět něco navíc jinak by to ani nemělo smysl.
Určitě by to šlo s využitím php, kde by se na stránce měřeného serveru vložil php kód, který by uložil $_SERVER['HTTP_USER_AGENT'] a pak ho třeba předával adresou, tím, že by stahoval nějaká data z měřící.server?plus=$_SERVER['HTTP_USER_AGENT'] nebo něco v tom smyslu. Jenže to by musel měřený server mít php, nebo htaccess (nevím ani jak je to s asp, ale taky by snad šlo něco udělat) a musel by tam umístit měřící kód do php, což by taky každý asi nebyl ochotný.
S tím css souborem by to snad šlo, googlebot určitě css soubory načítá, ale nevím jestli je to spolehlivé, tedy jestli ho načítá pokaždé a nevím co ostaní boti?
lamatér
Profil *
Pavel W.
Můžeš pokaždé onen css soubor přejmenovat, pokud se bude jmenovat jako 15 náhodných znaků.css dá se spoléhat na to že ho boti budou načítat pořád znovu a znovu.
ninja
Profil
A neni jednodusi jako zdrojova data brat log webserveru, ktery jediny zaznamena opravdu vsechno? Merit roboty umi i "hloupy" AWStats.
lamatér
Profil *
ninja
To by bylo krásné ale kolik procent serverů má log?... řekl bych že to nebude ani polovina. A většina z nich si ho nemůže zapnout ani pokud by moc chtěli.
Pavel W.
Profil *
lamatér
Náhodný css soubor by byl dobrý ale javascriptem ten náhodný název vytvořit nemůžu takže by to šlo jedině na straně serveru, do čehož se moc pouštět nechci.
Když nastavím cashování v onom css souboru na neukládat snad by se na něj boti chodili dívat častěji ale nevím jestli nutně při každé návštěvě stránky.
Aleš Janda
Profil
Pavel W.
Můžu se zeptat, k čemu to má být nebo co vlastně děláš?

Vložit na stránku jednoduchý skript se mi zdá mnohem jednodušší a hlavně funkčnější než jakékoli jiné řešení.
Railbot
Profil
Boti ale stahují například css soubory...
K čemu by jim byly?
ninja
Profil
lamatér:To by bylo krásné ale kolik procent serverů má log?... řekl bych že to nebude ani polovina. A většina z nich si ho nemůže zapnout ani pokud by moc chtěli.

Webhotingu je dostatecne mnozstvi, kazdy si muze vybrat dle svych potreb. Zvolit si hosting bez logu neni rozumne, je to dost dulezite pro podrobnejsi analyzu a statistiky.

Vymyslet silenosti s .css soubory, ktere roboty stejne nazajimaji, pouze se prodlouzi doba nacitani stranek navstevnikum - to je opravdu skvele reseni...
Pavel W.
Profil *
První věta prvního příspěvku říká dělám statistický server

Vaše odpověď

Mohlo by se hodit

Zajímavé čtení:
Poptávání výměny odkazů je na této diskusi nežádoucí.

Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0