Autor Zpráva
mach
Profil
Na Slashdotu je celkem zajimavy post - AOL na chvili uvolnilo data o tom, jake dotazy pokladali uzivatele jejich vyhledavaci (s tim, ze je tam anonymne rozliseno, od ktere dotazy prisly od stejneho uzivatele):

http://yro.slashdot.org/yro/06/08/07/2022244.shtml - "AOL Releases Search Logs of 657,427 Users"

Zkomprimovane to ma skoro 500 MB (mozna 2GB rozbalene) a je to asi 0.33% celkoveho poctu dotazu (nicmene to vypada, ze kdyz uz tam jsou nejake dotazy od jednoho uzivatele, tak vsechny od brezna po kveten). Data jsou textove soubory, na kazdem radku jeden zaznam, ve kterem je uvedene identifikacni cislo uzivatele, vyhledavana fraze, cas a stranka, na kterou ve vysledcich kliknul (vse oddelene tabulatorem). Vzhledem k velikosti a formatu souboru je nejlepsi je zpracovavat na pocitaci s nejakym skutecnym operacnim systemem (s nastroji jako sed, grep, ...)

Stahnout si to muzete pres bittorrent na http://www.mininova.org/tor/388815

Otazka je, co zajimaveho by se s tim dalo udelat - kdyz teda pominu zjistovani toho, kolikrat nekdo pouzil slova "fuck" a "microsoft" v jednom dotazu. Minimalne si muze kazdy overit, jak to je s delkou a poctem slov v jedne frazi.
Toto téma je uzamčeno. Odpověď nelze zaslat.

0