Autor Zpráva
Mr.Scully
Profil
Mám tomu soupis několika set až několika tisíc souborů, jejichž výskyt na internetu (především na file-sharingových serverech typu rapid*share, uloz*to apod.) potřebuju dohledat a výsledky analyzovat (rozparsovat, vyhodit evidentní nesmysly, zbytek případně protřídit ručně). Je to kvůli porušování copyrightu (následuje reportování souborů serverům s požadavkem na smazání). Google nabízí API, ale s dost tvrdými limity na počet vyhledávání denně, více je zpoplatněno. Jaká je další varianta hledání? Nabízí google třeba nějaké rozhraní pro mobilní hledání, že by se výsledky vracely nějak rozumně v XML a šlo by to v php použít bez limitů nebo bez nutnosti čarovat s proxy? Nebo existuje nějaký spolehlivý vyhledávač typu rapidlibrary.com, který by udělal spolehlivější práci (tzn. uměl vyhledávat přes všechny známé sharingové servery) a jehož výsledky by šly nějak rozumně skriptem rozparsovat?
CrazyC0de
Profil
Zdravím, na script vám kašlu, ale dojalo mě to vaše "protřídit ručně", pokud budete prohledávat servery o takto velké kapacitě, tak rovnou zapomnte na nějako ruční třídění, tedy pokud chcete ještě někdy odejít od počítače :-), nejsem si jistý ba naopak nevěřím tomu že, by tyhle servery poskytovaly xml, avšak pokud je tomu tak, určitě ho využijte :-)..

Nebo ještě tragičtější metoda, můžete použít odesílací formulář těhle serverů, stáhnout zdrojový kod, celý ho projet regulárem, a pokud to najde hledaný výraz, tak to vrátí jméno....

Snad to půjde... aspon něco :-D,,,, čus

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: