Autor Zpráva
koren
Profil *
Budu ted resit jeden projekt, kde se budou parsovat ruzne html stranky (predem zname) pomoci nastroje Simple HTML DOM Parser a tahat z nich urcita data... Ale protoze jsem nic takoveho dosud nedelal, rad si nacham poradit, jak k tomu pristupovat.... Konkretne me zajima:

1. jak nejlepe udelat PHP crawler a jak ukladat ty HTML stranky pro pozdejsi parsovani... (je to lepsi ukladat jako soubor nebo rovnou do DB ? a pokud do DB tak jako text, nebo je pro tenhle pripad i neco lepsiho ?)

2. jak zapisovat pravidla pro parsing kazde z tech stranek. Je jasne, ze vsude bude to HTML napsane dost jinak a bude v nem potreba nejdriv vysledovat urcite zakonitosti.... Ale jak lze dobre a dynamicky definovat soubor tech pravidel pro kazdou ze stranek ? (Ta uvedena trida pouziva neco jako XPath...) ...


diky

Moderátor Majkl578: Tvůj projev je špatně srozumitelný, piš prosím s diakritikou.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: