Autor Zpráva
DaveLister
Profil *
Mám data v HTML, zejtména v tabulkách. Potřebuju je rozparsovat abych data z nich mohl uložit do MySQL.
Můžete mi prosím poradit nejlepši a nejjednodušši způsob jak to udělat?

Ukazka formatu dat:

<table style="page-break-before:auto;" width="800" border="0" cellpadding="0" cellspacing="1">
  <tr >
  <td colspan="2" class="model_print">CHRYSLER</td>
  </tr>
  <tr>
  <td width="600" valign="top" class="tblsysimage"><img src='../images/exhaust/BB/04710000.gif'></td>
  <td width="200" valign="top" class="tblsystext"><table width="100%" border="0" cellspacing="2" cellpadding="0"><tr><td><img src="../images/global/cat.gif" align="right"><span class="exhtysp">Voyager</span><br><span class="exhtyca">2.0i</span><br><span class="exhcypr">96-12/00</span><br><span class="exhwhcd">SWB</span><br><span class="exhcucp">1995 cc, 133 HP, 98 KW</span><br><table width="200" border="0" cellspacing="1" cellpadding="0">  <tr>
    <td width="100"><a href="exh_select_order_list.php?query_nr=20&sysnr=04710000" class="pagelink_blue">Vyber</a></td>
  </tr>
</table>
</tr></td></table>
Měsíček
Profil
Jestli jsem to dobře pochopil, měli by pomoci regulární výrazy.
DaveLister
Profil *
O tom jsem přemýšlel ale nevím jak bych to s nimi provedl... můžete prosím poradit?

Pokusím se to ješte trochu vysvětlit:

Takových tabulek jako je v příspěvku nahoře mám několik pod sebou, potřebuju abych z <td colspan="2" class="model_print">CHRYSLER</td> vytáhl CRYSLER do proměné $vyrobce, dále potřebuju vytahnout několik dalšich věcí jako ten obrázekm a sysnr v odkazu
Joker
Profil
Pokud by to bylo XHTML anebo ten kód alespoň dal well-formed XML, šlo by z toho tahat data přes XML parser.
DaveLister
Profil *
A nebyla by nějaka funkce, s kterou bych mohl cist soubor po radcich, pripadne po tagach jako je to v jinejch jazicich (napriklad pascal)?
Joker
Profil
DaveLister
Jistěže, ale číst soubor po řádcích je v tomhle případě tak nějak na nic.
Zpracovat to jako kód umí HTML parser, který ale nebývá jako součást PHP. Proto jsem psal o XML parseru, který by to ale zpracoval jen pokud to bude well-formed XML.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: