Autor Zpráva
Sxmanek
Profil
Zdravím, mohl by mi někdo vysvětlit co to je? Furt narážím, že by někdo potřeboval vyparsovat data z mailu, u MySQL jsem na to také narazil.
Luky
Profil
Syntaktická analýza.
Na parsování dat (textu) z mailu můžeš narazit třeba když chceš v textu najít informace o došlé platbě (odeslané maily z banky) a spárovat je se svoji databází. Jednoduše lze říci že hledáš něco podle daného vzorce.
juriad
Profil
Většinou se tím nemyslí provedení plné syntaktické analýzy, jak by tomu název naznačoval, ale pouhé vylámání informace kombinací nástrojů - často indexOf (strstr, strpos), regex, iterace přes znaky, různé explody (splity).

Třeba v tom e-mailu může jít o to, že ti přichází objednávka e-mailem ve formátu:
Jméno: xxxx
Přijmení: xxxx
Adresa: xxxx
Produkt1: xxxx
Kusů1: xxxx
Produkt2: xxxx
Kusů2: xxxx
....

A ty na základě znalosti této struktury chceš tuto objednáku automaticky zpracovat. Nejspíš bys ji rozdělil do řádků, pak každý z nich rozdělil podle první dvojtečky a pak do pole pod klíč podle první části dal druhou část řádku.

Nebo to může být identifikace telefonních čísel a e-mailových adres v e-mailu. Nebo, pokud články ukládáš do databáze, může tě zajímat, které články se odkazují na konkrétní adresu (tady bys použil asi podmínku LIKE '%http://example.com/path%'. A může jít také o získání seznamu všech odkazů ve všech tvých článcích. (Na to už není SQL příliš vhodné.)

Luky:
Technicky vzato ten odkaz na wikipedii odpovídá na otázku, ale v praxi to s automaty a gramatikami vůbec nesouvisí.
Joker
Profil
Sxmanek:
cs.wikipedia.org/wiki/Syntaktická_analýza

Laicky by se dalo říct, že program prochází nějaký text a dělí ho na části, které mu „dávají smysl“.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: