Autor Zpráva
JandulaK
Profil *
Zdravím, jak zkontrolovat určitou web. stránku a zjistit zda se od poslední kontroly nezměnila. Existuje nějaká funkce, která by spočítala hash obsahu stránky? Ideálně jen textový. Díky
Jan Tvrdík
Profil
JandulaK:
Můžeš kontrolovat HTTP hlavičku Last-Modified.

Hash obsahu lze spočítat třeba takto:
$hash = md5(file_get_contents('http://example.com/'));

Doplněno: měly by fungovat i:
$hash = md5_file('http://example.com/')
JandulaK
Profil *
A existuje možnost kontroly jen samotného textového obsahu bez jakéhokoliv HTML tagu?
Fisir
Profil
Reaguji na JandulaKa [#3]:
Samozřejmě. Stačí pomocí regulárních výrazů odstranit HTML tagy a spočítat hash výsledného řetězce.
Keeehi
Profil
Fisir:
Ono by možná stačilo i obyčejné strip_tags.
Fisir
Profil
Reaguji na Keeehiho [#5]:
Ano, ale mohly by tam potom zůstat nějaké přebytečné atributy.
jenikkozak
Profil
Fisir:
Ano, ale mohly by tam potom zůstat nějaké přebytečné atributy.
Pokud odstraníš všechny značky, tak atributy zmizí také.
Mohl bys sem dát ukázku navrhovaného regulárního výrazu, který by byl lepší než ona děravá strip_tags?
Fisir
Profil
Reaguji na jenikkozaka [#7]:
Já vycházím z tvrzení na php.net.
Keeehi
Profil
Fisir:
A ty máš regulár, který si poradí i s rozbitými tagy? Vycházíš sice z nějakého tvrzení avšak řešení neposkytuješ.
JandulaK
Profil *
Ještě malá prosba: dá se poznat v jakém znakové sadě je vzdálená stránka napsaná?
jenikkozak
Profil
http://php.vrana.cz/zjisteni-kodovani-webove-stranky.php
JandulaK
Profil *
Díky!

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0