Autor | Zpráva | ||
---|---|---|---|
JandulaK Profil * |
#1 · Zasláno: 28. 6. 2012, 20:54:18
Zdravím, jak zkontrolovat určitou web. stránku a zjistit zda se od poslední kontroly nezměnila. Existuje nějaká funkce, která by spočítala hash obsahu stránky? Ideálně jen textový. Díky
|
||
Jan Tvrdík Profil |
JandulaK:
Můžeš kontrolovat HTTP hlavičku Last-Modified .
Hash obsahu lze spočítat třeba takto: $hash = md5(file_get_contents('http://example.com/')); Doplněno: měly by fungovat i: $hash = md5_file('http://example.com/') |
||
JandulaK Profil * |
#3 · Zasláno: 29. 6. 2012, 17:02:57
A existuje možnost kontroly jen samotného textového obsahu bez jakéhokoliv HTML tagu?
|
||
Fisir Profil |
#4 · Zasláno: 29. 6. 2012, 17:10:08
Reaguji na JandulaKa [#3]:
Samozřejmě. Stačí pomocí regulárních výrazů odstranit HTML tagy a spočítat hash výsledného řetězce. |
||
Keeehi Profil |
#5 · Zasláno: 29. 6. 2012, 17:16:06
Fisir:
Ono by možná stačilo i obyčejné strip_tags. |
||
Fisir Profil |
#6 · Zasláno: 29. 6. 2012, 17:33:53
Reaguji na Keeehiho [#5]:
Ano, ale mohly by tam potom zůstat nějaké přebytečné atributy. |
||
jenikkozak Profil |
Fisir:
„Ano, ale mohly by tam potom zůstat nějaké přebytečné atributy.“ Pokud odstraníš všechny značky, tak atributy zmizí také. Mohl bys sem dát ukázku navrhovaného regulárního výrazu, který by byl lepší než ona děravá strip_tags? |
||
Fisir Profil |
#8 · Zasláno: 29. 6. 2012, 18:42:31
|
||
Keeehi Profil |
Fisir:
A ty máš regulár, který si poradí i s rozbitými tagy? Vycházíš sice z nějakého tvrzení avšak řešení neposkytuješ. |
||
JandulaK Profil * |
#10 · Zasláno: 1. 7. 2012, 14:42:41
Ještě malá prosba: dá se poznat v jakém znakové sadě je vzdálená stránka napsaná?
|
||
jenikkozak Profil |
#11 · Zasláno: 1. 7. 2012, 14:44:47
|
||
JandulaK Profil * |
#12 · Zasláno: 1. 7. 2012, 15:07:24
Díky!
|
||
Časová prodleva: 12 let
|
0