Autor | Zpráva | ||
---|---|---|---|
bogys Profil * |
#1 · Zasláno: 30. 10. 2012, 22:05:35
ahoj,
chtěl by se zeptat, zda umí curl stáhnout obsah webu od nějakého daného bodu třeba html tágu <body> do </body> ? Koukal jsem se na manual curl_setopt zda tam něco je, ale je toho hodně a nic se mi nepovedlo najít. takže přeskočí třeba hlavičku webu a vezme jen obsah. Určitě to jde potom vzít po stažený celého obsahu, ale já nechci tahat celý obsah. |
||
juriad Profil |
#2 · Zasláno: 30. 10. 2012, 22:52:06
1/ aby curl stáhnul jen určitou část, tak by to musel říct serveru; tedy server by musel podporovat tu samou funkcionalitu
2/ jak vůbec může curl tušit, že mu přijde dokument v jazyku HTML? co když daná adresa obsahuje obrázek, css, xml nebo json, nebo něco úplně jiného? uvaž, jak by ti fungovaly webové stránky bez <head>: skoro žádné styly, skoro žádné javascripty, chybné kódování jazyka |
||
Norman Profil |
#3 · Zasláno: 30. 10. 2012, 22:52:46
Curl je určen pro vytvoření requestu a tak jako tak musí stáhnout veškerý obsah, není určen pro parsování stránky. Takže pokud chceš dostat obsah z body použij
explode nebo regulérní výraz :)
|
||
Tori Profil |
#4 · Zasláno: 31. 10. 2012, 08:41:06
bogys:
„stáhnout obsah webu od nějakého daného bodu třeba html tágu <body> do </body>“ Počítejte ale s tím, že začáteční i koncová značka jsou u prvku body nepovinné. Např. když si zobrazíte zdroják této stránky, tak je tam nenajdete. |
||
Časová prodleva: 13 let
|
0