Autor Zpráva
Liaz
Profil *
Zdravím,

chci tahat data ze stránky přes funkci curl, to se mi sice daří bez problémů, mám však problém, že na dané stránce se zobrazí web bez obsahu, přes javascript se stránka po 2 sekundách obnoví a teprve se zobrazí správný obsah (stále na stejné url), který chci tahat.

$ch = curl_init();
    $timeout = 5;
    curl_setopt($ch, CURLOPT_URL, $_POST['url']);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);

    curl_setopt($ch, CURLOPT_HTTPHEADER, $request_headers); //
    curl_setopt($ch, CURLOPT_USERAGENT, $User_Agent);         //

    $data = curl_exec($ch);
    curl_close($ch);

Dá se toto nějak obejít, abych tahal obsah, který se zobrazí až po obnovení stránky?

Díky moc za radu
smitka
Profil
V PHP to jen tak nepůjde, na to je potřeba headless browser, který umí vykonávat JS - např. phantomjs. Druhá varianta prozkoumat ten javascript a rovnou se dotázat na ten zdroj co si dotahuje.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: