Autor Zpráva
slon_cz
Profil
Dobrý den, má otázka zní.
Je možné ať už pomocí php, nebo javascriptem získat zdrojový kód stránky, na kterou se obsah vykresuje javascriptem až po načtení te dané stránky? Tedy po navstiveni stranky test.cz se po nacteni pomoci javascriptu nacte obsah stranky, tudiz klasicky v ctrl+u ten obsah videt neni, ale ja bych ten obsah potreboval ziskat pomoci php/javascriptu nějaký způsobem. Napadá někoho něco?
Keeehi
Profil
slon_cz:
Jde to pomocí javascriptu, pokud je na stejné doméně nebo pokud server pošle speciální hlavičku.
Přímo PHP to nedokáže ale pokud máš server a ne jen hosting tak řešení existuje. Dá se na server nainstalovat chrome/chromium a ovládat ho z příkazové řádky. Říká se tomu headless chrome. Můžeš to spouštět z PHP sám ale existuje i knihovna, která ti to zjednoduší. I když tedy je stále v rané fázi vývoje.
slon_cz
Profil
Jedná se o externí, jinou webovou stránku. Řešili jsme to se supportem té služby a bylo nám sděleno, že momentálně nemají žádnou api atp. a jediný způsob, jak data získat, je dočasně scrabovat je přímo z jejich stránky. Bohužel ta je načítáná ajaxem :/ Myslel jsem, že by mohlo existovat v javascriptu něco, co by počkalo třeba 1-2 sec po načtení stránky a poté by mi stáhlo zdrojový kód daného webu.
Keeehi
Profil
slon_cz:
Metody jsem ti popsal. Pokud chceš nějakou hlouběji rozvíjet, tak samozřejmě můžeme, ale je potřeba říci co.
Ještě je tu jedna možnost. Nenačítat vůbec tu stránku, ale načítat přímo ta data. Vy vývojářských nástrojích se podíváš na kterou url se směruje ten ajaxový požadavek a budeš stahovat rovnou tu. To půjde PHP na serveru úplně lehce.
slon_cz
Profil
Jendá se o tuto stránku a potřebuji z ní dostat obsah "donations vlevo dole". Podpora říká, že momentálně žádnou api nemají, a že dočasně můžeme parsovat přímo tuto stránku, než oni na to udělají nějaký výstup. V kódu se mi moc nedaří vyznat a najít danou url, ze které se data načítají
Keeehi
Profil
Data jsou na této URL.

slon_cz:
V kódu se mi moc nedaří vyznat a najít danou url, ze které se data načítají
V tom bych se taky nehrabal. Proto jsem psal, že se máš podívat přímo na požadavek. Všechny požadavky, které stránka odeslala jsou vidět v záložce Network / Síť.
slon_cz
Profil
To je přesně to, co hledám! Děkuji mnohokrát.

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: