Autor Zpráva
Nobody
Profil *
Zdravím, mohl by mi někdo, prosím, poradit jak vybrat data ze Seznam.cz? Jedná se hlavně o bloky Novinky, Super a pro ženy. Zkoušel jsem to pomocí reg. výrazů, ale vždy mi to vypíši dost nepotřebných věcí.

Můj "nejpovedenější" pokus byl:
$file = file_get_contents('http://www.seznam.cz');
         $regexp = "<div class=\"hlp\">(.*)<\/div>";
         preg_match_all("/$regexp/siU", $file, $out, PREG_SET_ORDER);
Ale toto vypíše pole, které by se špatně procházelo. Díky za rady!
Str4wberry
Profil
Předpokládám, že zmíněné weby nabízí obsah i v RSS, tak bych to bral přímo z něj.
Nobody
Profil *
No, novinky a super nabízí rss, ale na seznamu se zobrazují novinky (podle čtení?) a já bych nevěděl z rss který článek je přímo na tom seznamu. Proto bych potřeboval tyto data zjístit přímo na seznamu. Díky.
Keeehi
Profil
<?php
$out = array();

$file = file_get_contents('http://www.seznam.cz');
preg_match_all('~<div class="hlp">(.*?)</div>~', $file, $matches);

foreach($matches[1] as $line){
    preg_match('~<a (?:data-dot="title" )?href="(.*?)" >(.*?)</a>~', $line, $matches2);
    $out[]=array($matches2[1],$matches2[2]);
}

print_r($out);
?>

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: