| Autor | Zpráva | ||
|---|---|---|---|
| Nobody Profil * |
Zdravím, mohl by mi někdo, prosím, poradit jak vybrat data ze Seznam.cz? Jedná se hlavně o bloky Novinky, Super a pro ženy. Zkoušel jsem to pomocí reg. výrazů, ale vždy mi to vypíši dost nepotřebných věcí.
Můj "nejpovedenější" pokus byl: $file = file_get_contents('http://www.seznam.cz');
$regexp = "<div class=\"hlp\">(.*)<\/div>";
preg_match_all("/$regexp/siU", $file, $out, PREG_SET_ORDER); |
||
| Str4wberry Profil |
#2 · Zasláno: 24. 1. 2012, 13:35:02
Předpokládám, že zmíněné weby nabízí obsah i v RSS, tak bych to bral přímo z něj.
|
||
|
Časová prodleva: 6 dní
|
|||
| Nobody Profil * |
#3 · Zasláno: 30. 1. 2012, 22:02:24
No, novinky a super nabízí rss, ale na seznamu se zobrazují novinky (podle čtení?) a já bych nevěděl z rss který článek je přímo na tom seznamu. Proto bych potřeboval tyto data zjístit přímo na seznamu. Díky.
|
||
| Keeehi Profil |
<?php
$out = array();
$file = file_get_contents('http://www.seznam.cz');
preg_match_all('~<div class="hlp">(.*?)</div>~', $file, $matches);
foreach($matches[1] as $line){
preg_match('~<a (?:data-dot="title" )?href="(.*?)" >(.*?)</a>~', $line, $matches2);
$out[]=array($matches2[1],$matches2[2]);
}
print_r($out);
?> |
||
|
Časová prodleva: 14 let
|
|||
0