Autor Zpráva
lukasik
Profil
ze stránek alfakompu se snažím získat url pro zobrazení následující stránky, bohužel neúspěšně.
nevíte, kde může být problém?

$url = "http://www.alfacomp.cz/php/index.php?eid=15LH45081";
$content = file_get_contents($url);
preg_match('/\<a href="(.*)" .*\>následující\<\/a\>/',$content,$match);


html daného odkazu
<a href="index.php?eid=15LH4508100000000001F" title="Zobrazí následující stránku položek">následující</a>
YoSarin
Profil
lukasik:
Neúspěšně znamená co? Že v $match nic není, nebo že tam je něco co by tam být nemělo?
Tori
Profil
Pokud váš skript je uložen v utf8 (resp. jiném než win-1250), tak musíte nejdřív pomocí iconv překódovat řetězec "následující" na cp1250 (v němž je uložená ta stránka alfacompu). Taky bych trochu upravila ten regulár, aby (tak jako mně) nechytil nenasytně vše od prvního odkazu na stránce:
$regex = '~<a href="([^"]*)"(?:[^>]*)>' . $prekodovany_text . '</a>~si';
lukasik
Profil
YoSarin ano, v $match nic není
script mám uložen v kódování cp1250 (PSPad>Formát)

zkoušel jsem i regulár od Tori, ale ani ten mi nefunguje
YoSarin
Profil
lukasik:
A stránka se stáhne v pořádku a celá? Jinak bych taky hledal problém v kódování...
Tori
Profil
lukasik:
Můžete ukázat, jak jste to zkoušel? Mně to totiž takhle fungovalo. (Můj skript byl v utf8).
lukasik
Profil
už to jde, omlouvám se, moje blbost
převáděl jsem na cp1250 ikdyž jsem tak měl uložen celý script
iconv('UTF-8', 'cp1250', "následující")

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0