Autor Zpráva
tito100
Profil
Zdravím,

Parsujem html stránku, a po všetkom snažení sa mi nepodarilo dostat výstup v správnom kódovaní, hlavička takáto :
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="sk-SK" xml:lang="sk-SK">
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
<meta name="google-site-verification" content="....." />
<meta http-equiv="content-language" content="sk-SK" />
<meta http-equiv="content-style-type" content="text/css" />
<meta name="title" content="" />
<meta name="description" lang="sk" content="" />
<title>title</title>
</script>
</head>
<body class="ltr">


parsujem to takto :

$html = utf8_decode(implode(file($url.".htm")));
$dom->loadHTML($html);
$DIV = $dom->getElementById('nieco');
echo utf8_encode($DIV ->childNodes->item($i)->childNodes->item(0)->childNodes->item(0)->nodeValue);


Script aj stranku v ktorej yobrayujem mam v kodovani utf8.
ked dám v script len echo implode(file($url.".htm"); tak je kodovanie dobré.
avšak ked tam nedám utf8_decode tak mi parser nefunguje.

vo výsledku mi to dáva niečo takéto : "?arod?j?v u?e?"

viete mi poradit čo s tým ? vopred dakujem
tito100
Profil
už som to vyriešil :-)
stačilo len
$html = file_get_contents($url);
$html =mb_convert_encoding($html , 'HTML-ENTITIES', "utf-8");
$dom->loadHTML($html);
tito100
Profil
až taak moc som to zas nenapravil.
kodovanie je správne. ale nie vždy. ako sa mu chce. niekedy to hodí v spravnom kodovani, niekedy v špatnom ("Čarodějův učeň")

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0