| Autor | Zpráva | ||
|---|---|---|---|
| tito100 Profil |
#1 · Zasláno: 30. 1. 2011, 09:13:19 · Upravil/a: tito100
Zdravím,
Parsujem html stránku, a po všetkom snažení sa mi nepodarilo dostat výstup v správnom kódovaní, hlavička takáto : <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="sk-SK" xml:lang="sk-SK"> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8" /> <meta name="google-site-verification" content="....." /> <meta http-equiv="content-language" content="sk-SK" /> <meta http-equiv="content-style-type" content="text/css" /> <meta name="title" content="" /> <meta name="description" lang="sk" content="" /> <title>title</title> </script> </head> <body class="ltr"> parsujem to takto : $html = utf8_decode(implode(file($url.".htm")));
$dom->loadHTML($html);
$DIV = $dom->getElementById('nieco');
echo utf8_encode($DIV ->childNodes->item($i)->childNodes->item(0)->childNodes->item(0)->nodeValue);Script aj stranku v ktorej yobrayujem mam v kodovani utf8. ked dám v script len echo implode(file($url.".htm"); tak je kodovanie dobré. avšak ked tam nedám utf8_decode tak mi parser nefunguje. vo výsledku mi to dáva niečo takéto : "?arod?j?v u?e?" viete mi poradit čo s tým ? vopred dakujem |
||
| tito100 Profil |
#2 · Zasláno: 30. 1. 2011, 09:39:38 · Upravil/a: tito100
už som to vyriešil :-)
stačilo len $html = file_get_contents($url); $html =mb_convert_encoding($html , 'HTML-ENTITIES', "utf-8"); $dom->loadHTML($html); |
||
| tito100 Profil |
#3 · Zasláno: 30. 1. 2011, 09:49:20
až taak moc som to zas nenapravil.
kodovanie je správne. ale nie vždy. ako sa mu chce. niekedy to hodí v spravnom kodovani, niekedy v špatnom ("Ä?arodÄ?jův uÄ?eÅ?") |
||
|
Časová prodleva: 15 let
|
|||
0