Autor Zpráva
DanielB
Profil *
Dobrý den.
Pomocí PHP jsem se snažil rozparsovat html soubory, které jsou všechny ve formátu windows 1250. Problém je ten, že i když jsou html soubory téměř identické(kromě obsahu) a php kód používám na oba, u prvního se vše zobrazí a ukládá správně (iconv na utf-8), u druhého se to zobrazuje špatně. Jako html soubory používám mojenoty.cz/sheets_download.html?search= stranu jedna a dva. U prnví vše funguje, u druhé se používá asi špatný charset, jelikož zahraniční se zobrazí jako zahraniÄŤnĂ­ a podobně.
DanielB
Profil
Jako parser používám php-html-parser(github)
Keeehi
Profil
Nastavení enforceEncoding jsi zkoušel? Protože bez něj se ta knihova snaží kódování určit sama a ta automatika se prostě může splést.
DanielB
Profil
Keeehi:
Aha, hned to jdu zkusit.. Toho jsem si nevšíml


Tak jsem to opravil... V té funkci iconv se to nejmenuje WINDOWS-1250 ale CP1250, což mě zmátlo... Zjistil jsem to náhodou v MySQL článku, ale docela to mate, protože v html a editoru to mám WINDOWS-1250 ale v DB a PHP jako CP1250...


Keeehi:
Protože bez něj se ta knihova snaží kódování určit sama a ta automatika se prostě může splést.
Ano, spletla se protože používala vlastní knihovnu, kde určovala jestli to je utf-8 nebo cp1252 (tak jsem zjistil jak se to jmenuje v PHP), a asi to občas vybrala špatně..

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0