Autor | Zpráva | ||
---|---|---|---|
DanielB Profil * |
#1 · Zasláno: 2. 3. 2019, 11:37:35
Dobrý den.
Pomocí PHP jsem se snažil rozparsovat html soubory, které jsou všechny ve formátu windows 1250. Problém je ten, že i když jsou html soubory téměř identické(kromě obsahu) a php kód používám na oba, u prvního se vše zobrazí a ukládá správně (iconv na utf-8), u druhého se to zobrazuje špatně. Jako html soubory používám mojenoty.cz/sheets_download.html?search= stranu jedna a dva. U prnví vše funguje, u druhé se používá asi špatný charset, jelikož zahraniční se zobrazí jako zahraniÄŤnĂ a podobně. |
||
DanielB Profil |
#2 · Zasláno: 2. 3. 2019, 11:40:19
Jako parser používám php-html-parser(github)
|
||
Keeehi Profil |
#3 · Zasláno: 2. 3. 2019, 12:11:46
Nastavení enforceEncoding jsi zkoušel? Protože bez něj se ta knihova snaží kódování určit sama a ta automatika se prostě může splést.
|
||
DanielB Profil |
Keeehi:
Aha, hned to jdu zkusit.. Toho jsem si nevšíml Tak jsem to opravil... V té funkci iconv se to nejmenuje WINDOWS-1250 ale CP1250, což mě zmátlo... Zjistil jsem to náhodou v MySQL článku, ale docela to mate, protože v html a editoru to mám WINDOWS-1250 ale v DB a PHP jako CP1250... Keeehi: „Protože bez něj se ta knihova snaží kódování určit sama a ta automatika se prostě může splést.“ Ano, spletla se protože používala vlastní knihovnu, kde určovala jestli to je utf-8 nebo cp1252 (tak jsem zjistil jak se to jmenuje v PHP), a asi to občas vybrala špatně.. |
||
Časová prodleva: 6 let
|
0