Autor Zpráva
E5150
Profil
Zdravím,

mám tento problém:

pomocí fcí get_headers($url, 1) a file_get_contents($url) načítám obsahy stránek a ukládám do DB tabulky do sloupce typu TEXT s porovnáním utf8_czech_ci.

Bohužel stránky psané v jiném kódování než UTF-8 se do tabulky neuloží (respektive uloží se jen do prvního znaku s diaktritikou).

Napadlo mě získat nějak CHARSET dokumentu a text potom překonvertovat pomocí iconv do UTF-8, nicméně nemůžu najít žádnou fci, které umí získat charset u všech dokumentů.
Možná existuje i jiný způsob, jak to řešit...?

Poradí mi někdo? Děkuji mnohokrát za každý nápad!!! :o)
Alphard
Profil
http://latrine.dgx.cz/autoczech-aneb-automaticka-detekce-kodovani
E5150
Profil
Skvělé, díky moc!

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: