Autor Zpráva
Musilda
Profil
Zdravím

potřeboval bych poradit s kódováním řetězce.
Pomocí file_get_contents načtu stránku a pomocí DOMDocument najdu a vypíšu obsah určitého html tagu. Problém mám ale s tím, že kódování stránek může být různé a řetězec pak obsahuje špatně vypsané znaky s diakritikou.
Je nějaký způsob, jak určit v jakém kódování je obsah stránky? Na to, že to je v meta tagu se nedá spolehnout.

Musilda
tiso
Profil
AutoCzech
Musilda
Profil
Tak zrovna tato funkce mi u webu, kde to testuji hlásí nepovolené znaky pro iconv.
Samozřejmě jsem se snažil nejprve najít řešení, než jsem psal sem, ale nedokáži to zcela vychytat.
Tori
Profil
Můžete si tu informaci zjistit i přímo ze stahované stránky - get_headers (pokud posílají hlavičku pomocí header()) anebo z metatagu.

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: