Autor Zpráva
Honzaaa
Profil *
Ahoj, neporadil by mi někdo s následujícím:

udělal jsem si skript, který mi projde webovou stránku a automaticky stáhne informace, které potřebuji. Začíná takto:

<?php
$context=array('http' => array ('header'=> 'Range: bytes=1024-', ),);
$xcontext = stream_context_create($context);
$str=file_get_contents("nejaka_www_strnka.html",FALSE,$xcontext);
........
pak ve smyčce už vypisuju jen určité části stránky na cílovou stránku

Problém je, že když si ty stažené informace vypíšu na cílovou stránku, tak je zkomolená čeština. Já mám na výstupní stránce nastaveno charset=Windows-1250. Na zdrojové stránce není nastaveno nic. Zkoušel jsem i jiná kódování na výstupní stránce, ale ta jsou ještě horší. Co byste mi poradili aby se mi ta diakritika nezkomolila?

předem díky
Alphard
Profil
zjistit kódování dané stránky (nastavení v html hlavičce není podstatné) a funkci iconv() převást na tvé kódování
Honzaaa
Profil *
Alphard
děkuji ... jakým způsobem mohu zjistit v jakém kódování je ta zdrojová stránka?
Honzaaa
Profil *
tak už jsem na to správné kódování metodou pokusů a omylů přišel :-)
Mastodont
Profil
Honzaaa
Kdysi jsem používal pro převádění textů do jiných kódových stránek nějaký DOSový převaděč, který měl i detekci - myslím, že když pohledáš, určitě najdeš.

http://vorisekd.wz.cz/seznam3.htm
Alphard
Profil
http://latrine.dgx.cz/autoczech-aneb-automaticka-detekce-kodovani

Vaše odpověď

Mohlo by se hodit


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: