Autor Zpráva
zbystr
Profil *
Zdravim,
potreboval bych poradit s kodovanim, respektive s jeho prevodech. Dopredu se omlouvam, ale jsem v tomto celkem lama.
to co chci je, abych nacetl soubor .doc a zobrazil na webu. takova konverze doc2html. Neni problem, tedy az nakodovani. Pokud jsem se snazil zjistit kodovani word souboru, hodilo mi to unicode. mno a potreboval bych to prevest na utf-8. zkousel jsem laborovat s iconv, ale nevim, zda tudy vede cesta. zda se nebude muset vytvorit nejaka vlastni prevodni tabulka. Nemate nekdo s timto zkusenost??

Diky

ZbySTr
Anonymní
Profil *
A není unicode to samé co utf?
zbystr
Profil *
mno pokud jsem pochopil dobre, co jsem k tomu cetl, tak ne ....
staci vyzkouset si zobrazit soubor v unicode a utf-8 treba v nahledu v total commanderu.
thingwath
Profil
UTF-8 je jedna z možných reprezentací (kódování) Unicode. Data těžko mohou být zakódována v unicode, protože to kódování není. Pokud nějaký program tvrdí, že používá kódování unicode, tak lže.
zbystr
Profil *
Nevite tedy v cem koduje Microshit Word? ... pak me tedy napada, proc je tedy v Total Commanderu pri preview souboru moznost zobrazeni unicode a UTF-8 zvlast ..???
zbystr
Profil *
ted jsem cetl na http://office.microsoft.com, ze word pouziva standartne kodovani unicode ... takze thingwath si asi pravdu nemel :(
zbystr
Profil *
mno jak si o tom ctu vice a vice, jsem z toho cim dal tim vice zmateny ...... muzete mi to prosim nekdo vysvetlit, jak to tedy je .... jak je to s kodovanim unicode .....
Miloš
Profil
zbystr
Občas se stačí zeptat strejdy gůgla: http://cs.wikipedia.org/wiki/UTF-8 a http://cs.wikipedia.org/wiki/Unicode
thingwath
Profil
zbystr
Microsoft je v tomto případě jeden z těch co lžou :-) Byť možná nevědomky či s úmyslem nemást uživatele. Nicméně unicode je znaková sada, uTF-8 jedno její možné kódování.
Miloš
Profil
Upřesňující otázka:
Historické a dožívající — kameničtí (CP 859), PC Latin (CP 852), iso 8859-2, windows-1250 a další jsou co?
Jde o znakové sady. nebo o kódování? Ze zkratky CP (codepage, tedy kódová stránka) bych usuzoval na kódování, ale co je pak znakovou sadou?
Aesir
Profil
znaková sada = jakási tabulka, která každému znaku přiřazuje unikátní (v rámci sady) číslo (např. unicode, ascii, Kamenických, iso latin 2)
kódování znakové sady = způsob zápisu jednotlivých znaků do souborů (byte kódu) dle konkrétních znakových sad (utf-8, iso 8859-2, windows-1250)
zbystr
Profil *
to Miloš:
nejsem takovy clovek, ktery se pta bez toho, aby se na to nepodival predtim. Bohuzel jsem toho precetl spoustu a bohuzel jsem mnohdy narazil na to, ze se spousta clanku rusila navzajem, tzn jeden clanek neco nasel a druhy to vyvratil. Proto jsem se ptal tady.

V čem tedy koduje Microshit Word??? v jakem kodovaní znakové sady?

Diky ZbySTr
Toto téma je uzamčeno. Odpověď nelze zaslat.

0