Autor | Zpráva | ||
---|---|---|---|
zbystr Profil * |
#1 · Zasláno: 19. 9. 2006, 10:02:01
Zdravim,
potreboval bych poradit s kodovanim, respektive s jeho prevodech. Dopredu se omlouvam, ale jsem v tomto celkem lama. to co chci je, abych nacetl soubor .doc a zobrazil na webu. takova konverze doc2html. Neni problem, tedy az nakodovani. Pokud jsem se snazil zjistit kodovani word souboru, hodilo mi to unicode. mno a potreboval bych to prevest na utf-8. zkousel jsem laborovat s iconv, ale nevim, zda tudy vede cesta. zda se nebude muset vytvorit nejaka vlastni prevodni tabulka. Nemate nekdo s timto zkusenost?? Diky ZbySTr |
||
Anonymní Profil * |
#2 · Zasláno: 19. 9. 2006, 12:09:07
A není unicode to samé co utf?
|
||
zbystr Profil * |
#3 · Zasláno: 19. 9. 2006, 12:47:34
mno pokud jsem pochopil dobre, co jsem k tomu cetl, tak ne ....
staci vyzkouset si zobrazit soubor v unicode a utf-8 treba v nahledu v total commanderu. |
||
thingwath Profil |
#4 · Zasláno: 19. 9. 2006, 13:06:00
UTF-8 je jedna z možných reprezentací (kódování) Unicode. Data těžko mohou být zakódována v unicode, protože to kódování není. Pokud nějaký program tvrdí, že používá kódování unicode, tak lže.
|
||
zbystr Profil * |
#5 · Zasláno: 19. 9. 2006, 18:32:42
Nevite tedy v cem koduje Microshit Word? ... pak me tedy napada, proc je tedy v Total Commanderu pri preview souboru moznost zobrazeni unicode a UTF-8 zvlast ..???
|
||
zbystr Profil * |
#6 · Zasláno: 19. 9. 2006, 18:42:11
ted jsem cetl na http://office.microsoft.com, ze word pouziva standartne kodovani unicode ... takze thingwath si asi pravdu nemel :(
|
||
zbystr Profil * |
#7 · Zasláno: 19. 9. 2006, 19:04:13
mno jak si o tom ctu vice a vice, jsem z toho cim dal tim vice zmateny ...... muzete mi to prosim nekdo vysvetlit, jak to tedy je .... jak je to s kodovanim unicode .....
|
||
Miloš Profil |
#8 · Zasláno: 19. 9. 2006, 20:46:58
zbystr
Občas se stačí zeptat strejdy gůgla: http://cs.wikipedia.org/wiki/UTF-8 a http://cs.wikipedia.org/wiki/Unicode |
||
thingwath Profil |
#9 · Zasláno: 19. 9. 2006, 21:01:21
zbystr
Microsoft je v tomto případě jeden z těch co lžou :-) Byť možná nevědomky či s úmyslem nemást uživatele. Nicméně unicode je znaková sada, uTF-8 jedno její možné kódování. |
||
Miloš Profil |
#10 · Zasláno: 19. 9. 2006, 21:12:42 · Upravil/a: Miloš
Upřesňující otázka:
Historické a dožívající — kameničtí (CP 859), PC Latin (CP 852), iso 8859-2, windows-1250 a další jsou co? Jde o znakové sady. nebo o kódování? Ze zkratky CP (codepage, tedy kódová stránka) bych usuzoval na kódování, ale co je pak znakovou sadou? |
||
Aesir Profil |
#11 · Zasláno: 19. 9. 2006, 21:20:12 · Upravil/a: Aesir
znaková sada = jakási tabulka, která každému znaku přiřazuje unikátní (v rámci sady) číslo (např. unicode, ascii, Kamenických, iso latin 2)
kódování znakové sady = způsob zápisu jednotlivých znaků do souborů (byte kódu) dle konkrétních znakových sad (utf-8, iso 8859-2, windows-1250) |
||
zbystr Profil * |
#12 · Zasláno: 20. 9. 2006, 08:45:55
to Miloš:
nejsem takovy clovek, ktery se pta bez toho, aby se na to nepodival predtim. Bohuzel jsem toho precetl spoustu a bohuzel jsem mnohdy narazil na to, ze se spousta clanku rusila navzajem, tzn jeden clanek neco nasel a druhy to vyvratil. Proto jsem se ptal tady. V čem tedy koduje Microshit Word??? v jakem kodovaní znakové sady? Diky ZbySTr |
||
Časová prodleva: 19 let
|
Toto téma je uzamčeno. Odpověď nelze zaslat.
0