Autor Zpráva
AM_
Profil
Zdravím,
chci se zeptat, neznáte někdo nějaký rozumný způsob, jak zkonvertovat dokument MS WORD (který dostanu jako zadání práce) do HTML kódu? Konkrétně mi teď jde o tabulku.
To, co vyzvrací MS Word při "uložit jako"->HTML, se mi nechce používat, cpe tam hromadu nesmyslných a zbytečných tříd a vlastností, nepožaduji, aby všechna písmena byla na pixel stejně velká, stejně barevná a stejně odsazená jako v originále (ono kéž by to fungovalo alespoň tak - prohlížeče to HTML stejně obvykle interpretují zase jinak), proto nechci odevzdat kód s tou hromadou nesmyslů. Bohatě by mi stačila co nejprostší tabulka. Na druhou stranu přepisovat to ručně je poměrně zdlouhavé a při větším objemu dat nemyslitelné.
Nox
Profil
Byl jsem v podobné situaci... rozumný způsob konvertování jsem nenašel, použil jsem normální export a potom jsem to pročistil regulárama, nevím jestli je to u tebe možný
panther
Profil
AM:
výstup z MS Word jsem delší dobu neviděl, ale jestli si dobře pamatuju, všechny buňky měly tytéž atributy. Nešlo by to upravit regulárem?
Chamurappi
Profil
Reaguji na AM:
Když to uložíš jako „webovou stránku (zjednodušený formát)“, tak je kód celkem čistý, ne?
AM_
Profil
Nox, panther:
no ono je právě těch dat tak nějak středně: už je otrava to psát ručně, ale zase jich není tolik, abych se vymýšlel s reguláry :) myslel jsem, že by na to mohl být hotový nástroj.

Chamurappi:
o něco čistší je, ale i tak je pořád co osekávat.

Asi to bude stejně jediná cesta tohle vše nějak zkombinovat.
Miloš
Profil
Nebyla by cesta přes XML vypreparované z DOCX?
_es
Profil
AM:
Konkrétně mi teď jde o tabulku.
Ak dáš skopírovať tabuľku a potom ju dáš vložiť do nejakého jednoduchého textového editora - notepadu, tak ti postačí len nahradiť tabulátory a konce riadkov za to, čo potrebuješ.
Alebo môže tiež pomôcť skopírovať tabuľku do Excelu a potom ignorovať formátovanie, pomocou vzorcov si poskladať HTML kód výslednej tabuľky, ..., a pod.
AM_
Profil
Miloš:
musel by se na to psát skript, zase moc práce, jak říkám, není to tak složité, abych na to psal vlastní skripty, to je zase jednodušší tagy upravit ručně
_es:
s tím Excelem je to dobrý nápad, uvidím, z čeho dostanu lepší výsledky
AM_
Profil
Tak jsem nakonec objevil tuhle utilku - přesně to je to, co jsem potřeboval, z HTML to vysekalo 99% bordelu. Třeba to ještě někdy někomu pomůže :)

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm: