Autor | Zpráva | ||
---|---|---|---|
jefitto44 Profil |
#1 · Zasláno: 11. 5. 2014, 22:20:27
Chcem sa opýtať, ako sa dajú zvalidovať miliónove riadky xml? Mám jeden taký, ktorý obsahuje cez 5M riadkov a potrebujem overiť, či to niekde neobsahuje nejaký hlúpy znak, ktorý mi to celé kazí. Ten úbohy xml validator na w3schools nemá šancu. Zadrhne sa už iba pri kopírovaní kódu. Existujú iné spôsoby?
|
||
juriad Profil |
xmllint (http://xmlsoft.org/xmllint.html) mi zvládne zvalidovat dost velký soubor (3487276 řádků, 229430083 bytů) během dvou sekund.
Jedná se o xml stažitelné tady: http://www.epa.gov/enviro/geo_data.html Ale koukám, že xmllint je nativně jen pro Linux, je to problém? |
||
jefitto44 Profil |
#3 · Zasláno: 11. 5. 2014, 22:35:18
Povedal by som, že teraz už aj áno... ešte pred mesiacom som bavil na ubuntu, ale teraz už nie. Navyše, otvorí mi to nejakú textovú stránku, kde je napísaných plno vecí, ktorým nerozumiem
|
||
juriad Profil |
#4 · Zasláno: 11. 5. 2014, 23:00:15
To je odkaz na dokumentaci. Nainstaluješ to přes balíčkovací systém distribuce; já ho mám součástí balíku libxml2.
Podle dalších testů zvládne 32042549 řádkové xml o velikosti 1528507099 bytů za 3m38.386s, přičemž většinu času strávil čekáním na disk a swapováním. |
||
jefitto44 Profil |
#5 · Zasláno: 12. 5. 2014, 06:26:48
No hej, ale nemám linux už...
|
||
SpatnaKlavesnice Profil * |
#6 · Zasláno: 12. 5. 2014, 10:11:08
Zkus cygwin, ale moc bych tomu nedaval.
|
||
Mike8748 Profil |
#7 · Zasláno: 12. 5. 2014, 10:12:47
|
||
Časová prodleva: 9 let
|
0