Diskuse JPW: Validator gigantických xml

	Autor	Zpráva
	jefitto44 Profil	#1 · Zasláno: 11. 5. 2014, 22:20:27 Odpovědět Citovat Chcem sa opýtať, ako sa dajú zvalidovať miliónove riadky xml? Mám jeden taký, ktorý obsahuje cez 5M riadkov a potrebujem overiť, či to niekde neobsahuje nejaký hlúpy znak, ktorý mi to celé kazí. Ten úbohy xml validator na w3schools nemá šancu. Zadrhne sa už iba pri kopírovaní kódu. Existujú iné spôsoby?
	juriad Profil	#2 · Zasláno: 11. 5. 2014, 22:28:36 · Upravil/a: juriad o 2 minuty později Odpovědět Citovat xmllint (http://xmlsoft.org/xmllint.html) mi zvládne zvalidovat dost velký soubor (3487276 řádků, 229430083 bytů) během dvou sekund. Jedná se o xml stažitelné tady: http://www.epa.gov/enviro/geo_data.html Ale koukám, že xmllint je nativně jen pro Linux, je to problém?
	jefitto44 Profil	#3 · Zasláno: 11. 5. 2014, 22:35:18 Odpovědět Citovat Povedal by som, že teraz už aj áno... ešte pred mesiacom som bavil na ubuntu, ale teraz už nie. Navyše, otvorí mi to nejakú textovú stránku, kde je napísaných plno vecí, ktorým nerozumiem
	juriad Profil	#4 · Zasláno: 11. 5. 2014, 23:00:15 Odpovědět Citovat To je odkaz na dokumentaci. Nainstaluješ to přes balíčkovací systém distribuce; já ho mám součástí balíku libxml2. Podle dalších testů zvládne 32042549 řádkové xml o velikosti 1528507099 bytů za 3m38.386s, přičemž většinu času strávil čekáním na disk a swapováním.
	jefitto44 Profil	#5 · Zasláno: 12. 5. 2014, 06:26:48 Odpovědět Citovat No hej, ale nemám linux už...
	SpatnaKlavesnice Profil *	#6 · Zasláno: 12. 5. 2014, 10:11:08 Odpovědět Citovat Zkus cygwin, ale moc bych tomu nedaval.
	Mike8748 Profil	#7 · Zasláno: 12. 5. 2014, 10:12:47 Odpovědět Citovat co http://code.google.com/p/xmllint/ ?
		Časová prodleva: 11 let

Vaše odpověď

Mohlo by se hodit