Diskuse JPW: Chyba u hromadné konverze data

	Autor	Zpráva
	user243 Profil	#1 · Zasláno: 3. 2. 2014, 16:58:59 · Upravil/a: user243 3. 2. 2014, 18:56:18 Odpovědět Citovat Ahoj, mám následující script, který mi má sjednotit formát data u všech souborů; foreach (glob(".txt") as $soubor) { $obsah = File($soubor); foreach ($obsah as $polozka) { $polozka = explode("<>", $polozka); //echo $polozka[0] . "<br>"; $orig_datum = $polozka[0]; $nove_datum = date("d-m-Y H-i-s", strtotime($orig_datum)); echo $nove_datum . "<br>"; } } pracuje dobře (myslím), ale u úplně prvního data 31.12.2011 14:06* mi dvakrát po sobě vypíše 01-01-1970 01-00-00; když jej převedu samostatně, tak se převede správě; mám někde chybu ve foreach()? díky. edit: hned ten první soubor měl v sobě BOM, i když v editoru nebylo tedy nic vidět, ale znovunastavením utf-8 se to spravilo; nicméně první výpis je pořád špatný... z `<pre>` jsem zjistil, že je tam také BOM, ale po úpravě hlavičky na utf-8 BOM "zmizel", ale když jsem to prohnal přes `var_dump()`, tak má o tři znaky víc, než by měl mít (přičemž nejsou vidět); nejpodivnější je, že to datum má rok 2012, i když php čte soubory abecedně/postupně - tedy od 2011 a na místě, kde by se to datum mělo správně objevit, není; v celém výpisu je jen jednou;
	Tori Profil	#2 · Zasláno: 3. 2. 2014, 23:37:46 · Upravil/a: Tori o 8 minut později Odpovědět Citovat Pokud tam není BOM, tak bych si zobrazila soubor v nějakém editoru, který zobrazí i netisknutelné znaky (např. vim pod linuxem, windowsí programy neznám).
	Alphard Profil	#3 · Zasláno: 4. 2. 2014, 00:23:36 Odpovědět Citovat Lze-li čekat chybu v netisknutelných znacích, obalte to trim(). Dobrá prevence bílých znaků při parsování dat.
	user243 Profil	#4 · Zasláno: 4. 2. 2014, 07:14:10 Odpovědět Citovat Nakonec to byla jen moje nepozornost... Klasický trim() mě napadl první, ale jaksi nefungoval; tak jsem pátral a našel funkci, která jej při výskytu odstraní: // Strips the UTF-8 mark: (hex value: EF BB BF) function trimUTF8BOM($data){ if(substr($data, 0, 3) == pack('CCC', 239, 187, 191)) { return substr($data, 3); } return $data; } Když jsem ještě jednou překontrolovával data, tak jsem našel ještě jeden soubor, který byl ve složce někde dole, ale abecedně byl první - právě v něm byl BOM, musel být někdy v minulosti otevřený v poznámkovém bloku; jinak používám pspad, ukládání BOMu mám vypnuté i se zobrazením neviditelných znaků jsem nic neuviděl (nejspíš zase moje chyba), ale přepsání formátu pomohlo; promiňte a děkuji za ochotu.
		Časová prodleva: 12 let

Vaše odpověď

Mohlo by se hodit