Diskuse JPW: Špatné řazení českých znaků v MySQL

	Autor	Zpráva
	bob99 Profil	#1 · Zasláno: 22. 3. 2010, 10:35:13 Odpovědět Citovat Dobrý den, Mysql mi chybně řadí české znaky. Už nevím co kde nastavit. PHP 5.3.1, MySQL 5.1.41. CREATE TABLE `test_razeni3` ( `polozka` varchar(50) COLLATE utf8_czech_ci NOT NULL ) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_czech_ci Výstup: auto cihla dav česnek chleba ďábel nestor ňouma ředkvička plod rum stůl špička zlato židle ..... ředkvička a česnek jsou mimo pořadí v české abecedě. Poradíte? Dík
	sysel Profil	#2 · Zasláno: 22. 3. 2010, 23:58:47 Odpovědět Citovat Zkusil jsem a získal následující řazení (v MySQL 5.0.37 skrze phpMyAdmin): auto cihla česnek ďábel ďaur dav ďolík chleba janko marienka mirka nestor ňouma plod rum ředkvička řeďkvička stůl špička tonko zlato židle Vypadá to trochu lépe, ale zdá se, jakoby někdo usoudil, že d a ď nemají pro řazení významový rozdíl a podobně si vykládá t / ť a n / ň. Nejsem si jist, ale v některých slovnících to takhle kdysi bylo. Nic mne nenapadá :-/ , snad jen zkusit ještě řazení slovenské, protože to je formálně stejné. :-?
	bob99 Profil	#3 · Zasláno: 23. 3. 2010, 12:52:57 Odpovědět Citovat Tak Slovensko taky nepomohlo :-( SELECT polozka FROM test_razeni3 ORDER BY polozka COLLATE utf8_slovak_ci Výstup: auto cihla dav česnek chleba ďábel nestor ňouma ředkvička plod rum stůl špička zlato židle ... no ale kdyby to aspoň vypadalo jako u Vás tak by to ani nevadilo jenže to se mi nepovedlo.
	Kajman_ Profil *	#4 · Zasláno: 23. 3. 2010, 13:15:53 Odpovědět Citovat bob99: Máte data uložená opravdu v utf8? (Pokud ano, tak by měla být např. v pma, admineru nebo mysql query browseru v pořádku diakritika).
	sysel Profil	#5 · Zasláno: 23. 3. 2010, 13:18:15 Odpovědět Citovat Zkusil jste obejít PHP a zadat SELECT přímo z konsole? popřípadě existuje i přímo MySQLbrowser. Myslím, že je nutné léčit to po krocích. Pro správnou komunikaci MySQL <-> PHP je nutno mít koherentně nastavené mysql_set_charset() a mysql_client_encoding(), ale to doufám máte.
	petr 6 Profil	#6 · Zasláno: 23. 3. 2010, 13:19:12 Odpovědět Citovat sysel: „Vypadá to trochu lépe, ale zdá se, jakoby někdo usoudil, že d a ď nemají pro řazení významový rozdíl a podobně si vykládá t / ť a n / ň.“ Očividně usoudil
	sysel Profil	#7 · Zasláno: 23. 3. 2010, 16:09:46 Odpovědět Citovat Reaguji na petr 6, jsem trochu staršího data, takže proto jsem se k řazení nechtěl vyjadřovat ani kriticky ani obdivně, různých nazírání na správné řazení bylo a jistě ještě bude mnoho. Podobně je pohled na jiné obecně jazykové jevy často velmi krátkozraký a svými zásahy, ospravedlňovanými frekvencí použítí v obecné češtině, se postupně blížíme ke slovenčině, která již zcela poztrácela charakter jazyka, ve kterém by se čtenář mohl nechat vést zdravým rozumem a minimem pochopitelných pravidel. Franština po revolučním kvasu přelomu 18/19 století klesla ve spisovném jazyce až tak hluboko, že v psaném projevu nebylo lze rozlišit spojku a (et->e) od třetí osoby jednotné slovesa étre (býti) a psali namísto est rovněž jen e. (Obnovená Akademie pak naštěstí vrátila pravidla pravopisu před tyto výstřelky a Francozi si tak mohou jako málokterý národ přečíst i 500 let staré texty). Pokud má být jazyk nositelem informace, pak by jeho psaná forma neměla být ve vleku špatné výslovnosti a rovněž s jazykem související normy (kupř. abecední řazení), by neměly bezbřeze ustupovat požadavkům jednoduchosti počítačového zpracování. Pokud je ve správné výslovnosti kladen přízvuk na předložku, správné lámání textu, má-li čtenáči usnadňovat přednes, by mělo tuto jazykovou normu respektovat. Je však zřejmě snazší podplatit někoho v Ústavu pro jazyk český, aby se lámání slov omezilo na jednopísmenové předložky v, z, s a k. Háčky a čárky vypadají velmi esteticky, ale kdybychom se byli drželi Husovy reformy, měli bychom jen čárku a tečku. Používaje logiky zmíněného odkazu, by měla být slova počínající jednoduchým v i dvojitým w promíchána, protože zvukově nenesou rozdílnou informaci (v české výslovnosti, v němčině je samozřejmě výslovnost rozdílná) Ke správnému řazení slov v češtině je nutno použít více než jen stroje. :-) A naopak, pokud se týký ryze strojového zpracování, může to být člověčímu oprátorovi šuma-drát, hlavně když získá odpovídající záznam. Z tohoto pohledu je naopak žádoucí, aby se diakritikou opatřená písmena důsledně rozlišovala.
	bob99 Profil	#8 · Zasláno: 23. 3. 2010, 17:45:27 Odpovědět Citovat [#4] Kajman ten výstup jsem zkoušel i v SQLyog a to samý....
	petr 6 Profil	#9 · Zasláno: 23. 3. 2010, 18:43:41 Odpovědět Citovat sysel: Hezký názor, bohužel ale pláčete na špatném hrobě, já to nepsal, jen jsem uvedl odkaz na normu, podle které jste v [#2] získal dotyčné pořadí. Rád bych rozebral rozdíl mezi d a ď (respektive rozdíl mezi rozdílem d-ď a s-š), ale to už bychom odbočovali od tématu.
	sysel Profil	#10 · Zasláno: 23. 3. 2010, 22:58:08 Odpovědět Citovat Omlouvám se za nepřípadný OffTopic, jen jsem reagoval na japnou poznámku. K věci: Nezbývá než navrhnout zoufalé činy - zkusit řazení dle obecného unicode a nad výstupem podumat - vyexportovat data a vložit znovu nejlépe do nové tabulky - přeinstalovat MySQL napadá někoho něco dalšího? A propos - neuškodila by letmá zmínka o použitém OS popřípadě jeho nastavení locales.
	Kajman_ Profil *	#11 · Zasláno: 24. 3. 2010, 08:35:41 Odpovědět Citovat To řazení bývá tuším v mysql už zkompilováno. Tak snad jen zkompilovat nebo přeinstalovat pokud možno na novější verzi. Testul jsem to v 5.1.45 a řadí se to česky. i v SQLyog a to samý Před lety jsem sqlyog používal, kdy nebyla podpora převodu znakových sad na verzích 4.0 a nižších. Jinak to zlobilo. Sice mají novější verze asi již opravené, ale pro jistotu bych otestoval např. ten adminer nebo mysql query browser z mysql gui tools. Nebo si alespoň vypsat show variables like 'character_set_connection'
	bob99 Profil	#12 · Zasláno: 24. 3. 2010, 09:12:10 Odpovědět Citovat Tak v admineru tam ty český znaky nebyly ale po vytvoření nový table už je to OK. Takže to bylo asi verzí SQLyog tak zkusím novou verzi. Jo a ještě někde nastavit PHP, protože mám teď místo českých znaků otazníky ale správně seřazené :-)
	Kajman_ Profil *	#13 · Zasláno: 24. 3. 2010, 09:14:57 Odpovědět Citovat Nastavte si set names, viz faq.
	bob99 Profil	#14 · Zasláno: 24. 3. 2010, 09:34:06 Odpovědět Citovat Vyřešeno. Všem díky
		Časová prodleva: 14 let

Vaše odpověď

Mohlo by se hodit