Diskuse JPW: Má někdo zkušenosti s entitou shy?

« 1 2 »

	Autor	Zpráva
	Petr ZZZ Profil	#1 · Zasláno: 15. 12. 2009, 14:42:05 · Upravil/a: Petr ZZZ Odpovědět Citovat Zdravím, má někdo zkušenosti s entitou ****? Najdou vyhledávače slovo takto zohyzdněné? Občas se mi hodí, ale nerad bych, kdyby se to odrazilo na výsledcích vyhledávání. Intuice mi říká, že by to měl vyhledávač pochopit, když to pochopí prohlížeč, ale intuice je jedna věc a praxe věc druhá. Zajímá mě, zda s tím má někdo praktické zkušenosti. Příklad: vysokozdvižný (Sám to po sobě nepřečtu. :-)
	Chamurappi Profil	#2 · Zasláno: 15. 12. 2009, 14:49:03 Odpovědět Citovat Reaguji na Petra ZZZ: Můžeme zkusit tady na diskusi, jestli vyhledávače najdou dotyčné slovo: Vysokozdvižný. (Použil jsem „“, což je ekvivalent „“.)
	Leo Profil	#3 · Zasláno: 15. 12. 2009, 15:13:53 Odpovědět Citovat Praktická zkušenost je taková, že podpora prohlížečů je mnohem lepší než bývala, akorát Opera při zarovnání do bloku (text-align justify) vystrkuje rozdělovací znaménka ven. Leo
	_es Profil	#4 · Zasláno: 15. 12. 2009, 15:46:40 Odpovědět Citovat Zaujímavé, že pri kopírovaní textu "Vysokozdvižný" z Chamurappiho príspevku do vyhľadávacieho políčka google (Firefox) sa skopírujú aj tie neviditeľné znaky a potom je to vidno aj v názve stránky: Vysokozdvižný - Vyhledat Googlem: No výsledky vyhľadávania budú asi rovnaké.
	Jan Tvrdík Profil	#5 · Zasláno: 15. 12. 2009, 15:54:45 · Upravil/a: Jan Tvrdík Odpovědět Citovat Petr ZZZ: Problém entity je jednak její neviditelnost a jednak nepodpora či nelogické chování v některých programech. Zkuste si například na zdejší stránce výše uvedené slovo vyhledat (ctrl + f). Nejde to, že? Vím, že jednu dobu bylo automatické vkládání součástí Texy!, ale nevýhody převážily výhody a tato funkcionalita byla odstraněna.
	Petr ZZZ Profil	#6 · Zasláno: 15. 12. 2009, 15:55:17 Odpovědět Citovat _es: Jsi si jistý, že jsi Chamurappiho příklad neznehodnotil? Ve zdrojáku této stránky v tvém textu už nevidím entity, ale pomlčky. Zajímavé ovšem je také, že i po zkopírovaní toho textu z tvého příspěvku do vyhledávacího políčka Google (IE) tam vidím pomlčky.
	Chamurappi Profil	#7 · Zasláno: 15. 12. 2009, 16:05:11 Odpovědět Citovat Reaguji na Petra ZZZ: Entita v HTML vždy jen zastupuje znak. A ten vidět někdy je a někdy není.
	_es Profil	#8 · Zasláno: 15. 12. 2009, 16:09:03 · Upravil/a: _es Odpovědět Citovat Petr ZZZ: „Jsi si jistý, že jsi Chamurappiho příklad neznehodnotil?“ Nie, ak používač Firefox, tak ten zobrazuje zdrojový kód podľa toho ako sa mu práve chce. Iné zobrazí ak dáš zobraziť celý kód, a iné, ak dáš zobraziť kód z kontextovej ponuky "Zobraziť zdrojový kód výberu" Tak isto niečo iné zobrazí v stavovom riadku ako adresu odkazu a niečo iné je v zdrojovom kóde. V pruhu okna sú pomlčky, no v "Nástroje -> Informácie o stránke" je to bez nich. Doplnenie: Chamurappi vystihol podstatu toho celého "problému".
	Joker Profil	#9 · Zasláno: 15. 12. 2009, 16:17:48 Odpovědět Citovat Chamurappi: Google už zaindexoval (docela rychlík) a najde.
	Petr ZZZ Profil	#10 · Zasláno: 15. 12. 2009, 17:11:21 · Upravil/a: Petr ZZZ Odpovědět Citovat [#8] _es: „...ako sa mu práve chce“ To je teda pěknej zmatek :-) Joker: "už zaindexoval" Teď ještě který z těch vyso******ých zaindexoval – zda ten Chamurappiho nebo ten _esův. Nebo ten Tvrdíkův, který zde sice byl snad jen minutu, než ho Jan Tvrdík zase smazal, ale tu chvilku jsem ho ve zdrojáku viděl bez entit i bez pomlček. :-))) Ale neva, vyzkoušet si to můžu i sám, každopádně děkuji všem za zajímavé příspěvky! Chamurappi: Je nějaký rozdíl mezi „“ a „“? Doplňuji: Ooops, jakýsi rozdíl už vidím! Chtěl jsem se zeptat na entitu **
	Chamurappi Profil	#11 · Zasláno: 15. 12. 2009, 17:36:15 Odpovědět Citovat Reaguji na Petra ZZZ: „Je nějaký rozdíl mezi ‚‘ a ‚‘?“ Není. Akorát tady na diskusi jsou číselné entity na rozdíl od jmenných interpretované. „Teď ještě který z těch vyso******ých zaindexoval“ Všechny. Můžeš hledat frázi "slovo: Vyso*********ný". Jsem zvědav, jak si poradí ostatní vyhledávače.
	Joker Profil	#12 · Zasláno: 15. 12. 2009, 17:39:17 Odpovědět Citovat Petr ZZZ: „zda ten Chamurappiho nebo ten _esův.“ Obě dvě. Stačí si vyhledat delší kus z toho Chamurappiho příspěvku.
	_es Profil	#13 · Zasláno: 15. 12. 2009, 18:24:04 Odpovědět Citovat Google však na všetky neviditeľné znaky nereaguje rovnako: So znakom unicode173: www.google.cz/search?q=jak%ADpsat%ADweb S nulovým znakom: www.google.cz/search?q=jak%00psat%ADweb Zaujímavé je, čo je prvé v poradí :-) S iným neviditeľným znakom: www.google.cz/search?q=jak%09psat%09web Jyxo má so znakom unicode173 problémy: http://jyxo.cz/s?q=jak%ADpsat%ADweb
	Chamurappi Profil	#14 · Zasláno: 15. 12. 2009, 18:41:41 Odpovědět Citovat Reaguji na _es: Neměl by být znak 173 zapsaný v adrese spíš jako „%C2%AD“? (Tedy znak U+00AD v UTF-8.) Google má na kódování autodetekci, proto baští i „%AD“ z ISO-8859-2. „S iným neviditeľným znakom“ Znak TABu patří spíš mezi bílé znaky než mezi neviditelné.
	_es Profil	#15 · Zasláno: 15. 12. 2009, 18:48:59 · Upravil/a: _es Odpovědět Citovat Chamurappi: „Neměl by být znak 173 zapsaný v adrese spíš jako ‚%C2%AD‘? (Tedy znak U+00AD v UTF-8.)“ Asi áno, len som to narýchlo upravil, no aj tak to slovo vtedy Jyxo nenájde: http://jyxo.cz/s?q=jak%C2%ADpsat%C2%ADweb Ak do vyhľadávacieho políčka Jyxa vložím slovo "Vysokozdvižný" okopírované z tvojho príspevku, tak nič nenájde. No ak to napíšem ručne (bez tých dvoch neviditeľných znakov) tak už je hľadanie úspešné. „Znak TABu patří spíš mezi bílé znaky než mezi neviditelné.“ Aký je nejaký ďalší neviditeľný znak?
	Chamurappi Profil	#16 · Zasláno: 15. 12. 2009, 19:11:04 · Upravil/a: Chamurappi Odpovědět Citovat Reaguji na _es: „Aký je nejaký ďalší neviditeľný znak?“ Třeba U+200B, mezera s nulovou šířkou. Tady je: „“ (v URL jako „%E2%80%8B“, v HTML jako „“) Hromada druhů mezer je vyjmenovaná na Wikipedii. Exotičtější mezery se nemusejí všem správně zobrazovat, tuším, že Explorer 6 na Windowsu bez nainstalovaného Officu bude omezujícím faktorem.
	_es Profil	#17 · Zasláno: 15. 12. 2009, 19:49:26 · Upravil/a: _es Odpovědět Citovat Chamurappi: „Třeba U+200B, mezera s nulovou šířkou. Tady je: ‚‘ (v URL jako ‚%E2%80%8B‘, v HTML jako ‚‘)“ Tú už Jyxo nejako spracuje: http://jyxo.cz/s?q=jak%E2%80%8Bpsat%E2%80%8Bweb No očividne ju považuje za niečo iné než google: www.google.cz/search?q=jak%E2%80%8Bpsat%E2%80%8Bweb Na prvý dotaz tejto témy sa to však nemusí nijako vzťahovať. Jedna vec je ako vyhľadávač zanalyzuje text webovej stránky. A iná vec je, ako spracuje text zadaný do vyhľadávacieho políčka alebo text v adrese k výsledkom vyhľadávania.
	Petr ZZZ Profil	#18 · Zasláno: 16. 12. 2009, 15:22:23 · Upravil/a: Petr ZZZ Odpovědět Citovat Ještě jednou díky všem za cenné podněty a účast na diskuzi! Zdá se, že Google to najde, Seznam zatím ne. Zkusím otestovat ještě méně konkurenční lampičky s neprobleskávajícími kryty (prosím nezopapouškovat). Poslední dvě varianty dole jsou jen zdánlivě stejné; první z nich je ručně vypsaná, druhá je zkopírovaná z tohoto vlákna. najdou vysokozdvižný slovo vysokozdvižný "dotyčné slovo: vysokozdvižný" kopírovaní vysokozdvižný kopírovaní vysokozdvižný
	_es Profil	#19 · Zasláno: 16. 12. 2009, 16:07:02 Odpovědět Citovat Jan Tvrdík: „Zkuste si například na zdejší stránce výše uvedené slovo vyhledat (ctrl + f). Nejde to, že?“ Mne Firefox 3.5 nájde všetky varianty toho slova na tejto stránke. Chrome to nenájde ani IE8 ani Opera10. Vyzerá to, že vyhľadávače majú často problém, ak sa do ich vyhľadávacieho políčka vloží skopírovaný text s nejakými neviditeľnými znakmi. Otázne je, či majú nejaký problém zaindexovať text z webu s neviditeľnými znakmi, či tie znaky alebo entity odstraňujú a pod.
	Marek Prokop Profil	#20 · Zasláno: 16. 12. 2009, 18:31:30 Odpovědět Citovat Jen pro zajímavost, mohu se zeptat, k čemu chcete entitu použít?
	Leo Profil	#21 · Zasláno: 16. 12. 2009, 19:41:26 Odpovědět Citovat "Jen pro zajímavost, mohu se zeptat, k čemu chcete entitu použít?" Nevím jak původní tazatel, ale třeba já bych viděl uplatnění u úzkých sloupců. Ovšem ideální by bylo, kdyby se prohlížeče konečně naučily dělit slova... Leo
	Petr ZZZ Profil	#22 · Zasláno: 16. 12. 2009, 19:42:52 · Upravil/a: Petr ZZZ Odpovědět Citovat Marek Prokop: Mám web zatím jen německy a v němčině je spousta dlouhých slov. Občas mám potřebu nějaké na konci řádku rozdělit, ale tak, aby se tam nedělala pomlčka, když si někdo třeba zvětší písmo a řádky se posunou (týká se to verze webu, kterou budu zveřejňovat zřejmě až za pár měsíců). Přičemž v rámci tohoto vlákna se vyklubal problém, se kterým jsem nepočítal: Zkopíruju-li text např. do editoru, entity nezmizí, ani nezůstanou neviditelné, ale promění se v pomlčky – a sice v pomlčky vždy viditelné. Což taky není zrovna to pravé ořechové. Tak nevím, zda na používání té entity trvat nebo se na to radši nevybodnout. Co byste mi poradil? Dodatek: Leo: Tak, tak. :-)
	_es Profil	#23 · Zasláno: 16. 12. 2009, 19:49:35 Odpovědět Citovat Petr ZZZ: „Zkopíruju-li text např. do editoru, entity nezmizí,“ Nepomohlo by použitie kódovania UTF-8 a namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku? Aký používaš editor? Nedá sa využiť hromadné nahrádzanie textu?
	Marek Prokop Profil	#24 · Zasláno: 16. 12. 2009, 19:54:13 Odpovědět Citovat [#22] Nepoužíval bych to ze dvou důvodů: 1) Podpora v různých zařízeních není a ještě asi dlouho nebude dostatečná, takže to nadělá víc škody než užitku. 2) Neumím si představit, jak to aplikovat v praxi. Dávat to mezi všechny slabiky by bylo šíleně pracné a dávat to jen někam by bylo nesystémové, protože u HTML se nikdy nemá předjímat výsledné zobrazení (v tomto případě jaké slovo se dostane na konec řádku).
	Leo Profil	#25 · Zasláno: 16. 12. 2009, 20:10:38 Odpovědět Citovat Marek Prokop: "Dávat to mezi všechny slabiky by bylo šíleně pracné". Nezkoušel jsem to prakticky, ale řešení přes algoritmus a tabulku používanou pro dělení slov v češtině v LaTexu by bylo asi schůdné - samozřejmě musí to udělat nějaký program (na straně serveru nebo klienta). Viděl jsem hotové řešení pro JS, mě by se osobně víc líbilo řešení na serveru. Leo
	Davex Profil	#26 · Zasláno: 16. 12. 2009, 20:14:25 Odpovědět Citovat Petr ZZZ: V úzkých sloupcích by možná stačilo použít CSS vlastnost word-wrap: break-word a na dělení slov se vykašlat. HTML kód bych entitou určitě nezapleveloval - maximálně bych použil k dělení slov JavaScript (hyphenator).
	Chamurappi Profil	#27 · Zasláno: 16. 12. 2009, 20:15:22 · Upravil/a: Chamurappi Odpovědět Citovat Reaguji na Marka Prokopa: „Dávat to mezi všechny slabiky by bylo šíleně pracné“ Před dávnými časy jsem zkusil vyrobit JavaScript, který doplní. Nebylo to šíleně pracné, ale bylo to šíleně pomalé. Edit: Tak to zjevně zkusil i někdo jiný. Dnes už mi to nepřipadá tak pomalé. Reaguji na _es: „Nepomohlo by použitie kódovania UTF-8“ Znak U+00AD je přítomen i ve windows-1250, i v iso-8859-2. „namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku?“ Kopíruje z prohlížeče, nebude záležet na zdrojovém kódu. „Aký používaš editor?“ Pomlčka se ukazuje např. v Notepadu. Řekl bych, že u editorů je dobře, pokud ukazují víc než prohlížeče. Potěšilo by mě, kdyby Notepad ukazoval i tvrdou mezeru, protože jsem si ji neuváženě nastavil na pravý Alt + mezerník, často ji píšu nechtěně a občas to dost vadí.
	Petr ZZZ Profil	#28 · Zasláno: 16. 12. 2009, 20:26:48 Odpovědět Citovat _es: „Nepomohlo by použitie kódovania UTF-8“ Zdá se, že ne, mám to uložené v UTF-8 a i v hlavičce mám UTF-8 deklarované. Píšu ve windowsáckém texťáku, u mě to je Programme-> Zubehoer -> Editor; "neočesky" se tomu myslím říká notepad. Pro jistotu zde je kompletní hlavička (vymazal jsem jen klíčová slova, zato jsou tam i nějaké zbytečnosti; např. favicon zatím neumím udělat): <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html class="bgg"> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8"> <meta name="description" content="betreffend dies und das"> <meta name="author" content="P Z"> <meta name="generator" content="Texteditor"> <meta name="keywords" lang="de" content="I, C, K, F, P, Z, V, D"> <meta name="keywords" lang="cs" content="h, I, b, P, Z, p"> <meta name="keywords" lang="en" content="B, C, I, P, Z, d"> <title>T</title> <link rel="icon" href="favicon.ico"> <link rel="shortcut icon" href="favicon.ico"> <link rel="stylesheet" type="text/css" media="screen, projection" href="styly.css"> <link rel="stylesheet" type="text/css" media="print" href="print.css"> <style type="text/css"></style> <link rel="shortcut icon" type="image/x-icon" href="favicon_nd.ico"> </head> <body> atd... atd... </body></html> „namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku?“ To neviem ako to myslíš, já tam tie pomlčky chcem, ale len vtedy, keď sa slovo rozdelí. Marek Prokop: "Dávat to mezi všechny slabiky by bylo šíleně pracné" Ne né, to nemám v úmyslu. Chci to jen na úvodní stránku webu, která má být jaksi ťuťo ňuňo, prostě vypilovaná. Pouze na úvodní stránce bude (neměnný) text ve dvou sloupcích, všude jinde jen v jednom sloupci s delšími řádky, takže ani nebude potřeba slova dělit, snad jen sem tam jedno, bude-li opravdu dlouhé.
	_es Profil	#29 · Zasláno: 16. 12. 2009, 21:30:01 Odpovědět Citovat Petr ZZZ:„To neviem ako to myslíš,“ Myslel som to tak, že máš tri možnosti, ako tam ten neviditeľný znak dostať: 1) entita 2) entita 3) Priamo ten neviditeľný znak. V tých dvoch kódovaniach, čo uviedol Chamurappi jeden bajt, v UTF-8 dva bajty.
	Petr ZZZ Profil	#30 · Zasláno: 16. 12. 2009, 23:35:33 · Upravil/a: Petr ZZZ Odpovědět Citovat _es: „3) Priamo ten neviditeľný znak.“ Ale já chci, aby ten znak byl někdy viditelný – jako pomlčka, a sice tehdy, když na konci řádku roz- dělí slovo. Podobně jako teď. Děl ení slov např. atributem word-wrap bez ohledu na slabiky nechci. Dal jsem na web příklad textu v úzkém sloupci: Ptosima (tu stránku možná už někdo znáte; je to rozdělané a zatím jsem doplnil jen nadpis a to v některých slovech). Jinak zkusil jsem si tiskový náhled (jiné stránky, která zatím není na webu) v FF a IE a pomlčky byly vidět jen na konci řádku a jen pokud se slovo opravdu dělilo (mám tam ručně zapsaných několik ). Tak to možná nebude tak hrozné a pokud se prokáže, že to na SEO nemá vliv, tak u některých textů asi budu používat.
		Téma pokračuje na další straně.

« 1 2 »

Vaše odpověď

Mohlo by se hodit

Odkud se sem odkazuje