« 1 2 »
Autor Zpráva
Petr ZZZ
Profil
Zdravím,
má někdo zkušenosti s entitou ­? Najdou vyhledávače slovo takto zohyzdněné? Občas se mi hodí, ale nerad bych, kdyby se to odrazilo na výsledcích vyhledávání. Intuice mi říká, že by to měl vyhledávač pochopit, když to pochopí prohlížeč, ale intuice je jedna věc a praxe věc druhá. Zajímá mě, zda s tím má někdo praktické zkušenosti.
Příklad:
vy­so­ko­zdviž­ný
(Sám to po sobě nepřečtu. :-)
Chamurappi
Profil
Reaguji na Petra ZZZ:
Můžeme zkusit tady na diskusi, jestli vyhledávače najdou dotyčné slovo: Vy­so­ko­zdviž­ný.
(Použil jsem „­“, což je ekvivalent „­“.)
Leo
Profil
Praktická zkušenost je taková, že podpora prohlížečů je mnohem lepší než bývala, akorát Opera při zarovnání do bloku (text-align justify) vystrkuje rozdělovací znaménka ven. Leo
_es
Profil
Zaujímavé, že pri kopírovaní textu "Vy­so­ko­zdviž­ný" z Chamurappiho príspevku do vyhľadávacieho políčka google (Firefox) sa skopírujú aj tie neviditeľné znaky a potom je to vidno aj v názve stránky: Vy­so­ko­zdviž­ný - Vyhledat Googlem:
No výsledky vyhľadávania budú asi rovnaké.
Jan Tvrdík
Profil
Petr ZZZ:
Problém entity ­ je jednak její neviditelnost a jednak nepodpora či nelogické chování v některých programech. Zkuste si například na zdejší stránce výše uvedené slovo vyhledat (ctrl + f). Nejde to, že? Vím, že jednu dobu bylo automatické vkládání ­ součástí Texy!, ale nevýhody převážily výhody a tato funk­ci­o­na­li­ta byla odstraněna.
Petr ZZZ
Profil
_es:
Jsi si jistý, že jsi Chamurappiho příklad neznehodnotil? Ve zdrojáku této stránky v tvém textu už nevidím entity, ale pomlčky. Zajímavé ovšem je také, že i po zkopírovaní toho textu z tvého příspěvku do vyhledávacího políčka Google (IE) tam vidím pomlčky.
Chamurappi
Profil
Reaguji na Petra ZZZ:
Entita v HTML vždy jen zastupuje znak.
A ten vidět někdy je a někdy není.
_es
Profil
Petr ZZZ:
Jsi si jistý, že jsi Chamurappiho příklad neznehodnotil?

Nie, ak používač Firefox, tak ten zobrazuje zdrojový kód podľa toho ako sa mu práve chce.
Iné zobrazí ak dáš zobraziť celý kód, a iné, ak dáš zobraziť kód z kontextovej ponuky "Zobraziť zdrojový kód výberu"
Tak isto niečo iné zobrazí v stavovom riadku ako adresu odkazu a niečo iné je v zdrojovom kóde.
V pruhu okna sú pomlčky, no v "Nástroje -> Informácie o stránke" je to bez nich.

Doplnenie: Chamurappi vystihol podstatu toho celého "problému".
Joker
Profil
Chamurappi:
Google už zaindexoval (docela rychlík) a najde.
Petr ZZZ
Profil
[#8] _es:
...ako sa mu práve chce
To je teda pěknej zmatek :-)

Joker:
"už zaindexoval"
Teď ještě který z těch vyso********ých zaindexoval – zda ten Chamurappiho nebo ten _esův. Nebo ten Tvrdíkův, který zde sice byl snad jen minutu, než ho Jan Tvrdík zase smazal, ale tu chvilku jsem ho ve zdrojáku viděl bez entit i bez pomlček. :-))) Ale neva, vyzkoušet si to můžu i sám, každopádně děkuji všem za zajímavé příspěvky!

Chamurappi:
Je nějaký rozdíl mezi „­“ a „­“?

Doplňuji: Ooops, jakýsi rozdíl už vidím! Chtěl jsem se zeptat na entitu ­
Chamurappi
Profil
Reaguji na Petra ZZZ:
Je nějaký rozdíl mezi ‚­‘ a ‚­‘?
Není. Akorát tady na diskusi jsou číselné entity na rozdíl od jmenných interpretované.

Teď ještě který z těch vyso********ých zaindexoval
Všechny. Můžeš hledat frázi "slovo: Vy­so­*********ný".

Jsem zvědav, jak si poradí ostatní vyhledávače.
Joker
Profil
Petr ZZZ:
zda ten Chamurappiho nebo ten _esův.
Obě dvě. Stačí si vyhledat delší kus z toho Chamurappiho příspěvku.
_es
Profil
Google však na všetky neviditeľné znaky nereaguje rovnako:
So znakom unicode173: www.google.cz/search?q=jak%ADpsat%ADweb
S nulovým znakom: www.google.cz/search?q=jak%00psat%ADweb Zaujímavé je, čo je prvé v poradí :-)
S iným neviditeľným znakom: www.google.cz/search?q=jak%09psat%09web

Jyxo má so znakom unicode173 problémy: http://jyxo.cz/s?q=jak%ADpsat%ADweb
Chamurappi
Profil
Reaguji na _es:
Neměl by být znak 173 zapsaný v adrese spíš jako „%C2%AD“? (Tedy znak U+00AD v UTF-8.)
Google má na kódování autodetekci, proto baští i „%AD“ z ISO-8859-2.

S iným neviditeľným znakom
Znak TABu patří spíš mezi bílé znaky než mezi neviditelné.
_es
Profil
Chamurappi:
Neměl by být znak 173 zapsaný v adrese spíš jako ‚%C2%AD‘? (Tedy znak U+00AD v UTF-8.)
Asi áno, len som to narýchlo upravil, no aj tak to slovo vtedy Jyxo nenájde: http://jyxo.cz/s?q=jak%C2%ADpsat%C2%ADweb
Ak do vyhľadávacieho políčka Jyxa vložím slovo "Vy­so­ko­zdviž­ný" okopírované z tvojho príspevku, tak nič nenájde.
No ak to napíšem ručne (bez tých dvoch neviditeľných znakov) tak už je hľadanie úspešné.

Znak TABu patří spíš mezi bílé znaky než mezi neviditelné.
Aký je nejaký ďalší neviditeľný znak?
Chamurappi
Profil
Reaguji na _es:
Aký je nejaký ďalší neviditeľný znak?
Třeba U+200B, mezera s nulovou šířkou. Tady je: „​“ (v URL jako „%E2%80%8B“, v HTML jako „​“)
Hromada druhů mezer je vyjmenovaná na Wikipedii. Exotičtější mezery se nemusejí všem správně zobrazovat, tuším, že Explorer 6 na Windowsu bez nainstalovaného Officu bude omezujícím faktorem.
_es
Profil
Chamurappi:
Třeba U+200B, mezera s nulovou šířkou. Tady je: ‚​‘ (v URL jako ‚%E2%80%8B‘, v HTML jako ‚​‘)
Tú už Jyxo nejako spracuje: http://jyxo.cz/s?q=jak%E2%80%8Bpsat%E2%80%8Bweb
No očividne ju považuje za niečo iné než google: www.google.cz/search?q=jak%E2%80%8Bpsat%E2%80%8Bweb

Na prvý dotaz tejto témy sa to však nemusí nijako vzťahovať.
Jedna vec je ako vyhľadávač zanalyzuje text webovej stránky.
A iná vec je, ako spracuje text zadaný do vyhľadávacieho políčka alebo text v adrese k výsledkom vyhľadávania.
Petr ZZZ
Profil
Ještě jednou díky všem za cenné podněty a účast na diskuzi! Zdá se, že Google to najde, Seznam zatím ne. Zkusím otestovat ještě méně konkurenční
lampičky s ne­­pro­­bles­­ká­­va­­jí­­cí­­mi kryty (prosím nez­­o­pa­­pouš­­ko­­va­t). Poslední dvě varianty dole jsou jen zdánlivě stejné; první z nich je ručně vypsaná, druhá je zkopírovaná z tohoto vlákna.

najdou vysokozdvižný
slovo vysokozdvižný
"dotyčné slovo: vysokozdvižný"
kopírovaní vysokozdvižný
kopírovaní vysokozdvižný
_es
Profil
Jan Tvrdík:
Zkuste si například na zdejší stránce výše uvedené slovo vyhledat (ctrl + f). Nejde to, že?
Mne Firefox 3.5 nájde všetky varianty toho slova na tejto stránke.
Chrome to nenájde ani IE8 ani Opera10.

Vyzerá to, že vyhľadávače majú často problém, ak sa do ich vyhľadávacieho políčka vloží skopírovaný text s nejakými neviditeľnými znakmi.
Otázne je, či majú nejaký problém zaindexovať text z webu s neviditeľnými znakmi, či tie znaky alebo entity odstraňujú a pod.
Marek Prokop
Profil
Jen pro zajímavost, mohu se zeptat, k čemu chcete entitu ­ použít?
Leo
Profil
"Jen pro zajímavost, mohu se zeptat, k čemu chcete entitu ­ použít?"

Nevím jak původní tazatel, ale třeba já bych viděl uplatnění u úzkých sloupců. Ovšem ideální by bylo, kdyby se prohlížeče konečně naučily dělit slova... Leo
Petr ZZZ
Profil
Marek Prokop:
Mám web zatím jen německy a v němčině je spousta dlouhých slov. Občas mám potřebu nějaké na konci řádku rozdělit, ale tak, aby se tam nedělala pomlčka, když si někdo třeba zvětší písmo a řádky se posunou (týká se to verze webu, kterou budu zveřejňovat zřejmě až za pár měsíců).

Přičemž v rámci tohoto vlákna se vyklubal problém, se kterým jsem nepočítal: Zkopíruju-li text např. do editoru, entity nezmizí, ani nezůstanou neviditelné, ale promění se v pomlčky – a sice v pomlčky vždy viditelné. Což taky není zrovna to pravé ořechové. Tak nevím, zda na používání té entity trvat nebo se na to radši nevybodnout. Co byste mi poradil?

Dodatek: Leo: Tak, tak. :-)
_es
Profil
Petr ZZZ:
Zkopíruju-li text např. do editoru, entity nezmizí,
Nepomohlo by použitie kódovania UTF-8 a namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku?
Aký používaš editor?
Nedá sa využiť hromadné nahrádzanie textu?
Marek Prokop
Profil
[#22] Nepoužíval bych to ze dvou důvodů:

1) Podpora v různých zařízeních není a ještě asi dlouho nebude dostatečná, takže to nadělá víc škody než užitku.

2) Neumím si představit, jak to aplikovat v praxi. Dávat to mezi všechny slabiky by bylo šíleně pracné a dávat to jen někam by bylo nesystémové, protože u HTML se nikdy nemá předjímat výsledné zobrazení (v tomto případě jaké slovo se dostane na konec řádku).
Leo
Profil
Marek Prokop:

"Dávat to mezi všechny slabiky by bylo šíleně pracné".

Nezkoušel jsem to prakticky, ale řešení přes algoritmus a tabulku používanou pro dělení slov v češtině v LaTexu by bylo asi schůdné - samozřejmě musí to udělat nějaký program (na straně serveru nebo klienta). Viděl jsem hotové řešení pro JS, mě by se osobně víc líbilo řešení na serveru. Leo
Davex
Profil
Petr ZZZ:
V úzkých sloupcích by možná stačilo použít CSS vlastnost word-wrap: break-word a na dělení slov se vykašlat. HTML kód bych entitou ­ určitě nezapleveloval - maximálně bych použil k dělení slov JavaScript (hyphenator).
Chamurappi
Profil
Reaguji na Marka Prokopa:
Dávat to mezi všechny slabiky by bylo šíleně pracné
Před dávnými časy jsem zkusil vyrobit JavaScript, který ­ doplní. Nebylo to šíleně pracné, ale bylo to šíleně pomalé.
Edit: Tak to zjevně zkusil i někdo jiný. Dnes už mi to nepřipadá tak pomalé.


Reaguji na _es:
Nepomohlo by použitie kódovania UTF-8
Znak U+00AD je přítomen i ve windows-1250, i v iso-8859-2.

namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku?
Kopíruje z prohlížeče, nebude záležet na zdrojovém kódu.

Aký používaš editor?
Pomlčka se ukazuje např. v Notepadu. Řekl bych, že u editorů je dobře, pokud ukazují víc než prohlížeče. Potěšilo by mě, kdyby Notepad ukazoval i tvrdou mezeru, protože jsem si ji neuváženě nastavil na pravý Alt + mezerník, často ji píšu nechtěně a občas to dost vadí.
Petr ZZZ
Profil
_es:
Nepomohlo by použitie kódovania UTF-8

Zdá se, že ne, mám to uložené v UTF-8 a i v hlavičce mám UTF-8 deklarované. Píšu ve windowsáckém texťáku, u mě to je Programme-> Zubehoer -> Editor; "neočesky" se tomu myslím říká notepad. Pro jistotu zde je kompletní hlavička (vymazal jsem jen klíčová slova, zato jsou tam i nějaké zbytečnosti; např. favicon zatím neumím udělat):

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
       "http://www.w3.org/TR/html4/loose.dtd">
<html class="bgg">
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<meta name="description" content="betreffend dies und das">
<meta name="author" content="P Z">
<meta name="generator" content="Texteditor">
<meta name="keywords" lang="de" content="I, C, K, F, P, Z, V, D">
<meta name="keywords" lang="cs" content="h, I, b, P, Z, p">
<meta name="keywords" lang="en" content="B, C, I, P, Z, d">
<title>T</title>
<link rel="icon" href="favicon.ico">
<link rel="shortcut icon" href="favicon.ico">
<link rel="stylesheet" type="text/css" media="screen, projection" href="styly.css">
<link rel="stylesheet" type="text/css" media="print" href="print.css">
<style type="text/css"></style>
<link rel="shortcut icon" type="image/x-icon" href="favicon_nd.ico">
</head>
<body> atd... atd... </body></html>


namiesto písomných alebo číselných entít použitie priamo toho neviditeľného znaku?
To neviem ako to myslíš, já tam tie pomlčky chcem, ale len vtedy, keď sa slovo rozdelí.

Marek Prokop:
"Dávat to mezi všechny slabiky by bylo šíleně pracné"

Ne né, to nemám v úmyslu. Chci to jen na úvodní stránku webu, která má být jaksi ťuťo ňuňo, prostě vypilovaná. Pouze na úvodní stránce bude (neměnný) text ve dvou sloupcích, všude jinde jen v jednom sloupci s delšími řádky, takže ani nebude potřeba slova dělit, snad jen sem tam jedno, bude-li opravdu dlouhé.
_es
Profil
Petr ZZZ:„To neviem ako to myslíš,
Myslel som to tak, že máš tri možnosti, ako tam ten neviditeľný znak dostať:
1) entita &shy;
2) entita &#173;
3) Priamo ten neviditeľný znak. V tých dvoch kódovaniach, čo uviedol Chamurappi jeden bajt, v UTF-8 dva bajty.
Petr ZZZ
Profil
_es:
3) Priamo ten neviditeľný znak.

Ale já chci, aby ten znak byl někdy viditelný – jako pomlčka, a sice tehdy, když na konci řádku roz-
dělí slovo. Podobně jako teď.
Děl
ení slov např. atributem word-wrap bez ohledu na slabiky nechci. Dal jsem na web příklad textu v úzkém sloupci: Ptosima (tu stránku možná už někdo znáte; je to rozdělané a zatím jsem doplnil jen nadpis a to &shy; v některých slovech).

Jinak zkusil jsem si tiskový náhled (jiné stránky, která zatím není na webu) v FF a IE a pomlčky byly vidět jen na konci řádku a jen pokud se slovo opravdu dělilo (mám tam ručně zapsaných několik &shy;). Tak to možná nebude tak hrozné a pokud se prokáže, že to na SEO nemá vliv, tak u některých textů asi &shy; budu používat.
« 1 2 »

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0