Autor | Zpráva | ||
---|---|---|---|
Libor t. Profil * |
#1 · Zasláno: 3. 3. 2016, 19:50:37
Jeden vtipálek mi do diskuzí vkládá záměrně nějaké prapodivné HTML entity, viz níže:
████████████████████████████████████████████████████████ www.google.com/search?q=██ Může mi někdo prozradit o jako konkrétní entitu jde, abych věděl jak to blokovat? |
||
lionel messi Profil |
Libor t.:
„Může mi někdo prozradit o jako konkrétní entitu jde, abych věděl jak to blokovat?“ &>#9608; |
||
Libor t. Profil * |
#3 · Zasláno: 3. 3. 2016, 20:44:53
...fajn, dík. Nějak neumím nalézt na internetu kompletní seznam všech existujících entit. Zde na webu uvedený přehled:
Použitelné znakové entity je poněkud nekompletní :( Tu zmíněnou PAentitu jsem tam ani nenašel - má nějaký název? |
||
Bubák Profil |
█ v tabulce není pravděpodobně proto, že jako pojmenovaná entita není ve specifikaci HTML 4.01, ale až v HTML 5.
Zmíněný znak lze zapsat různě, pokud webová stránka používá unicode kódování, lze ho zapsat přímo jako znak. Též je možné zapsat ho do HTML kódu jako znakovou entitu nebo číselnou entitu desítkově nebo šestnáctkově. |
||
Chamurappi Profil |
Reaguji na Libora t.:
„Nějak neumím nalézt na internetu kompletní seznam všech existujících entit.“ Entita v HTML je jen alternativní způsob zápisu znaku z Unicodu. Stejně, jako je &>#77; jiný zápis znaku M , je &>#9608; jiný zápis znaku █ . Pokud používáš UTF-8, tak se tento znak ani nemusí zapisovat entitou, můžeš ho mít v kódu natvrdo. Blokovat můžeš buď všechny číselné entity, nebo rozsahy znaků třeba nějakým regulárem.
„Zde na webu uvedený přehled […] je poněkud nekompletní :(“ Je tu i tabulka číselných entit, ale omezená. Pokud by se posunula oblast, kterou zobrazuje, vypadala by takhle. „Jeden vtipálek mi do diskuzí vkládá záměrně nějaké prapodivné HTML entity“ Nebylo by lepší nějak vyřešit spíš přímo toho vtipálka? Reaguji na Bubáka: To jsem ani netušil, že existuje nějaký návrh na rozšíření pojmenovaných entit. Přijde mi to celkem zbytečné. A potenciálně nebezpečné – hrozí, že když někdo nedbale odkazuje na adresu obsahující &block=1 , tak mu tam v nových prohlížečích vznikne čtvereček.
Když už, tak spíš než zbrusu novou sadu názvů pro pár vyvolených znaků mohli zavést nějaké obecné pravidlo, jak převádět název znaku do entity. Názvy jsou tuším unikátní a standardizované. Znak U+2588 je oficiálně nazvaný FULL BLOCK, tak by to mohla být entita třeba &uFullBlock; , znak U+2647 je PLUTO, tak by měl entitu &uPluto; , znak U+004D je LATIN CAPITAL LETTER M, tak by měl entitu &uLatinCapitalLetterM; atd. – sice by to občas bylo trochu upovídané, ale univerzální a celkem dobře zapamatovatelné… a kdo používá entity, tomu na datové velikosti asi stejně nezáleží.
|
||
Bubák Profil |
Chamurappi:
„To jsem ani netušil, že existuje nějaký návrh na rozšíření pojmenovaných entit.“ Já taky ne, ale když jsem natrefil na 24 Character entity references in HTML 4, tak jsem zkusil vygůglovat Character entity references in HTML 5 .
„A potenciálně nebezpečné – hrozí, že když někdo nedbale odkazuje na adresu obsahující &block=1 , tak mu tam v nových prohlížečích vznikne čtvereček.“
Špatně jsem testoval, verzi s entitou █ jsem měl jen ve svém počítači.
|
||
Xanomes Profil |
#7 · Zasláno: 5. 3. 2016, 01:47:16
Libor t.:
Vyhledávač DuckDuckGo je docela chytrý a tak když do něj zadáš: █ html entity, zobrazí ti na prvním místě vyhledávání číselnou entitu. Díky tomu ušetříš čas nám i sobě :) |
||
Časová prodleva: 9 let
|
0