Autor Zpráva
Dingo
Profil *
Potřeboval bych někde sehnat seznam zkratek které se používají v hlavičkách pro označení různých jazyků a znakových sad.

Tak například jako u nás máme nastavení jazyka
HTTP_ACCEPT_LANGUAGE:cs-CZ,cs
HTTP_ACCEPT_CHARSET windows-1250,*,utf-8
Tak mě zajímá jaké jsou nastavení pro jiné země.
Kde se na toto mohu informovat?

Taky mě zajímá jestli víte o nějaké stránce na internetu, kde by byly ukázky hlaviček různých prohlížečů, jak vypadají hlavičky od různých verzí prohlížečů, tak jak je dostane server. V mezinárodní formě.
greeny
Profil
Ideální je Firefox -> zapneš webovou konzoli a máš tam každý požadavek vypsán... po kliknutí na něj se ti zobrazí celá odeslaná hlavička ;) pak stačí jen procházet různé stránky a seldovat ;)
Dingo
Profil *
Jo, jenže každý prohlížeč to má jinak a mě hlavně co se týká jazyků a znakových sad, to bych musel každý jazyk instalovat, a to je blbost. Takže našel jsem toto:
http://www.iana.org
http://www.iana.org/protocols
část "Language Tags":
http://www.iana.org/assignments/language-subtag-registry

Dostal jsem se k tomu díky této stránce:
http://www.w3.org/International/tutorials/language-decl/
http://www.w3.org/International/articles/language-tags/

Ohledně znakových sad jsem našel toto:
http://www.iana.org/assignments/character-sets

Ještě bych ale potřeboval najít nějakou stránku, kde zjistím jaký jazyk - země - jakou znakovou sadu používá
Chamurappi
Profil
Reaguji na greenyho:
pak stačí jen procházet různé stránky a seldovat ;)
Sledovat, jak prohlížeč všem posílá stejné hlavičky… protože proč by měl posílat jiné?


Reaguji na Dinga:
Tak mě zajímá jaké jsou nastavení pro jiné země.
Nastav si jiný jazyk v prohlížeči (prolez nastavení) a podle toho se změní Accept-Language. Na zemi, kde se fyzicky nacházíš, nezáleží.
Hlavička Accept-Charset bývá vázaná na lokalizaci prohlížeče a pravděpodobně ji k ničemu zkoumat nepotřebuješ.
Dingo
Profil *
Chamurappi:
Ani tohle řešení není efektivní. Sestavuji program, který právě s lokalizací bude pracovat. Takže je pro mě klíčové získat data, ze kterých mohu vyčíst v které zemi se používá která znaková sada a jazyk. Mám sice data, která mi říkají jaké zkratky a znakové sady se používají, ale potíž je v tom, že těch sad je tam několik. A druhý problém, který z toho plyne je, že:

Znám např. jazyk
Type: language
Subtag: cse
Description: Czech Sign Language
Added: 2009-07-29

a k tomu sadu (z jiného souboru):
Name: ISO_8859-2:1987 [RFC1345,KXS2]
MIBenum: 5
Source: ECMA registry
Alias: iso-ir-101
Alias: ISO_8859-2
Alias: ISO-8859-2 (preferred MIME name)
Alias: latin2
Alias: l2
Alias: csISOLatin2

Jenže nemám žádné propojení mezi těmito dvěma soubory, tedy že u jazyku cse, chci preferovat sadu ISO_8859-2 .... Těch sad a jazyků tam je snad několik desítek tisíc. Nevím kde toto propojení získat. Ve finále sice budu pracovat jen s vybranými (nejčastějšími) jazyky, které se objevují na internetu, ale podle nějakého vodítka to potřebuju profiltrovat.


Bingo!
http://www.w3.org/International/O-charset-lang.html
Jen mi není jasný proč ten seznam není úplný.
http://www.w3schools.com/tags/ref_language_codes.asp
S tím se dá už lépe pracovat
Dingo
Profil *
http://webmaster.helion.pl/kurshtml/jezyki/lista.htm
Chamurappi
Profil
Reaguji na Dinga:
nemám žádné propojení mezi těmito dvěma soubory, tedy že u jazyku cse, chci preferovat sadu ISO_8859-2
Stejně tomu moc nerozumím. Nač chceš zkoumat kódování? Viz ten odkaz na W3C — dnes je dostatečně spolehlivé UTF-8 všude.

S tím se dá už lépe pracovat
Aha, tys nevěděl, že to jsou ISO kódy jazyků? Úplný aktuální přehled najdeš na Wikipedii. Od W3Schools se drž raději dál…

Vaše odpověď


Prosím používejte diakritiku a interpunkci.

Ochrana proti spamu. Napište prosím číslo dvě-sta čtyřicet-sedm:

0