ISO 639 — набор стандартов Международной организации по стандартизации, связанный со стандартизацией названий языков и языковых групп.
Название ISO 639 является также наименованием оригинального стандарта, утверждённого в 1967 году (как ISO 639/R)[1] и прекратившего действие в 2002 году[2]. ISO 639 состоит из шести частей.
ПрименениеПравить
Определённые стандартом ISO 639 коды языков применяются для указания языков, на которых написаны тексты. Например, применяются в ссылках на статьи Википедии.
В докумене RFC 3066 описывается использование в Интернете кодов языков по ISO 639.
Части стандартаПравить
Языковые стандарты ISO 639 открыты, то есть, могут дополняться. Сопровождением стандарта занимается Агентство по техническому обеспечению. При необходимости Агентство добавляет коды или меняет статусы кодов.
Классификация кодовПравить
Области применения:
- отдельные языки;
- языковые макросемьи (часть 3);
- коллекции языков (части 1, 2 и 5);
- языковые группы (часть 1 содержит только одну языковую группу — группу
bh
; коды для большинства языковых групп даются в части 2; несколько кодов добавлено в часть 5); - остальные группы;
- языковые группы (часть 1 содержит только одну языковую группу — группу
- диалекты;
- зарезервированные для локального использования (части 2, 3);
- особые ситуации (части 2, 3).
Виды (для отдельных языков):
- живые языки (части 2, 3) (все макросемьи живых языков)[3];
- мёртвые языки (части 2, 3) (437 позиций[4]; четыре в части 2:
chb
,chg
,cop
,sam
; ни одного в части 1); - древние языки (части 1-3) (112 позиций[5]; девятнадцать в части 2, и 5 из них, а именно
ave
,chu
,lat
,pli
иsan
— также имеют соответствующий код в части 1:ae
,cu
,la
,pi
,sa
); - исторические языки (части 2, 3) (63 позиции[6]; шестнадцать из них находятся в части 2; ни один не имеет соответствия в части 1);
- искусственные языки (части 2, 3) (19 позиций[7]; девять в части 2:
epo
,ina
,ile
,ido
,vol
,afh
,jbo
,tlh
,zbl
; пять в части 1:eo
,ia
,ie
,io
,vo
).
Библиографические и терминологические коды:
- библиографические (часть 2);
- терминологические (лексикографические) (часть 2).
Диапазоны кодовПравить
Альфа-2Править
Коды «альфа-2» состоят из двух букв базового латинского алфавита, используются в ISO 639-1. На сегодняшний день на Земле насчитывается около шести или семи тысяч языков[8]. Так как в латинском алфавите 26 букв и из двух букв можно составить 262 = 676 двухбуквенных комбинаций, даже при большом желании невозможно охватить весь широкий спектр языков.
Альфа-3Править
Коды «альфа-3» состоят из трёх букв базового латинского алфавита, используются в ISO 639-2, в ISO 639-3 и в ISO 639-5. В латинском алфавите 26 букв; из трёх букв можно составить 263 = 17 576 трёхбуквенных комбинаций. Из этих комбинаций следующие уже использовались:
- четыре специальных кода из ISO 639-2:
mis
(язык в стандарте (пока) отсутствует),mul
(текст на двух и более языках, но указать можно только один код),und
(язык неизвестен),zxx
(языком не является); - зарезервированный диапазон
qaa-qtz
(всего 20×26 = 520 кодов); - двадцать три дублирующие записи («B/T» — библиографические и терминологические (лексикографические) коды).
В сумме 4+520+23 = 547 кодов, которые не могли использоваться в части 3 для кодификации языков или в части 5 для кодификации языковых семей и групп. Для «альфа-3» осталось 17 576-547 = 17 029 кодов.
ISO 639-2 отличается от ISO 639-1 тем, что в нём не определены коды для сербохорватского и молдавского языков, и определены коды для вариантов языка. Например, для французского языка в ISO 639-1 определён только один код — fr
, а в ISO 639-2 определены четыре кода: fre
и fra
для современного французского, frm
для средневекового французского (англ. french, medieval; 1400—1800 годы) и fro
для старофранцузского (англ. french, old; 842—1400 годы).
На сегодняшний день на Земле насчитывается около шести или семи тысяч языков[8]. Используя 17 029 кодов, можно каждому языку присвоить уникальный код, но это может привести к тому, что некоторым языкам будут даны произвольные коды, комбинация букв которых не будет соответствовать традиционному названию языка.
Альфа-4Править
Коды «Альфа-4» состоят из четырёх букв базового латинского алфавита, используются в ISO 639-6. Используя четырёхбуквенные комбинации из 26 букв, можно закодировать 264 = 456 976 языков и диалектов.
См. такжеПравить
ПримечанияПравить
- ↑ 12ISO/R 639:1967 (недоступная ссылка). ИСО (1 марта 1988). Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639:1988 (недоступная ссылка). ИСО. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639 code tables (недоступная ссылка). Sil.org. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639 code tables (недоступная ссылка). Sil.org. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639 code tables (недоступная ссылка). Sil.org. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639 code tables (недоступная ссылка). Sil.org. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ISO 639 code tables (недоступная ссылка). Sil.org. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
- ↑ 12Statistical Summaries (недоступная ссылка). Ethnologue. Дата обращения: 5 августа 2012.Архивировано 16 августа 2012 года.
СсылкиПравить
- ГОСТ 7.75-97 (недоступная ссылка)
- Список кодов языков (англ.)
- ISO 639-2 Registration authority (англ.)
- ISO 639-3 Code Tables (англ.)