лпй8 (ЛПД ПВНЕОБ ЙОЖПТНБГЙЕК, 8 ВЙФПЧ), KOI8 — ЧПУШНЙВЙФПЧЩК УФБОДБТФ ЛПДЙТПЧБОЙС УЙНЧПМПЧ Ч ЙОЖПТНБФЙЛЕ. тБЪТБВПФБО ДМС ЛПДЙТПЧБОЙС ВХЛЧ ЛЙТЙММЙЮЕУЛЙИ БМЖБЧЙФПЧ.

уХЭЕУФЧХЕФ ФБЛЦЕ УЕНЙВЙФПЧБС ЧЕТУЙС ЛПДЙТПЧЛЙ — лпй7. лпй7 Й лпй8 ПРЙУБОЩ Ч зпуф 19768-74 (УЕКЮБУ ОЕДЕКУФЧЙФЕМЕО).

тБЪТБВПФЮЙЛЙ лпй8 РПНЕУФЙМЙ УЙНЧПМЩ ТХУУЛПЗП БМЖБЧЙФБ Ч ЧЕТИОЕК ЮБУФЙ ТБУЫЙТЕООПК ФБВМЙГЩ ASCII ФБЛЙН ПВТБЪПН, ЮФП РПЪЙГЙЙ ЛЙТЙММЙЮЕУЛЙИ УЙНЧПМПЧ УППФЧЕФУФЧХАФ ЙИ ЖПОЕФЙЮЕУЛЙН БОБМПЗБН Ч БОЗМЙКУЛПН БМЖБЧЙФЕ Ч ОЙЦОЕК ЮБУФЙ ФБВМЙГЩ. ьФП ПЪОБЮБЕФ, ЮФП ЕУМЙ Ч ФЕЛУФЕ, ОБРЙУБООПН Ч лпй8, ХВЙТБФШ ЧПУШНПК ВЙФ ЛБЦДПЗП УЙНЧПМБ, ФП РПМХЮБЕФУС «ЮЙФБВЕМШОЩК» ФЕЛУФ, ИПФС ПО Й ОБРЙУБО МБФЙОУЛЙНЙ УЙНЧПМБНЙ. оБРТЙНЕТ, УМПЧБ «тХУУЛЙК фЕЛУФ» РТЕЧТБФЙМЙУШ ВЩ Ч «rUSSKIJ tEKST». лБЛ РПВПЮОПЕ УМЕДУФЧЙЕ, УЙНЧПМЩ ЛЙТЙММЙГЩ ПЛБЪБМЙУШ ТБУРПМПЦЕОЩ ОЕ Ч БМЖБЧЙФОПН РПТСДЛЕ.

уХЭЕУФЧХЕФ ОЕУЛПМШЛП ЧБТЙБОФПЧ ЛПДЙТПЧЛЙ лпй8 ДМС ТБЪМЙЮОЩИ ЛЙТЙМЙЮЕУЛЙИ БМЖБЧЙФПЧ. тХУУЛЙК БМЖБЧЙФ ПРЙУЩЧБЕФУС Ч ЛПДЙТПЧЛЕ KOI8R, ХЛТБЙОУЛЙК — Ч KOI8U.

KOI8R УФБМ ЖБЛФЙЮЕУЛЙ УФБОДБТФПН ДМС ТХУУЛПК ЛЙТЙММЙГЩ Ч АОЙЛУРПДПВОЩИ ПРЕТБГЙПООЩИ УЙУФЕНБИ Й ЬМЕЛФТПООПК РПЮФЕ.

бОДТЕК юЕТОПЧ РТПДЕМБМ ВПМШЫПК ПВЯЈН ТБВПФЩ, ЮФПВЩ УПЪДБФШ УФБОДБТФ RFC 1489 («Registration of a Cyrillic Character Set»). уХЭЕУФЧХЕФ RFC 2319 ОБ KOI8U.

рП ОБВПТХ УЙНЧПМПЧ KOI8R УППФЧЕФУФЧХЕФ ПДОПНХ ЙЪ ЧБТЙБОФПЧ БМШФЕТОБФЙЧОПК ЛПДЙТПЧЛЙ. уФБОДБТФ RFC 1489 ФБЛЦЕ РТЕДРЙУЩЧБЕФ ОБМЙЮЙЕ ЗТБЖЙЮЕУЛЙИ УЙНЧПМПЧ «ТБНПЛ» (РУЕЧДПЗТБЖЙЛЙ), ПДОБЛП ЬФП ФТЕВПЧБОЙЕ ЧЩРПМОСЕФУС ДПЧПМШОП ТЕДЛП.

уН. фБЛЦЕ

лБФЕЗПТЙЙіРТУФ | сЪЩЛЙ | лПНРШАФЕТ




Перевод статьи

КОИ8 (код обмена информацией, 8 битов), KOI8 € восьмибитовый стандарт кодирования символов в информатике. Разработан для кодирования букв кириллических алфавитов.

Существует также семибитовая версия кодировки € КОИ7. КОИ7 и КОИ8 описаны в ГОСТ 19768-74 (сейчас недействителен).

Разработчики КОИ8 поместили символы русского алфавита в верхней части расширенной таблицы ASCII таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ8, убирать восьмой бит каждого символа, то получается «читабельный» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.

Существует несколько вариантов кодировки КОИ8 для различных кирилических алфавитов. Русский алфавит описывается в кодировке KOI8R, украинский € в KOI8U.

KOI8R стал фактически стандартом для русской кириллицы в юниксподобных операционных системах и электронной почте.

Андрей Чернов проделал большой объём работы, чтобы создать стандарт RFC 1489 («Registration of a Cyrillic Character Set»). Существует RFC 2319 на KOI8U.

По набору символов KOI8R соответствует одному из вариантов альтернативной кодировки. Стандарт RFC 1489 также предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.

См. Также

лБФЕЗПТЙЙіРТУФ | сЪЩЛЙ | лПНРШАФЕТ