У этого термина существуют и другие значения, см.
КОИ.
КОИ-8 (код обмена информацией, 8 бит), KOI8 — восьмибитовая кодовая страница, совместимая с ASCII. Разработана для кодирования букв кириллических алфавитов. Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74. Они восходят к двоичной кодировке ДКОИ для ЕС ЭВМ, а та, в свою очередь, основана на кодировке телеграфа.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, для каждого символа убрать по одному биту слева, то получится относительно читаемый текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющих определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U, таджикский — в KOI8-T.
В 1990-х годах KOI8-R стал фактически стандартом для кодирования русской кириллицы в UNIX-подобных операционных системах и электронной почте. Автор данной кодировки (RFC 1489) Андрей Чернов в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами. КОИ-8 стала первой русской стандартизированной кодировкой в интернете.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
- RFC 1489 — KOI8-R (буквы русского алфавита);
- RFC 2319 — KOI8-U (буквы украинского алфавита);
- RFC 1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).
IANA зарегистрировала кодировки в своём списке.
Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако, это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
─ 2500
|
│ 2502
|
┌ 250C
|
┐ 2510
|
└ 2514
|
┘ 2518
|
├ 251C
|
┤ 2524
|
┬ 252C
|
┴ 2534
|
┼ 253C
|
▀ 2580
|
▄ 2584
|
█ 2588
|
▌ 258C
|
▐ 2590
|
9.
|
░ 2591
|
▒ 2592
|
▓ 2593
|
⌠ 2320
|
■ 25A0
|
∙ 2219
|
√ 221A
|
≈ 2248
|
≤ 2264
|
≥ 2265
|
A0
|
⌡ 2321
|
° B0
|
² B2
|
· B7
|
÷ F7
|
A.
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
╓ 2553
|
╔ 2554
|
╕ 2555
|
╖ 2556
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
╜ 255C
|
╝ 255D
|
╞ 255E
|
B.
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
╢ 2562
|
╣ 2563
|
╤ 2564
|
╥ 2565
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
╫ 256B
|
╬ 256C
|
© A9
|
C.
|
ю 44E
|
а 430
|
б 431
|
ц 446
|
д 434
|
е 435
|
ф 444
|
г 433
|
х 445
|
и 438
|
й 439
|
к 43A
|
л 43B
|
м 43C
|
н 43D
|
о 43E
|
D.
|
п 43F
|
я 44F
|
р 440
|
с 441
|
т 442
|
у 443
|
ж 436
|
в 432
|
ь 44C
|
ы 44B
|
з 437
|
ш 448
|
э 44D
|
щ 449
|
ч 447
|
ъ 44A
|
E.
|
Ю 42E
|
А 410
|
Б 411
|
Ц 426
|
Д 414
|
Е 415
|
Ф 424
|
Г 413
|
Х 425
|
И 418
|
Й 419
|
К 41A
|
Л 41B
|
М 41C
|
Н 41D
|
О 41E
|
F.
|
П 41F
|
Я 42F
|
Р 420
|
С 421
|
Т 422
|
У 423
|
Ж 416
|
В 412
|
Ь 42C
|
Ы 42B
|
З 417
|
Ш 428
|
Э 42D
|
Щ 429
|
Ч 427
|
Ъ 42A
|
Другие варианты
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
Кодировка KOI8-U (русско-украинская)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A.
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
є 454
|
╔ 2554
|
і 456
|
ї 457
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
ґ 491
|
╝ 255D
|
╞ 255E
|
B.
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
Є 404
|
╣ 2563
|
І 406
|
Ї 407
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
Ґ 490
|
╬ 256C
|
© A9
|
Кодировка KOI8-RU (русско-белорусско-украинская)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A.
|
═ 2550
|
║ 2551
|
╒ 2552
|
ё 451
|
є 454
|
╔ 2554
|
і 456
|
ї 457
|
╗ 2557
|
╘ 2558
|
╙ 2559
|
╚ 255A
|
╛ 255B
|
ґ 491
|
ў 45E
|
╞ 255E
|
B.
|
╟ 255F
|
╠ 2560
|
╡ 2561
|
Ё 401
|
Є 404
|
╣ 2563
|
І 406
|
Ї 407
|
╦ 2566
|
╧ 2567
|
╨ 2568
|
╩ 2569
|
╪ 256A
|
Ґ 490
|
Ў 40E
|
© A9
|
Кодировка KOI8-C (Центральная Азия)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
ғ 493 |
җ 497
|
қ 49B |
ҝ 49D
|
ң 4A3 |
ү 4AF
|
ұ 4B1 |
ҳ 4B3
|
ҷ 4B7 |
ҹ 4B9
|
һ 4BB |
▀ 2580
|
ә 4D9 |
ӣ 4E3
|
ө 4E9 |
ӯ 4EF
|
9.
|
Ғ 492 |
Җ 496
|
Қ 49A |
Ҝ 49C
|
Ң 4A2 |
Ү 4AE
|
Ұ 4B0 |
Ҳ 4B2
|
Ҷ 4B6 |
Ҹ 4B8
|
Һ 4BA |
⌡ 2321
|
Ә 4D8 |
Ӣ 4E2
|
Ө 4E8 |
Ӯ 4EE
|
A.
|
A0 |
ђ 452
|
ѓ 453 |
ё 451
|
є 454 |
ѕ 455
|
і 456 |
ї 457
|
ј 458 |
љ 459
|
њ 45A |
ћ 45B
|
ќ 45C |
ґ 491
|
ў 45E |
џ 45F
|
B.
|
№ 2116 |
Ђ 402
|
Ѓ 403 |
Ё 401
|
Є 404 |
Ѕ 405
|
І 406 |
Ї 407
|
Ј 408 |
Љ 409
|
Њ 40A |
Ћ 40B
|
Ќ 40C |
Ґ 490
|
Ў 40E |
Џ 40F
|
Кодировка KOI8-T (таджикская)
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
қ 49B |
ғ 493
|
‚ 201A |
Ғ 492
|
„ 201E |
… 2026
|
† 2020 |
‡ 2021
|
|
‰ 2030
|
ҳ 4B3 |
‹ 2039
|
Ҳ 4B2 |
ҷ 4B7
|
Ҷ 4B6 |
|
9.
|
Қ 49A |
‘ 2018
|
’ 2019 |
“ 201C
|
” 201D |
• 2022
|
– 2013 |
— 2014
|
|
™ 2122
|
|
› 203A
|
|
|
|
|
A.
|
|
ӯ 4EF
|
Ӯ 4EE |
ё 451
|
¤ A4 |
ӣ 4E3
|
¦ A6 |
§ A7
|
|
|
|
« AB
|
¬ AC |
AD
|
® AE |
|
B.
|
° B0 |
± B1
|
² B2 |
Ё 401
|
|
Ӣ 4E2
|
¶ B6 |
· B7
|
|
№ 2116
|
|
» BB
|
|
|
|
© A9
|
Кодировка KOI8-O, KOI8-S (славянская, старая орфография)
0407
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
Ђ 0402
|
Ѓ 0403
|
¸ 00B8
|
ѓ 0453
|
„ 201E
|
… 2026
|
† 2020
|
§ 00A7
|
€ 20AC
|
¨ 00A8
|
Љ 0409
|
‹ 2039
|
Њ 040A
|
Ќ 040C
|
Ћ 040B
|
Џ 040F
|
9.
|
ђ 0452
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
£ 00A3
|
· 00B7
|
љ 0459
|
› 203A
|
њ 045A
|
ќ 045C
|
ћ 045B
|
џ 045F
|
A.
|
00A0
|
ѵ 0475
|
ѣ 0463
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
® 00AE
|
™ 2122
|
« 00AB
|
ѳ 0473
|
ґ 0491
|
ў 045E
|
´ 00B4
|
B.
|
° 00B0
|
Ѵ 0474
|
Ѣ 0462
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
№ 2116
|
¢ 00A2
|
» 00BB
|
Ѳ 0472
|
Ґ 0490
|
Ў 040E
|
© 00A9
|
Кодировка ISO-IR-111, KOI8-E
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
A.
|
00A0
|
ђ 0452
|
ѓ 0453
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
љ 0459
|
њ 045A
|
ћ 045B
|
ќ 045C
|
00AD
|
ў 045E
|
џ 045F
|
B.
|
№ 2116
|
Ђ 0402
|
Ѓ 0403
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
Љ 0409
|
Њ 040A
|
Ћ 040B
|
Ќ 040C
|
¤ 00A4
|
Ў 040E
|
Џ 040F
|
Кодировка KOI8-Unified, KOI8-F
Кодировка KOI8-Unified (KOI8-F) предложена компанией «Fingertip Software»[1].
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
─ 2500
|
│ 2502
|
┌ 250C
|
┐ 2510
|
└ 2514
|
┘ 2518
|
├ 251C
|
┤ 2524
|
┬ 252C
|
┴ 2534
|
┼ 253C
|
▀ 2580
|
▄ 2584
|
█ 2588
|
▌ 258C
|
▐ 2590
|
9.
|
░ 2591
|
‘ 2018
|
’ 2019
|
“ 201C
|
” 201D
|
• 2022
|
– 2013
|
— 2014
|
© 00A9
|
™ 2122
|
00A0
|
» 00BB
|
® 00AE
|
« 00AB
|
· 00B7
|
¤ 00A4
|
A.
|
00A0
|
ђ 0452
|
ѓ 0453
|
ё 0451
|
є 0454
|
ѕ 0455
|
і 0456
|
ї 0457
|
ј 0458
|
љ 0459
|
њ 045A
|
ћ 045B
|
ќ 045C
|
ґ 0491
|
ў 045E
|
џ 045F
|
B.
|
№ 2116
|
Ђ 0402
|
Ѓ 0403
|
Ё 0401
|
Є 0404
|
Ѕ 0405
|
І 0406
|
Ї 0407
|
Ј 0408
|
Љ 0409
|
Њ 040A
|
Ћ 040B
|
Ќ 040C
|
Ґ 0490
|
Ў 040E
|
Џ 040F
|
Кодировка KOI8-M
Кодировка KOI8-M представляла собой смесь кодировок KOI8-R и Alt (Альтернативная кодировка CP866 согласно ГОСТ 19768-87).
|
.0 |
.1
|
.2 |
.3
|
.4 |
.5
|
.6 |
.7
|
.8 |
.9
|
.A |
.B
|
.C |
.D
|
.E |
.F
|
8.
|
░ 2591
|
▒ 2592
|
▓ 2593
|
│ 2502
|
┤ 2524
|
╡ 2561
|
╢ 2562
|
╖ 2556
|
╕ 2555
|
╣ 2563
|
║ 2551
|
╗ 2557
|
╝ 255D
|
╜ 255C
|
╛ 255B
|
┐ 2510
|
9.
|
└ 2514
|
┴ 2534
|
┬ 252C
|
├ 251C
|
─ 2500
|
┼ 253C
|
╞ 255E
|
╟ 255F
|
╚ 255A
|
╔ 2554
|
╩ 2569
|
╦ 2566
|
╠ 2560
|
═ 2550
|
╬ 256C
|
╧ 2567
|
A.
|
╨ 2568
|
╤ 2564
|
╥ 2565
|
╙ 2559
|
╘ 2558
|
╒ 2552
|
╓ 2553
|
╫ 256B
|
╪ 256A
|
┘ 2518
|
┌ 250C
|
█ 2588
|
▄ 2584
|
▌ 258C
|
▐ 2590
|
▀ 2580
|
B.
|
Ё 0401
|
ё 0451
|
🮣 1FBA3
|
🮢 1FBA2
|
🮠 1FBA0
|
🮡 1FBA1
|
→ 2192
|
← 2190
|
↑ 2191
|
↓ 2193
|
÷ 00F7
|
± 00B1
|
№ 2116
|
¤ 00A4
|
■ 25A0
|
00A0
|
Некириллические варианты КОИ-8
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным.
Примечания
Ссылки
|
---|
|
Исторические | |
---|
Современное 8-битное представление | |
---|
Многобайтовые | |
---|
|