поделиться знаниями или
запомнить страничку
- Все категории
-
экономические
43,610 -
гуманитарные
33,643 -
юридические
17,916 -
школьный раздел
611,376 -
разное
16,895
Популярное на сайте:
Как быстро выучить стихотворение наизусть? Запоминание стихов является стандартным заданием во многих школах.
Как научится читать по диагонали? Скорость чтения зависит от скорости восприятия каждого отдельного слова в тексте.
Как быстро и эффективно исправить почерк? Люди часто предполагают, что каллиграфия и почерк являются синонимами, но это не так.
Как научится говорить грамотно и правильно? Общение на хорошем, уверенном и естественном русском языке является достижимой целью.
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Данная кодировка пользуется довольно большой популярностью в восточно-европейских странах. Windows-1251 выгодно отличается от других 8-битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в традиционной русской типографике для обычного текста (отсутствует только знак ударения). Кириллические символы идут в алфавитном порядке.
Windows-1251 также содержит все символы для близких к русскому языку языков: белорусского, украинского, сербского, македонского и болгарского.
На практике этого оказалось достаточно, чтобы кодировка Windows-1251 закрепилась в интернете вплоть до распространения UTF-8.
Dec | Hex | Символ | Dec | Hex | Символ | |
---|---|---|---|---|---|---|
000 | 00 | NOP | 128 | 80 | Ђ | |
001 | 01 | SOH | 129 | 81 | Ѓ | |
002 | 02 | STX | 130 | 82 | ‚ | |
003 | 03 | ETX | 131 | 83 | ѓ | |
004 | 04 | EOT | 132 | 84 | „ | |
005 | 05 | ENQ | 133 | 85 | … | |
006 | 06 | ACK | 134 | 86 | † | |
007 | 07 | BEL | 135 | 87 | ‡ | |
008 | 08 | BS | 136 | 88 | € | |
009 | 09 | TAB | 137 | 89 | ‰ | |
010 | 0A | LF | 138 | 8A | Љ | |
011 | 0B | VT | 139 | 8B | ‹ | |
012 | 0C | FF | 140 | 8C | Њ | |
013 | 0D | CR | 141 | 8D | Ќ | |
014 | 0E | SO | 142 | 8E | Ћ | |
015 | 0F | SI | 143 | 8F | Џ | |
016 | 10 | DLE | 144 | 90 | ђ | |
017 | 11 | DC1 | 145 | 91 | ‘ | |
018 | 12 | DC2 | 146 | 92 | ’ | |
019 | 13 | DC3 | 147 | 93 | “ | |
020 | 14 | DC4 | 148 | 94 | ” | |
021 | 15 | NAK | 149 | 95 | • | |
022 | 16 | SYN | 150 | 96 | – | |
023 | 17 | ETB | 151 | 97 | — | |
024 | 18 | CAN | 152 | 98 | ||
025 | 19 | EM | 153 | 99 | ™ | |
026 | 1A | SUB | 154 | 9A | љ | |
027 | 1B | ESC | 155 | 9B | › | |
028 | 1C | FS | 156 | 9C | њ | |
029 | 1D | GS | 157 | 9D | ќ | |
030 | 1E | RS | 158 | 9E | ћ | |
031 | 1F | US | 159 | 9F | џ | |
032 | 20 | SP | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | « | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | ‘ | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Ё | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | — | 173 | AD | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | ё | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | BC | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BE | ѕ | |
063 | 3F | ? | 191 | BF | ї | |
064 | 40 | @ | 192 | C0 | А | |
065 | 41 | A | 193 | C1 | Б | |
066 | 42 | B | 194 | C2 | В | |
067 | 43 | C | 195 | C3 | Г | |
068 | 44 | D | 196 | C4 | Д | |
069 | 45 | E | 197 | C5 | Е | |
070 | 46 | F | 198 | C6 | Ж | |
071 | 47 | G | 199 | C7 | З | |
072 | 48 | H | 200 | C8 | И | |
073 | 49 | I | 201 | C9 | Й | |
074 | 4A | J | 202 | CA | К | |
075 | 4B | K | 203 | CB | Л | |
076 | 4C | L | 204 | CC | М | |
077 | 4D | M | 205 | CD | Н | |
078 | 4E | N | 206 | CE | О | |
079 | 4F | O | 207 | CF | П | |
080 | 50 | P | 208 | D0 | Р | |
081 | 51 | Q | 209 | D1 | С | |
082 | 52 | R | 210 | D2 | Т | |
083 | 53 | S | 211 | D3 | У | |
084 | 54 | T | 212 | D4 | Ф | |
085 | 55 | U | 213 | D5 | Х | |
086 | 56 | V | 214 | D6 | Ц | |
087 | 57 | W | 215 | D7 | Ч | |
088 | 58 | X | 216 | D8 | Ш | |
089 | 59 | Y | 217 | D9 | Щ | |
090 | 5A | Z | 218 | DA | Ъ | |
091 | 5B | [ | 219 | DB | Ы | |
092 | 5C | 220 | DC | Ь | ||
093 | 5D | ] | 221 | DD | Э | |
094 | 5E | ^ | 222 | DE | Ю | |
095 | 5F | _ | 223 | DF | Я | |
096 | 60 | ` | 224 | E0 | а | |
097 | 61 | a | 225 | E1 | б | |
098 | 62 | b | 226 | E2 | в | |
099 | 63 | c | 227 | E3 | г | |
100 | 64 | d | 228 | E4 | д | |
101 | 65 | e | 229 | E5 | е | |
102 | 66 | f | 230 | E6 | ж | |
103 | 67 | g | 231 | E7 | з | |
104 | 68 | h | 232 | E8 | и | |
105 | 69 | i | 233 | E9 | й | |
106 | 6A | j | 234 | EA | к | |
107 | 6B | k | 235 | EB | л | |
108 | 6C | l | 236 | EC | м | |
109 | 6D | m | 237 | ED | н | |
110 | 6E | n | 238 | EE | о | |
111 | 6F | o | 239 | EF | п | |
112 | 70 | p | 240 | F0 | р | |
113 | 71 | q | 241 | F1 | с | |
114 | 72 | r | 242 | F2 | т | |
115 | 73 | s | 243 | F3 | у | |
116 | 74 | t | 244 | F4 | ф | |
117 | 75 | u | 245 | F5 | х | |
118 | 76 | v | 246 | F6 | ц | |
119 | 77 | w | 247 | F7 | ч | |
120 | 78 | x | 248 | F8 | ш | |
121 | 79 | y | 249 | F9 | щ | |
122 | 7A | z | 250 | FA | ъ | |
123 | 7B | { | 251 | FB | ы | |
124 | 7C | | | 252 | FC | ь | |
125 | 7D | } | 253 | FD | э | |
126 | 7E | ~ | 254 | FE | ю | |
127 | 7F | DEL | 255 | FF | я |
Описание специальных (управляющих) символов
Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.
Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.
Код | Описание |
---|---|
NUL, 00 | Null, пустой |
SOH, 01 | Start Of Heading, начало заголовка |
STX, 02 | Start of TeXt, начало текста |
ETX, 03 | End of TeXt, конец текста |
EOT, 04 | End of Transmission, конец передачи |
ENQ, 05 | Enquire. Прошу подтверждения |
ACK, 06 | Acknowledgement. Подтверждаю |
BEL, 07 | Bell, звонок |
BS, 08 | Backspace, возврат на один символ назад |
TAB, 09 | Tab, горизонтальная табуляция |
LF, 0A | Line Feed, перевод строки Сейчас в большинстве языков программирования обозначается как n |
VT, 0B | Vertical Tab, вертикальная табуляция |
FF, 0C | Form Feed, прогон страницы, новая страница |
CR, 0D | Carriage Return, возврат каретки Сейчас в большинстве языков программирования обозначается как r |
SO, 0E | Shift Out, изменить цвет красящей ленты в печатающем устройстве |
SI, 0F | Shift In, вернуть цвет красящей ленты в печатающем устройстве обратно |
DLE, 10 | Data Link Escape, переключение канала на передачу данных |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 |
Device Control, символы управления устройствами |
NAK, 15 | Negative Acknowledgment, не подтверждаю |
SYN, 16 | Synchronization. Символ синхронизации |
ETB, 17 | End of Text Block, конец текстового блока |
CAN, 18 | Cancel, отмена переданного ранее |
EM, 19 | End of Medium, конец носителя данных |
SUB, 1A | Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче |
ESC, 1B | Escape Управляющая последовательность |
FS, 1C | File Separator, разделитель файлов |
GS, 1D | Group Separator, разделитель групп |
RS, 1E | Record Separator, разделитель записей |
US, 1F | Unit Separator, разделитель юнитов |
DEL, 7F | Delete, стереть последний символ. |
Смотрите также:
URL коды символов ACSII
URL коды символов UTF-8 диапазон от U+0400 до U+04FF
HTML Кодирование URL
Таблица кодов символов кирилицы UTF-8
Таблицы кодировок ASCII, CP1251 (windows1251), ISO-8859-5
Таблица ASCII
Таблица ASCII (American standard code for information interchange) является мировым стандартом для кодирования букв английского алфавита, популярных спец символов (! $ # % & и т.д.) и некоторых непечатных символов (например, возврат каретки 0x0D и перенос строки 0х0А).
Таблица создавалась те времена, когда возникла необходимость связать символы и числа. А такое соответствие необходимо было для того что бы с помощью чисел можно было передать текстовое сообщение между разными устройствами с цифровой связью.
Таблица CP1251 (windows-1251)
Эта кодировочная таблица может называться или CP1251 или Windows-1251 Это стандарт кодирования кириллических символов в операционных системах windows с русскоязычным интерфейсом.
Первая часть этой таблицы (до байта 0x7F) повторяет таблицу ASCII, а вторая часть (от 0x80 до 0xFF) кодирует кириллические символы в алфавитном порядке.
Таблица IS0-8859-5
Эта кодировка применяется в дисплеях Nextion для кодирования кириллических символов.
Стоит обратить внимание, что в данной таблице кириллические символы расположены в алфавитном порядке и сдвинуты ровно на 16 байт по сравнению с кодировочной таблицей windows-1251.
Кодировка UTF-8
(Unicode Transformation Format)
Очень распространенный формат кодирования символов, позволяющий кодировать символы переменным количеством байт.
Например, если для кодирования номера символа требуется 21 бит, то используется 4 байта для кодировки. Если для кодирования достаточно 11 бит, то используют 2 байта. А если номер символа может быть закодирован 7 битами, то используется один байт.
Все ASCII символы в кодировке UTF8 закодированы без изменений, то есть 1 байтом, как в стандартной таблице ASCII.
А вот остальные символы закодированы количеством байт от 2 до 4.
Кириллические символы закодированы двумя байтами.
Источник
Кодовая таблица в системе Windows
Домашнее задание >>
Кодовая таблица в системе Windows. Символ. Десятичный код. Двоичный код. Символ. Десятичный код. Двоичный код. Пробел ! * + , — . / = ? 32 33 42 43 44 45 46 47 61 63. 00100000 00100001 00101010 00101011 00101100 00101101 00101110 001011110 00111101 00111111. 0 1 2 3 4 5 6 7 8 9. 48 49 50 51 52 53 54 55 56 57. 00110000 00110001 00110010 00110011 00110100 00110101 00110110 00110111 00111000 00111001. А б в г д е ж з и й к л м н о п. 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207. 11000000 11000001 11000010 11000011 11000100 11000101 11000110 11000111 11001000 11001001 11001010 11001011 11001100 11001101 11001110 11001111. Р с т у ф х ц ч ш щ ъ ы ь э ю я. 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223. 11010000 11010001 11010010 11010011 11010100 11010101 11010110 11010111 11011000 11011001 11011010 11011011 11011100 11011101 11011110 11011111.
Слайд 43 из презентации «Кодирование с помощью знаковых систем». Размер архива с презентацией 6223 КБ.
Методы кодирования
«Способы кодирования информации» — В памяти компьютера информация представлена в двоичном коде. Зашифрованная пословица. Зашифрованная информация. Задания. Кодирование и декодирование. Множество кодов очень прочно вошло в нашу жизнь. Способы кодирования информации. Правила дорожного движения. Придумайте собственный способ кодирования букв русского алфавита. Способ кодирования (форма представления) информации зависит от цели. Кодирование информации.
«Виды кодирования информации» — Файлы небольшого размера. Кодировка ASCII. Форматы видеофайлов. Файл с палитрой. Текстовый файл. Кодовые страницы. Векторные рисунки. Кодирование звуковой и видеоинформации. Количество цветов. Кодирование символов. Лучший способ для хранения чертежей. Трекерная музыка. Совместимость. Информационный объем данных. Кодирование цвета при печати. Оцифровка звука. Угловой узел. Форматы файлов. Растровое кодирование.
«Способы кодирования» — Кодирование информации. Пример кода. Система условных знаков. Разгадайте ребус. Передаваемая информация. Разнообразие кодов. Декодируйте информацию. Изменение формы представления информации. Декодирование информации. Книга. Как можно назвать записную книжку с точки зрения хранения информации. Мальчик. Закодированный текст. Ключевые слова. Буква исходного текста. Достоинства и недостатки. Носитель информации.
«Кодирование с помощью знаковых систем» — Кодовая таблица в системе Windows. Знаки в форме сигналов. Азбука Брайля. ЭВМ «Сетунь». Символ. Основные объекты языка. Генетическая информация. Генетический алфавит. Бумага. Перекодирование . Формальный язык. Зрительные знаки. Буквы и цифры. Первые носители информации. Образец письменности майя. Знак — это метка. Кодирование информации с помощью знаковых систем. Знаковые системы. Шифрование. Формальные языки.
«Двоичное кодирование» — Двоичное кодирование текстовой информации. Двоичное кодирование в компьютере. Символ. Цифры. Буква латинского алфавита. Использование двоичной системы. Таблица расширенного кода. Уникальный двоичный код. Компьютеры. Информационный объем текста. Кодирование текстовой информации. Таблица кодировки.
«Методы кодирования информации» — Решение задач ЕГЭ на тему кодирование. Первый телеграф. Кодирование и декодирование. Получено сообщение. Языки. Если вариантов больше. Какой код использовать. Кодирование информации. Почему двоичное кодирование. Закодируйте свое имя. Способы кодирования информации. Двоичное кодирование. Шифрование сообщения. Кодирование. Способы. Неравномерность кода. Условие Фано. Количество информации. Используется таблица.
Всего в разделе «Методы кодирования» 7 презентаций
Источник
Кодовая таблица в системе windows
БлогNot. Таблица кодов кириллицы в Unicode, UTF-8 и Windows-1251
Таблица кодов кириллицы в Unicode, UTF-8 и Windows-1251
Во-первых, напомню, что Юникод — не кодировка, а стандарт кодирования, кодировки — это UTF-8, UTF-16 и т.д., но, в силу инерции, разработчики и пользователи часто говорят о «кодировке Юникод», имея в виду распространённую именно в их деревне форму представления символов 🙂
Во-вторых, на самом деле кодирование там довольно замудрённое, возьмём, скажем русскую заглавную «Ж».
Представляемые в Юникоде символы кодируются целыми числами без знака, их можно называть «кодами символов Unicode».
Так, для буквы «Ж» Unicode = 104610 или 041616 или 10000 0101102. Unicode в двоичном виде разбивается на две части: пять левых бит и шесть правых. Левая часть в старших разрядах дополняется до байта признаком 110 двухбайтного кода UTF-8, получаем 11010000. К правой части в старших разрядах приписываются два бита 10 признака продолжения многобайтного кода, получаем 10010110. Окончательно код буквы «Ж» в UTF-8 будет иметь вид 11010000 100101102 или D0 9616.
Именно последний код мы увидим в любом 16-ричном вьюере файла, например, создав в текстовом редакторе файл со словом «Жора» и сохранив его в UTF-8 (только не из Блокнотика Windows, который добавит в начало файла 3-байтовую метку BOM):
То есть, каждая буква кодируется как бы дважды, сначала в 11-битный Unicode, затем в 16-битный UTF-8.
Ниже приведена таблица кодов кириллицы в Unicode, UTF-8 и однобайтовой кодировке Windows-1251.
Символ | Unicode | UTF-8 | Windows-1251 | ||
---|---|---|---|---|---|
16-ричн. | 10-тичн. | 16-ричн. | 10-тичн. | ||
А | 0410 | 1040 | D090 | 208 144 | 192 |
Б | 0411 | 1041 | D091 | 208 145 | 193 |
В | 0412 | 1042 | D092 | 208 146 | 194 |
Г | 0413 | 1043 | D093 | 208 147 | 195 |
Д | 0414 | 1044 | D094 | 208 148 | 196 |
Е | 0415 | 1045 | D095 | 208 149 | 197 |
Ж | 0416 | 1046 | D096 | 208 150 | 198 |
З | 0417 | 1047 | D097 | 208 151 | 199 |
И | 0418 | 1048 | D098 | 208 152 | 200 |
Й | 0419 | 1049 | D099 | 208 153 | 201 |
К | 041A | 1050 | D09A | 208 154 | 202 |
Л | 041B | 1051 | D09B | 208 155 | 203 |
М | 041C | 1052 | D09C | 208 156 | 204 |
Н | 041D | 1053 | D09D | 208 157 | 205 |
О | 041E | 1054 | D09E | 208 158 | 206 |
П | 041F | 1055 | D09F | 208 159 | 207 |
Р | 0420 | 1056 | D0A0 | 208 160 | 208 |
С | 0421 | 1057 | D0A1 | 208 161 | 209 |
Т | 0422 | 1058 | D0A2 | 208 162 | 210 |
У | 0423 | 1059 | D0A3 | 208 163 | 211 |
Ф | 0424 | 1060 | D0A4 | 208 164 | 212 |
Х | 0425 | 1061 | D0A5 | 208 165 | 213 |
Ц | 0426 | 1062 | D0A6 | 208 166 | 214 |
Ч | 0427 | 1063 | D0A7 | 208 167 | 215 |
Ш | 0428 | 1064 | D0A8 | 208 168 | 216 |
Щ | 0429 | 1065 | D0A9 | 208 169 | 217 |
Ъ | 042A | 1066 | D0AA | 208 170 | 218 |
Ы | 042B | 1067 | D0AB | 208 171 | 219 |
Ь | 042C | 1068 | D0AC | 208 172 | 220 |
Э | 042D | 1069 | D0AD | 208 173 | 221 |
Ю | 042E | 1070 | D0AE | 208 174 | 222 |
Я | 042F | 1071 | D0AF | 208 175 | 223 |
а | 0430 | 1072 | D0B0 | 208 176 | 224 |
б | 0431 | 1073 | D0B1 | 208 177 | 225 |
в | 0432 | 1074 | D0B2 | 208 178 | 226 |
г | 0433 | 1075 | D0B3 | 208 179 | 227 |
д | 0434 | 1076 | D0B4 | 208 180 | 228 |
е | 0435 | 1077 | D0B5 | 208 181 | 229 |
ж | 0436 | 1078 | D0B6 | 208 182 | 230 |
з | 0437 | 1079 | D0B7 | 208 183 | 231 |
и | 0438 | 1080 | D0B8 | 208 184 | 232 |
й | 0439 | 1081 | D0B9 | 208 185 | 233 |
к | 043A | 1082 | D0BA | 208 186 | 234 |
л | 043B | 1083 | D0BB | 208 187 | 235 |
м | 043C | 1084 | D0BC | 208 188 | 236 |
н | 043D | 1085 | D0BD | 208 189 | 237 |
о | 043E | 1086 | D0BE | 208 190 | 238 |
п | 043F | 1087 | D0BF | 208 191 | 239 |
р | 0440 | 1088 | D180 | 209 128 | 240 |
с | 0441 | 1089 | D181 | 209 129 | 241 |
т | 0442 | 1090 | D182 | 209 130 | 242 |
у | 0443 | 1091 | D183 | 209 131 | 243 |
ф | 0444 | 1092 | D184 | 209 132 | 244 |
х | 0445 | 1093 | D185 | 209 133 | 245 |
ц | 0446 | 1094 | D186 | 209 134 | 246 |
ч | 0447 | 1095 | D187 | 209 135 | 247 |
ш | 0448 | 1096 | D188 | 209 136 | 248 |
щ | 0449 | 1097 | D189 | 209 137 | 249 |
ъ | 044A | 1098 | D18A | 209 138 | 250 |
ы | 044B | 1099 | D18B | 209 139 | 251 |
ь | 044C | 1100 | D18C | 209 140 | 252 |
э | 044D | 1101 | D18D | 209 141 | 253 |
ю | 044E | 1102 | D18E | 209 142 | 254 |
я | 044F | 1103 | D18F | 209 143 | 255 |
Символы вне общего правила | |||||
Ё | 0401 | 1025 | D001 | 208 101 | 168 |
ё | 0451 | 1105 | D191 | 209 145 | 184 |
23.09.2018, 12:37; рейтинг: 30395
Источник
Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).
Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.
В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.
Содержание
- Блокнот Windows
- Notepad++
- Akelpad
Блокнот Windows
Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню «Файл – Сохранить как».
В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку «Сохранить».
К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.
Notepad++
Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.
Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню «Кодировки – Кириллица» и выбрать нужный вариант.
После открытия текста можно изменить его кодировку. Для этого нужно открыть меню «Кодировки» и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.
После преобразования файл нужно сохранить с помощью меню «Файл – Сохранить» или комбинации клавиш Ctrl-S.
Akelpad
Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.
Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню «Файл – Открыть».
В открывшемся окне нужно выделить текстовый файл, снять отметку «Автовыбор» и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.
Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню «Файл – Сохранить как» и сохранить документ с указанием новой схемы кодирования.
В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.
Fraise — как изменить кодировку сохраняемого файла (utf-8, windows-1251)
type
TConvertChars = array [#128..#255] of char;
const
Win_KoiChars: TConvertChars = (
#128,#129,#130,#131,#132,#133,#134,#135,#136,#137,#060,#139,#140,#141,#142,#143,
#144,#145,#146,#147,#148,#169,#150,#151,#152,#153,#154,#062,#176,#157,#183,#159,
#160,#246,#247,#074,#164,#231,#166,#167,#179,#169,#180,#060,#172,#173,#174,#183,
#156,#177,#073,#105,#199,#181,#182,#158,#163,#191,#164,#062,#106,#189,#190,#167,
#225,#226,#247,#231,#228,#229,#246,#250,#233,#234,#235,#236,#237,#238,#239,#240,
#242,#243,#244,#245,#230,#232,#227,#254,#251,#253,#154,#249,#248,#252,#224,#241,
#193,#194,#215,#199,#196,#197,#214,#218,#201,#202,#203,#204,#205,#206,#207,#208,
#210,#211,#212,#213,#198,#200,#195,#222,#219,#221,#223,#217,#216,#220,#192,#209);
Koi_WinChars: TConvertChars = (
#128,#129,#130,#131,#132,#133,#134,#135,#136,#137,#138,#139,#140,#141,#142,#143,
#144,#145,#146,#147,#148,#149,#150,#151,#152,#153,#218,#155,#176,#157,#183,#159,
#160,#161,#162,#184,#186,#165,#166,#191,#168,#169,#170,#171,#172,#173,#174,#175,
#156,#177,#178,#168,#170,#181,#182,#175,#184,#185,#186,#187,#188,#189,#190,#185,
#254,#224,#225,#246,#228,#229,#244,#227,#245,#232,#233,#234,#235,#236,#237,#238,
#239,#255,#240,#241,#242,#243,#230,#226,#252,#251,#231,#248,#253,#249,#247,#250,
#222,#192,#193,#214,#196,#197,#212,#195,#213,#200,#201,#202,#203,#204,#205,#206,
#207,#223,#208,#209,#210,#211,#198,#194,#220,#219,#199,#216,#221,#217,#215,#218);
function Win_KoiConvert(const St: string): string;
var
i: integer;
begin
Result:=St;
for i:=1 to Length(St) do
if St[i]>#127 then
Result[i]:=Win_KoiChars[St[i]];
end;
MIME / IANA | windows-1251 |
---|---|
Псевдоним (а) | cp1251 (Кодовая страница 1251) |
Язык (и) | Английский, Русский, Украинский, Белорусский, болгарский, сербский кириллица, македонский |
Создано | Microsoft |
Стандарт | Стандарт кодирования WHATWG |
Классификация | расширенный ASCII, Windows-125x |
Другая связанная кодировка (и) | Amiga-1251, KZ-1048,. RFC 1345’s «ECMA-Cyrillic» |
|
Windows-1251 — это 8-битная кодировка символов, предназначенная для языков, использующих кириллический шрифт, например русский, Болгарский, сербская кириллица и другие языки. Это наиболее широко используемая кодировка для языков болгарский, сербский и македонский. По состоянию на сентябрь 2020 года 1,0% всех (и 0,6% топ-1000) веб-сайтов используют Windows-1251. Однако его используют 10,6% российских (.ru) веб-сайтов, что делает его вторым по популярности после UTF-8. В Linux кодировка известна как cp1251. IBM использует кодовую страницу 1251 (CCSID 1251 и знак евро расширенный CCSID 5347) для Windows-1251.
Windows-1251 и KOI8-R (или его украинский вариант KOI8-U ) используются гораздо чаще, чем ISO 8859- 5 (что «используется менее чем 0,1% веб-сайтов»). В отличие от Windows-1252 и ISO 8859-1, Windows-1251 не имеет тесного отношения к ISO 8859-5.
Юникод предпочтительнее Windows-1251 или других кириллических кодировок в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного покрытия Unicode и того, как однобайтовые кодировки символов, такие как Windows-1251 и KOI8-R, не могут этого обеспечить, см. Кириллица в Unicode.)
Содержание
- 1 Набор символов
- 2 Казахский вариант
- 3 Вариант Amiga
- 4 Сноски
- 5 Ссылки
- 6 Дополнительная литература
- 7 Внешние ссылки
Набор символов
В следующей таблице показан Windows-1251. Каждый символ отображается с его эквивалентом Unicode и его десятичным кодом.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | NUL. 0000 | SOH. 0001 | STX. 0002 | ETX. 0003 | EOT. 0004 | ENQ. 0005 | ACK. 0006 | BEL. 0007 | BS. 0008 | HT. 0009 | LF. 000A | VT. 000B | FF. 000C | CR. 000D | SO. 000E | SI. 000F |
1_. 16 | DLE. 0010 | DC1. 0011 | DC2. 0012 | DC3. 0013 | DC4. 0014 | NAK. 0015 | SYN. 0016 | ETB. 0017 | CAN. 0018 | EM. 0019 | SUB. 001A | ESC. 001B | FS. 001C | GS. 001D | RS. 001E | US. 001F |
2_. 32 | SP. 0020 | !. 0021 | «. 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | ‘. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 004 3 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | . 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | DEL. 007F |
8_. 128 | Ђ. 0402 | Ѓ. 0403 | ‚. 201A | ѓ. 0453 | „. 201E | …. 2026 | †. 2020 | ‡. 2021 | €. 20AC | ‰. 2030 | Љ. 0409 | ‹. 2039 | Њ. 040A | Ќ. 040C | Ћ. 040B | Џ. 040F |
9_. 144 | ђ. 0452 | ‘. 2018 | ’. 2019 | “. 201C | ”. 201D | •. 2022 | –. 2013 | —. 2014 | ™. 2122 | љ. 0459 | ›. 203A | њ. 045A | ќ. 045C | ћ. 045B | џ. 045F | |
A_. 160 | NBSP. 00A0 | Ў. 040E | ў. 045E | Ј. 0408 | ¤. 00A4 | Ґ. 0490 | ¦. 00A6 | §. 00A7 | Ё. 0401 | ©. 00A9 | Є. 0404 | «. 00AB | ¬. 00AC | SHY. 00AD | ®. 00AE | Ї. 0407 |
B_. 176 | °. 00B0 | ±. 00B1 | І. 0406 | і. 0456 | ґ. 0491 | µ. 00B5 | ¶. 00B6 | ·. 00B7 | ё. 0451 | №. 2116 | є. 0454 | ». 00BB | ј. 0458 | Ѕ. 0405 | ѕ. 0455 | ї. 0457 |
C_. 192 | А. 0410 | Б. 0411 | В. 0412 | Г. 0413 | Д. 0414 | Е. 0415 | Ж. 0416 | З. 0417 | И. 0418 | Й. 0419 | К. 041A | Л. 041B | М. 041C | Н. 041D | О. 041E | П. 041F |
D_. 208 | Р. 0420 | С. 0421 | Т. 0422 | У. 0423 | Ф. 0424 | Х. 0425 | Ц. 0426 | Ч. 0427 | Ш. 0428 | Щ. 0429 | Ъ. 042A | Ы. 042B | Ь. 042C | Э. 042D | Ю. 042E | Я. 042F |
E_. 224 | а. 0430 | б. 0431 | в. 0432 | г. 0433 | д. 0434 | е. 0435 | ж. 0436 | з. 0437 | и. 0438 | й. 0439 | к. 043A | л. 043B | м. 043C | н. 043D | о. 043E | п. 043F |
F_. 240 | р. 0440 | с. 0441 | т. 0442 | у. 0443 | ф. 0444 | х. 0445 | ц. 0446 | ч. 0447 | ш. 0448 | щ. 0449 | ъ. 044A | ы. 044B | ь. 044C | э. 044D | ю. 044E | я. 044F |
Буква Число Пунктуация Символ Другое Не определено
Казахский вариант
Измененная версия Windows-1251 была стандартизирована в Казахстане a s Казахстанский стандарт STRK1048 и известен под маркировкой KZ-1048
. Он отличается в строках, показанных ниже:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_. 128 | Ђ. 0402 | Ѓ. 0403 | ‚. 201A | ѓ. 0453 | „. 201E | …. 2026 | †. 2020 | ‡. 2021 | €. 20AC | ‰. 2030 | Љ. 0409 | ‹. 2039 | Њ. 040A | Қ. 049A | Һ. 04BA | Џ. 040F |
9_. 144 | ђ. 0452 | ‘. 2018 | ’. 2019 | “. 201C | ”. 201D | •. 2022 | –. 2013 | —. 2014 | ™. 2122 | љ. 0459 | ›. 203A | њ. 045A | қ. 049B | һ. 04BB | џ. 045F | |
A_. 160 | NBSP. 00A0 | Ұ. 04B0 | ұ. 04B1 | Ә. 04D8 | ¤. 00A4 | Ө. 04E8 | ¦. 00A6 | §. 00A7 | Ё. 0401 | ©. 00A9 | Ғ. 0492 | «. 00AB | ¬. 00AC | SHY. 00AD | ®. 00AE | Ү. 04AE |
B_. 176 | °. 00B0 | ±. 00B1 | І. 0406 | і. 0456 | ө. 04E9 | µ. 00B5 | ¶. 00B6 | ·. 00B7 | ё. 0451 | №. 2116 | ғ. 0493 | ». 00BB | ә. 04D9 | Ң. 04A2 | ң. 04A3 | ү. 04AF |
Вариант Amiga
MIME / IANA | Amiga-1251 |
---|---|
Псевдоним (а) | Ami1251 |
Язык (и) | Английский, Русский |
Классификация | расширенный ASCII |
На основе | Windows-1251, ISO-8859-1, ISO-8859-15 |
|
Русские системы Amiga OS использовали версию кодовой страницы 1251, которая соответствует Windows-1251 для русского подмножества кириллических букв, но в остальном в основном соответствует ISO-8859- 1. Эта версия известна как Amiga-1251, под этим именем она зарегистрирована в IANA.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_. 0 | NUL. 0000 | SOH. 0001 | STX. 0002 | ETX. 0003 | EOT. 0004 | ENQ. 0005 | ACK. 0006 | BEL. 0007 | BS. 0008 | HT. 0009 | LF. 000A | VT. 000B | FF. 000C | CR. 000D | SO. 000E | SI. 000F |
1_. 16 | DLE. 0010 | DC1. 0011 | DC2. 0012 | DC3. 0013 | DC4. 0014 | NAK. 0015 | SYN. 0016 | ETB. 0017 | CAN. 0018 | EM. 0019 | SUB. 001A | ESC. 001B | FS. 001C | GS. 001D | RS. 001E | US. 001F |
2_. 32 | SP. 0020 | !. 0021 | «. 0022 | #. 0023 | $. 0024 | %. 0025 | . 0026 | ‘. 0027 | (. 0028 | ). 0029 | *. 002A | +. 002B | ,. 002C | -. 002D | .. 002E | /. 002F |
3_. 48 | 0. 0030 | 1. 0031 | 2. 0032 | 3. 0033 | 4. 0034 | 5. 0035 | 6. 0036 | 7. 0037 | 8. 0038 | 9. 0039 | :. 003A | ;. 003B | <. 003C | =. 003D | >. 003E | ?. 003F |
4_. 64 | @. 0040 | A. 0041 | B. 0042 | C. 0043 | D. 0044 | E. 0045 | F. 0046 | G. 0047 | H. 0048 | I. 0049 | J. 004A | K. 004B | L. 004C | M. 004D | N. 004E | O. 004F |
5_. 80 | P. 0050 | Q. 0051 | R. 0052 | S. 0053 | T. 0054 | U. 0055 | V. 0056 | W. 0057 | X. 0058 | Y. 0059 | Z. 005A | [. 005B | . 005C | ]. 005D | ^. 005E | _. 005F |
6_. 96 | `. 0060 | a. 0061 | b. 0062 | c. 0063 | d. 0064 | e. 0065 | f. 0066 | g. 0067 | h. 0068 | i. 0069 | j. 006A | k. 006B | l. 006C | m. 006D | n. 006E | o. 006F |
7_. 112 | p. 0070 | q. 0071 | r. 0072 | s. 0073 | t. 0074 | u. 0075 | v. 0076 | w. 0077 | x. 0078 | y. 0079 | z. 007A | {. 007B | |. 007C | }. 007D | ~. 007E | DEL. 007F |
8_. 128 | XXX. 0080 | XXX. 0081 | BPH. 0082 | NBH. 0083 | IND. 0084 | NEL. 0085 | SSA. 0086 | ESA. 0087 | HTS. 0088 | HTJ. 0089 | VTS. 008A | PLD. 008B | PLU. 008C | RI. 008D | SS2. 008E | SS3. 008F |
9_. 144 | DCS. 0090 | PU1. 0091 | PU2. 0 092 | STS. 0093 | CCH. 0094 | MW. 0095 | SPA. 0096 | EPA. 0097 | SOS. 0098 | XXX. 0099 | SCI. 009A | CSI. 009B | ST. 009C | OSC. 009D | PM. 009E | APC. 009F |
A_. 160 | NBSP. 00A0 | ¡. 00A1 | ¢. 00A2 | £. 00A3 | €. 20AC | ¥. 00A5 | ¦. 00A6 | §. 00A7 | Ё. 0401 | ©. 00A9 | №. 2116 | «. 00AB | ¬. 00AC | SHY. 00AD | ®. 00AE | ¯. 00AF |
B_. 176 | °. 00B0 | ±. 00B1 | ². 00B2 | ³. 00B3 | ´. 00B4 | µ. 00B5 | ¶. 00B6 | ·. 00B7 | ё. 0451 | ¹. 00B9 | º. 00BA | ». 00BB | ¼. 00BC | ½. 00BD | ¾. 00BE | ¿. 00BF |
C_. 192 | А. 0410 | Б. 0411 | В. 0412 | Г. 0413 | Д. 0414 | Е. 0415 | Ж. 0416 | З. 0417 | И. 0418 | Й. 0419 | К. 041A | Л. 041B | М. 041C | Н. 041D | О. 041E | П. 041F |
D_. 208 | Р. 0420 | С. 0421 | Т. 0422 | У. 0423 | Ф. 0424 | Х. 0425 | Ц. 0426 | Ч. 0427 | Ш. 0428 | Щ. 0429 | Ъ. 042A | Ы. 042B | Ь. 042C | Э. 042D | Ю. 042E | Я. 042F |
E_. 224 | а. 0430 | б. 0431 | в. 0432 | г. 0433 | д. 0434 | е. 0435 | ж. 0436 | з. 0437 | и. 0438 | й. 0439 | к. 043A | л. 043B | м. 043C | н. 043D | о. 043E | п. 043F |
F_. 240 | р. 0440 | с. 0441 | т. 0442 | у. 0443 | ф. 0444 | х. 0445 | ц. 0446 | ч. 0447 | ш. 0448 | щ. 0449 | ъ. 044A | ы. 044B | ь. 044C | э. 044D | ю. 044E | я. 044F |
Отличается от Windows-1251 для соответствия ISO-8859-1 Отличается как от Windows-1251, так и от ISO-8859-1
Сноски
Ссылки
Дополнительная литература
- Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Франк; Дэвис, Бур; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Simonsen, Keld J.; Thobe, Glenn E.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по КИРИЛИЧЕСКОМУ КОДИРОВАНИЮ, версия 1.3». Проверено 24 июня 2020 г.
Внешние ссылки
- Справочная таблица Windows 1251
- Регистрация имени кодировки IANA
- Отображение Unicode для Windows 1251 с «наилучшим соответствием»
- универсальный декодер кириллицы, онлайн-программа, которая может помочь восстановить нечитаемые кириллические тексты со сломанной Windows-1251 или другими кодировками символов.
Таблица кодов кириллицы в Unicode, UTF-8 и Windows-1251
Во-первых, напомню, что Юникод — не кодировка, а стандарт кодирования,
кодировки — это UTF-8, UTF-16 и т.д., но, в силу инерции, разработчики и пользователи часто
говорят о «кодировке Юникод», имея в виду распространённую именно в их деревне форму представления символов
Во-вторых, на самом деле кодирование там довольно замудрённое, возьмём, скажем русскую заглавную «Ж».
Представляемые в Юникоде символы кодируются целыми числами без знака, их можно называть «кодами символов Unicode».
Так, для буквы «Ж» Unicode = 104610 или 041616 или 10000 0101102. Unicode в двоичном виде разбивается на две части: пять левых бит и шесть правых. Левая часть в старших разрядах дополняется до байта признаком 110 двухбайтного кода UTF-8, получаем 11010000. К правой части в старших разрядах приписываются два бита 10 признака продолжения многобайтного кода, получаем 10010110. Окончательно код буквы «Ж» в UTF-8 будет иметь вид
11010000 100101102 или D0 9616.
Именно последний код мы увидим в любом 16-ричном вьюере файла, например, создав в текстовом редакторе файл со словом «Жора» и сохранив его в UTF-8 (только не из Блокнотика Windows, который добавит в начало файла 3-байтовую метку BOM):
просмотр файла в 16-ричном виде из Far Manager
То есть, каждая буква кодируется как бы дважды, сначала в 11-битный Unicode, затем в 16-битный UTF-8.
Ниже приведена таблица кодов кириллицы в Unicode, UTF-8 и однобайтовой кодировке Windows-1251.
Символ | Unicode | UTF-8 | Windows-1251 | ||
---|---|---|---|---|---|
16-ричн. | 10-тичн. | 16-ричн. | 10-тичн. | ||
А | 0410 | 1040 | D090 | 208 144 | 192 |
Б | 0411 | 1041 | D091 | 208 145 | 193 |
В | 0412 | 1042 | D092 | 208 146 | 194 |
Г | 0413 | 1043 | D093 | 208 147 | 195 |
Д | 0414 | 1044 | D094 | 208 148 | 196 |
Е | 0415 | 1045 | D095 | 208 149 | 197 |
Ж | 0416 | 1046 | D096 | 208 150 | 198 |
З | 0417 | 1047 | D097 | 208 151 | 199 |
И | 0418 | 1048 | D098 | 208 152 | 200 |
Й | 0419 | 1049 | D099 | 208 153 | 201 |
К | 041A | 1050 | D09A | 208 154 | 202 |
Л | 041B | 1051 | D09B | 208 155 | 203 |
М | 041C | 1052 | D09C | 208 156 | 204 |
Н | 041D | 1053 | D09D | 208 157 | 205 |
О | 041E | 1054 | D09E | 208 158 | 206 |
П | 041F | 1055 | D09F | 208 159 | 207 |
Р | 0420 | 1056 | D0A0 | 208 160 | 208 |
С | 0421 | 1057 | D0A1 | 208 161 | 209 |
Т | 0422 | 1058 | D0A2 | 208 162 | 210 |
У | 0423 | 1059 | D0A3 | 208 163 | 211 |
Ф | 0424 | 1060 | D0A4 | 208 164 | 212 |
Х | 0425 | 1061 | D0A5 | 208 165 | 213 |
Ц | 0426 | 1062 | D0A6 | 208 166 | 214 |
Ч | 0427 | 1063 | D0A7 | 208 167 | 215 |
Ш | 0428 | 1064 | D0A8 | 208 168 | 216 |
Щ | 0429 | 1065 | D0A9 | 208 169 | 217 |
Ъ | 042A | 1066 | D0AA | 208 170 | 218 |
Ы | 042B | 1067 | D0AB | 208 171 | 219 |
Ь | 042C | 1068 | D0AC | 208 172 | 220 |
Э | 042D | 1069 | D0AD | 208 173 | 221 |
Ю | 042E | 1070 | D0AE | 208 174 | 222 |
Я | 042F | 1071 | D0AF | 208 175 | 223 |
а | 0430 | 1072 | D0B0 | 208 176 | 224 |
б | 0431 | 1073 | D0B1 | 208 177 | 225 |
в | 0432 | 1074 | D0B2 | 208 178 | 226 |
г | 0433 | 1075 | D0B3 | 208 179 | 227 |
д | 0434 | 1076 | D0B4 | 208 180 | 228 |
е | 0435 | 1077 | D0B5 | 208 181 | 229 |
ж | 0436 | 1078 | D0B6 | 208 182 | 230 |
з | 0437 | 1079 | D0B7 | 208 183 | 231 |
и | 0438 | 1080 | D0B8 | 208 184 | 232 |
й | 0439 | 1081 | D0B9 | 208 185 | 233 |
к | 043A | 1082 | D0BA | 208 186 | 234 |
л | 043B | 1083 | D0BB | 208 187 | 235 |
м | 043C | 1084 | D0BC | 208 188 | 236 |
н | 043D | 1085 | D0BD | 208 189 | 237 |
о | 043E | 1086 | D0BE | 208 190 | 238 |
п | 043F | 1087 | D0BF | 208 191 | 239 |
р | 0440 | 1088 | D180 | 209 128 | 240 |
с | 0441 | 1089 | D181 | 209 129 | 241 |
т | 0442 | 1090 | D182 | 209 130 | 242 |
у | 0443 | 1091 | D183 | 209 131 | 243 |
ф | 0444 | 1092 | D184 | 209 132 | 244 |
х | 0445 | 1093 | D185 | 209 133 | 245 |
ц | 0446 | 1094 | D186 | 209 134 | 246 |
ч | 0447 | 1095 | D187 | 209 135 | 247 |
ш | 0448 | 1096 | D188 | 209 136 | 248 |
щ | 0449 | 1097 | D189 | 209 137 | 249 |
ъ | 044A | 1098 | D18A | 209 138 | 250 |
ы | 044B | 1099 | D18B | 209 139 | 251 |
ь | 044C | 1100 | D18C | 209 140 | 252 |
э | 044D | 1101 | D18D | 209 141 | 253 |
ю | 044E | 1102 | D18E | 209 142 | 254 |
я | 044F | 1103 | D18F | 209 143 | 255 |
Символы вне общего правила | |||||
Ё | 0401 | 1025 | D081 | 208 129 | 168 |
ё | 0451 | 1105 | D191 | 209 145 | 184 |
23.09.2018, 12:37 [76712 просмотров]
Список из 256 символов и их коды в ASCII.
1
Управляющие символы
DEC | OCT | HEX | BIN | Символ | Escape послед. | HTML код | Описание |
---|---|---|---|---|---|---|---|
0 | 000 | 0x00 | 00000000 | NUL | � | Нулевой байт | |
1 | 001 | 0x01 | 00000001 | SOH |  | Начало заголовка | |
2 | 002 | 0x02 | 00000010 | STX |  | Начало текста | |
3 | 003 | 0x03 | 00000011 | ETX |  | Конец «текста» | |
4 | 004 | 0x04 | 00000100 | EOT |  | конец передачи | |
5 | 005 | 0x05 | 00000101 | ENQ |  | «Прошу подтверждения!» | |
6 | 006 | 0x06 | 00000110 | ACK |  | «Подтверждаю!» | |
7 | 007 | 0x07 | 00000111 | BEL | a |  | Звуковой сигнал – звонок |
8 | 010 | 0x08 | 00001000 | BS | b |  | Возврат на один символ (BACKSPACE) |
9 | 011 | 0x09 | 00001001 | TAB | t | Табуляция | |
10 | 012 | 0x0A | 00001010 | LF | n | Перевод строки | |
11 | 013 | 0x0B | 00001011 | VT | v |  | Вертикальная табуляция |
12 | 014 | 0x0C | 00001100 | FF | f |  | Прогон страницы, новая страница |
13 | 015 | 0x0D | 00001101 | CR | r | Возврат каретки | |
14 | 016 | 0x0E | 00001110 | SO |  | Переключиться на другую ленту (кодировку) | |
15 | 017 | 0x0F | 00001111 | SI |  | Переключиться на исходную ленту (кодировку) | |
16 | 020 | 0x10 | 00010000 | DLE |  | Экранирование канала данных | |
17 | 021 | 0x11 | 00010001 | DC1 |  | 1-й символ управления устройством | |
18 | 022 | 0x12 | 00010010 | DC2 |  | 2-й символ управления устройством | |
19 | 023 | 0x13 | 00010011 | DC3 |  | 3-й символ управления устройством | |
20 | 024 | 0x14 | 00010100 | DC4 |  | 4-й символ управления устройством | |
21 | 025 | 0x15 | 00010101 | NAK |  | «Не подтверждаю!» | |
22 | 026 | 0x16 | 00010110 | SYN |  | Символ для синхронизации | |
23 | 027 | 0x17 | 00010111 | ETB |  | Конец текстового блока | |
24 | 030 | 0x18 | 00011000 | CAN |  | Отмена | |
25 | 031 | 0x19 | 00011001 | EM |  | Конец носителя | |
26 | 032 | 0x1A | 00011010 | SUB |  | Подставить | |
27 | 033 | 0x1B | 00011011 | ESC | e |  | Escape (Расширение) |
28 | 034 | 0x1C | 00011100 | FS |  | Разделитель файлов | |
29 | 035 | 0x1D | 00011101 | GS |  | Разделитель групп | |
30 | 036 | 0x1E | 00011110 | RS |  | Разделитель записей | |
31 | 037 | 0x1F | 00011111 | US |  | Разделитель юнитов | |
127 | 177 | 0x7F | 01111111 | Delete | | Символ для удаления (на перфолентах) |
2
Печатные символы
DEC | OCT | HEX | BIN | Символ | HTML код | Мнемоника |
---|---|---|---|---|---|---|
32 | 040 | 0x20 | 00100000 | Пробел | ||
33 | 041 | 0x21 | 00100001 | ! | ! | |
34 | 042 | 0x22 | 00100010 | « | " | " |
35 | 043 | 0x23 | 00100011 | # | # | |
36 | 044 | 0x24 | 00100100 | $ | $ | |
37 | 045 | 0x25 | 00100101 | % | % | |
38 | 046 | 0x26 | 00100110 | & | & | & |
39 | 047 | 0x27 | 00100111 | ‘ | ' | ' |
40 | 050 | 0x28 | 00101000 | ( | ( | |
41 | 051 | 0x29 | 00101001 | ) | ) | |
42 | 052 | 0x2A | 00101010 | * | * | |
43 | 053 | 0x2B | 00101011 | + | + | |
44 | 054 | 0x2C | 00101100 | , | , | |
45 | 055 | 0x2D | 00101101 | — | - | |
46 | 056 | 0x2E | 00101110 | . | . | |
47 | 057 | 0x2F | 00101111 | / | / | |
48 | 060 | 0x30 | 00110000 | 0 | 0 | |
49 | 061 | 0x31 | 00110001 | 1 | 1 | |
50 | 062 | 0x32 | 00110010 | 2 | 2 | |
51 | 063 | 0x33 | 00110011 | 3 | 3 | |
52 | 064 | 0x34 | 00110100 | 4 | 4 | |
53 | 065 | 0x35 | 00110101 | 5 | 5 | |
54 | 066 | 0x36 | 00110110 | 6 | 6 | |
55 | 067 | 0x37 | 00110111 | 7 | 7 | |
56 | 070 | 0x38 | 00111000 | 8 | 8 | |
57 | 071 | 0x39 | 00111001 | 9 | 9 | |
58 | 072 | 0x3A | 00111010 | : | : | |
59 | 073 | 0x3B | 00111011 | ; | ; | |
60 | 074 | 0x3C | 00111100 | < | < | < |
61 | 075 | 0x3D | 00111101 | = | = | |
62 | 076 | 0x3E | 00111110 | > | > | > |
63 | 077 | 0x3F | 00111111 | ? | ? | |
64 | 100 | 0x40 | 01000000 | @ | @ | |
65 | 101 | 0x41 | 01000001 | A | A | |
66 | 102 | 0x42 | 01000010 | B | B | |
67 | 103 | 0x43 | 01000011 | C | C | |
68 | 104 | 0x44 | 01000100 | D | D | |
69 | 105 | 0x45 | 01000101 | E | E | |
70 | 106 | 0x46 | 01000110 | F | F | |
71 | 107 | 0x47 | 01000111 | G | G | |
72 | 110 | 0x48 | 01001000 | H | H | |
73 | 111 | 0x49 | 01001001 | I | I | |
74 | 112 | 0x4A | 01001010 | J | J | |
75 | 113 | 0x4B | 01001011 | K | K | |
76 | 114 | 0x4C | 01001100 | L | L | |
77 | 115 | 0x4D | 01001101 | M | M | |
78 | 116 | 0x4E | 01001110 | N | N | |
79 | 117 | 0x4F | 01001111 | O | O | |
80 | 120 | 0x50 | 01010000 | P | P | |
81 | 121 | 0x51 | 01010001 | Q | Q | |
82 | 122 | 0x52 | 01010010 | R | R | |
83 | 123 | 0x53 | 01010011 | S | S | |
84 | 124 | 0x54 | 01010100 | T | T | |
85 | 125 | 0x55 | 01010101 | U | U | |
86 | 126 | 0x56 | 01010110 | V | V | |
87 | 127 | 0x57 | 01010111 | W | W | |
88 | 130 | 0x58 | 01011000 | X | X | |
89 | 131 | 0x59 | 01011001 | Y | Y | |
90 | 132 | 0x5A | 01011010 | Z | Z | |
91 | 133 | 0x5B | 01011011 | [ | [ | |
92 | 134 | 0x5C | 01011100 | \ | ||
93 | 135 | 0x5D | 01011101 | ] | ] | |
94 | 136 | 0x5E | 01011110 | ^ | ^ | |
95 | 137 | 0x5F | 01011111 | _ | _ | |
96 | 140 | 0x60 | 01100000 | ` | ` | |
97 | 141 | 0x61 | 01100001 | a | a | |
98 | 142 | 0x62 | 01100010 | b | b | |
99 | 143 | 0x63 | 01100011 | c | c | |
100 | 144 | 0x64 | 01100100 | d | d | |
101 | 145 | 0x65 | 01100101 | e | e | |
102 | 146 | 0x66 | 01100110 | f | f | |
103 | 147 | 0x67 | 01100111 | g | g | |
104 | 150 | 0x68 | 01101000 | h | h | |
105 | 151 | 0x69 | 01101001 | i | i | |
106 | 152 | 0x6A | 01101010 | j | j | |
107 | 153 | 0x6B | 01101011 | k | k | |
108 | 154 | 0x6C | 01101100 | l | l | |
109 | 155 | 0x6D | 01101101 | m | m | |
110 | 156 | 0x6E | 01101110 | n | n | |
111 | 157 | 0x6F | 01101111 | o | o | |
112 | 160 | 0x70 | 01110000 | p | p | |
113 | 161 | 0x71 | 01110001 | q | q | |
114 | 162 | 0x72 | 01110010 | r | r | |
115 | 163 | 0x73 | 01110011 | s | s | |
116 | 164 | 0x74 | 01110100 | t | t | |
117 | 165 | 0x75 | 01110101 | u | u | |
118 | 166 | 0x76 | 01110110 | v | v | |
119 | 167 | 0x77 | 01110111 | w | w | |
120 | 170 | 0x78 | 01111000 | x | x | |
121 | 171 | 0x79 | 01111001 | y | y | |
122 | 172 | 0x7A | 01111010 | z | z | |
123 | 173 | 0x7B | 01111011 | { | { | |
124 | 174 | 0x7C | 01111100 | | | | | |
125 | 175 | 0x7D | 01111101 | } | } | |
126 | 176 | 0x7E | 01111110 | ~ | ~ |
3
Расширенные символы ASCII Win-1251 кириллица
DEC | OCT | HEX | BIN | Символ | HTML код | Мнемоника |
---|---|---|---|---|---|---|
128 | 200 | 0x80 | 10000000 | Ђ | | |
129 | 201 | 0x81 | 10000001 | Ѓ | | |
130 | 202 | 0x82 | 10000010 | ‚ | | ‚ |
131 | 203 | 0x83 | 10000011 | ѓ | | |
132 | 204 | 0x84 | 10000100 | „ | | „ |
133 | 205 | 0x85 | 10000101 | … | … | |
134 | 206 | 0x86 | 10000110 | † | | † |
135 | 207 | 0x87 | 10000111 | ‡ | | ‡ |
136 | 210 | 0x88 | 10001000 | € | | € |
137 | 211 | 0x89 | 10001001 | ‰ | | ‰ |
138 | 212 | 0x8A | 10001010 | Љ | | |
139 | 213 | 0x8B | 10001011 | ‹ | | ‹ |
140 | 214 | 0x8C | 10001100 | Њ | | |
141 | 215 | 0x8D | 10001101 | Ќ | | |
142 | 216 | 0x8E | 10001110 | Ћ | | |
143 | 217 | 0x8F | 10001111 | Џ | | |
144 | 220 | 0x90 | 10010000 | Ђ | | |
145 | 221 | 0x91 | 10010001 | ‘ | | ‘ |
146 | 222 | 0x92 | 10010010 | ’ | | ’ |
147 | 223 | 0x93 | 10010011 | “ | | “ |
148 | 224 | 0x94 | 10010100 | ” | | ” |
149 | 225 | 0x95 | 10010101 | • | | • |
150 | 226 | 0x96 | 10010110 | – | | – |
151 | 227 | 0x97 | 10010111 | — | | — |
152 | 230 | 0x98 | 10011000 | Начало строки | | |
153 | 231 | 0x99 | 10011001 | ™ | | ™ |
154 | 232 | 0x9A | 10011010 | љ | | |
155 | 233 | 0x9B | 10011011 | › | | › |
156 | 234 | 0x9C | 10011100 | њ | | |
157 | 235 | 0x9D | 10011101 | ќ | | |
158 | 236 | 0x9E | 10011110 | ћ | | |
159 | 237 | 0x9F | 10011111 | џ | | |
160 | 240 | 0xA0 | 10100000 | Неразрывный пробел | | |
161 | 241 | 0xA1 | 10100001 | Ў | ¡ | |
162 | 242 | 0xA2 | 10100010 | ў | ¢ | |
163 | 243 | 0xA3 | 10100011 | Ј | £ | |
164 | 244 | 0xA4 | 10100100 | ¤ | ¤ | ¤ |
165 | 245 | 0xA5 | 10100101 | Ґ | ¥ | |
166 | 246 | 0xA6 | 10100110 | ¦ | ¦ | ¦ |
167 | 247 | 0xA7 | 10100111 | § | § | § |
168 | 250 | 0xA8 | 10101000 | Ё | ¨ | |
169 | 251 | 0xA9 | 10101001 | © | © | © |
170 | 252 | 0xAA | 10101010 | Є | ª | |
171 | 253 | 0xAB | 10101011 | « | « | « |
172 | 254 | 0xAC | 10101100 | ¬ | ¬ | ¬ |
173 | 255 | 0xAD | 10101101 | Мягкий перенос | | ­ |
174 | 256 | 0xAE | 10101110 | ® | ® | ® |
175 | 257 | 0xAF | 10101111 | Ї | ¯ | |
176 | 260 | 0xB0 | 10110000 | ° | ° | ° |
177 | 261 | 0xB1 | 10110001 | ± | ± | ± |
178 | 262 | 0xB2 | 10110010 | І | ² | |
179 | 263 | 0xB3 | 10110011 | і | ³ | |
180 | 264 | 0xB4 | 10110100 | ґ | ´ | |
181 | 265 | 0xB5 | 10110101 | µ | µ | µ |
182 | 266 | 0xB6 | 10110110 | ¶ | ¶ | ¶ |
183 | 267 | 0xB7 | 10110111 | · | · | · |
184 | 270 | 0xB8 | 10111000 | ё | ¸ | |
185 | 271 | 0xB9 | 10111001 | № | ¹ | |
186 | 272 | 0xBA | 10111010 | є | º | |
187 | 273 | 0xBB | 10111011 | » | » | » |
188 | 274 | 0xBC | 10111100 | ј | ¼ | |
189 | 275 | 0xBD | 10111101 | Ѕ | ½ | |
190 | 276 | 0xBE | 10111110 | ѕ | ¾ | |
191 | 277 | 0xBF | 10111111 | ї | ¿ | |
192 | 300 | 0xC0 | 11000000 | А | À | |
193 | 301 | 0xC1 | 11000001 | Б | Á | |
194 | 302 | 0xC2 | 11000010 | В | Â | |
195 | 303 | 0xC3 | 11000011 | Г | Ã | |
196 | 304 | 0xC4 | 11000100 | Д | Ä | |
197 | 305 | 0xC5 | 11000101 | Е | Å | |
198 | 306 | 0xC6 | 11000110 | Ж | Æ | |
199 | 307 | 0xC7 | 11000111 | З | Ç | |
200 | 310 | 0xC8 | 11001000 | И | È | |
201 | 311 | 0xC9 | 11001001 | Й | É | |
202 | 312 | 0xCA | 11001010 | К | Ê | |
203 | 313 | 0xCB | 11001011 | Л | Ë | |
204 | 314 | 0xCC | 11001100 | М | Ì | |
205 | 315 | 0xCD | 11001101 | Н | Í | |
206 | 316 | 0xCE | 11001110 | О | Î | |
207 | 317 | 0xCF | 11001111 | П | Ï | |
208 | 320 | 0xD0 | 11010000 | Р | Ð | |
209 | 321 | 0xD1 | 11010001 | С | Ñ | |
210 | 322 | 0xD2 | 11010010 | Т | Ò | |
211 | 323 | 0xD3 | 11010011 | У | Ó | |
212 | 324 | 0xD4 | 11010100 | Ф | Ô | |
213 | 325 | 0xD5 | 11010101 | Х | Õ | |
214 | 326 | 0xD6 | 11010110 | Ц | Ö | |
215 | 327 | 0xD7 | 11010111 | Ч | × | |
216 | 330 | 0xD8 | 11011000 | Ш | Ø | |
217 | 331 | 0xD9 | 11011001 | Щ | Ù | |
218 | 332 | 0xDA | 11011010 | Ъ | Ú | |
219 | 333 | 0xDB | 11011011 | Ы | Û | |
220 | 334 | 0xDC | 11011100 | Ь | Ü | |
221 | 335 | 0xDD | 11011101 | Э | Ý | |
222 | 336 | 0xDE | 11011110 | Ю | Þ | |
223 | 337 | 0xDF | 11011111 | Я | ß | |
224 | 340 | 0xE0 | 11100000 | а | à | |
225 | 341 | 0xE1 | 11100001 | б | á | |
226 | 342 | 0xE2 | 11100010 | в | â | |
227 | 343 | 0xE3 | 11100011 | г | ã | |
228 | 344 | 0xE4 | 11100100 | д | ä | |
229 | 345 | 0xE5 | 11100101 | е | å | |
230 | 346 | 0xE6 | 11100110 | ж | æ | |
231 | 347 | 0xE7 | 11100111 | з | ç | |
232 | 350 | 0xE8 | 11101000 | и | è | |
233 | 351 | 0xE9 | 11101001 | й | é | |
234 | 352 | 0xEA | 11101010 | к | ê | |
235 | 353 | 0xEB | 11101011 | л | ë | |
236 | 354 | 0xEC | 11101100 | м | ì | |
237 | 355 | 0xED | 11101101 | н | í | |
238 | 356 | 0xEE | 11101110 | о | î | |
239 | 357 | 0xEF | 11101111 | п | ï | |
240 | 360 | 0xF0 | 11110000 | р | ð | |
241 | 361 | 0xF1 | 11110001 | с | ñ | |
242 | 362 | 0xF2 | 11110010 | т | ò | |
243 | 363 | 0xF3 | 11110011 | у | ó | |
244 | 364 | 0xF4 | 11110100 | ф | ô | |
245 | 365 | 0xF5 | 11110101 | х | õ | |
246 | 366 | 0xF6 | 11110110 | ц | ö | |
247 | 367 | 0xF7 | 11110111 | ч | ÷ | |
248 | 370 | 0xF8 | 11111000 | ш | ø | |
249 | 371 | 0xF9 | 11111001 | щ | ù | |
250 | 372 | 0xFA | 11111010 | ъ | ú | |
251 | 373 | 0xFB | 11111011 | ы | û | |
252 | 374 | 0xFC | 11111100 | ь | ü | |
253 | 375 | 0xFD | 11111101 | э | ý | |
254 | 376 | 0xFE | 11111110 | ю | þ | |
255 | 377 | 0xFF | 11111111 | я | ÿ |
Windows-1251 (cp1251) — это стандартная 8-битная кодировка, разработанная компанией Microsoft. Она содержит практически все символы, которые Вы можете встретить на стандартной русской клавиатуре. Также 1251 имеет символы для таких языков, как белорусский, украинский, болгарский и сербский.
DEC |
HEX |
СИМВ |
DEC |
HEX |
СИМВ |
DEC |
HEX |
СИМВ |
000 |
00 |
NOP |
086 |
56 |
V |
171 |
AB |
« |
001 |
01 |
SOH |
087 |
57 |
W |
172 |
AC |
¬ |
002 |
02 |
STX |
088 |
58 |
X |
173 |
AD |
|
003 |
03 |
ETX |
089 |
59 |
Y |
174 |
AE |
® |
004 |
04 |
EOT |
090 |
5A |
Z |
175 |
AF |
Ї |
005 |
05 |
ENQ |
091 |
5B |
[ |
176 |
B0 |
° |
006 |
06 |
ACK |
092 |
5C |
177 |
B1 |
± |
|
007 |
07 |
BEL |
093 |
5D |
] |
178 |
B2 |
І |
008 |
08 |
BS |
094 |
5E |
^ |
179 |
B3 |
і |
009 |
09 |
Табуляция |
095 |
5F |
_ |
180 |
B4 |
ґ |
010 |
0A |
LF |
096 |
60 |
` |
181 |
B5 |
µ |
011 |
0B |
VT |
097 |
61 |
a |
182 |
B6 |
¶ |
012 |
0C |
FF |
098 |
62 |
b |
183 |
B7 |
· |
013 |
0D |
CR |
099 |
63 |
c |
184 |
B8 |
Ё |
014 |
0E |
SO |
100 |
64 |
d |
185 |
B9 |
№ |
015 |
0F |
SI |
101 |
65 |
e |
186 |
BA |
Є |
016 |
10 |
DLE |
102 |
66 |
f |
187 |
BB |
» |
017 |
11 |
DC1 |
103 |
67 |
g |
188 |
BC |
ј |
018 |
12 |
DC2 |
104 |
68 |
h |
189 |
BD |
Ѕ |
019 |
13 |
DC3 |
105 |
69 |
i |
190 |
BE |
Ѕ |
020 |
14 |
DC4 |
106 |
6A |
j |
191 |
BF |
Ї |
021 |
15 |
NAK |
107 |
6B |
k |
192 |
C0 |
А |
022 |
16 |
SYN |
108 |
6C |
l |
193 |
C1 |
Б |
023 |
17 |
ETB |
109 |
6D |
m |
194 |
C2 |
В |
024 |
18 |
CAN |
110 |
6E |
n |
195 |
C3 |
Г |
025 |
19 |
EM |
111 |
6F |
o |
196 |
C4 |
Д |
026 |
1A |
SUB |
112 |
70 |
p |
197 |
C5 |
Е |
027 |
1B |
ESC |
113 |
71 |
q |
198 |
C6 |
Ж |
028 |
1C |
FS |
114 |
72 |
r |
199 |
C7 |
З |
029 |
1D |
GS |
115 |
73 |
s |
200 |
C8 |
И |
030 |
1E |
RS |
116 |
74 |
t |
201 |
C9 |
Й |
031 |
1F |
US |
117 |
75 |
u |
202 |
CA |
К |
032 |
20 |
Пробел |
118 |
76 |
v |
203 |
CB |
Л |
033 |
21 |
! |
119 |
77 |
w |
204 |
CC |
М |
034 |
22 |
« |
120 |
78 |
x |
205 |
CD |
Н |
035 |
23 |
# |
121 |
79 |
y |
206 |
CE |
О |
036 |
24 |
$ |
122 |
7A |
z |
207 |
CF |
П |
037 |
25 |
% |
123 |
7B |
{ |
208 |
D0 |
Р |
038 |
26 |
& |
124 |
7C |
| |
209 |
D1 |
С |
039 |
27 |
‘ |
125 |
7D |
} |
210 |
D2 |
Т |
040 |
28 |
( |
126 |
7E |
~ |
211 |
D3 |
У |
041 |
29 |
) |
127 |
7F |
|
212 |
D4 |
Ф |
042 |
2A |
* |
128 |
80 |
Ђ |
213 |
D5 |
Х |
043 |
2B |
+ |
129 |
81 |
Ѓ |
214 |
D6 |
Ц |
044 |
2C |
, |
130 |
82 |
‚ |
215 |
D7 |
Ч |
045 |
2D |
— |
131 |
83 |
ѓ |
216 |
D8 |
Ш |
046 |
2E |
. |
132 |
84 |
„ |
217 |
D9 |
Щ |
047 |
2F |
/ |
133 |
85 |
… |
218 |
DA |
Ъ |
048 |
30 |
0 |
134 |
86 |
† |
219 |
DB |
Ы |
049 |
31 |
1 |
135 |
87 |
‡ |
220 |
DC |
Ь |
050 |
32 |
2 |
136 |
88 |
€ |
221 |
DD |
Э |
051 |
33 |
3 |
137 |
89 |
‰ |
222 |
DE |
Ю |
052 |
34 |
4 |
138 |
8A |
Љ |
223 |
DF |
Я |
053 |
35 |
5 |
139 |
8B |
‹ |
224 |
E0 |
а |
054 |
36 |
6 |
140 |
8C |
Њ |
225 |
E1 |
б |
055 |
37 |
7 |
141 |
8D |
Ќ |
226 |
E2 |
в |
056 |
38 |
8 |
142 |
8E |
Ћ |
227 |
E3 |
г |
057 |
39 |
9 |
143 |
8F |
Џ |
228 |
E4 |
д |
058 |
3A |
: |
144 |
90 |
Ђ |
229 |
E5 |
е |
059 |
3B |
; |
145 |
91 |
‘ |
230 |
E6 |
ж |
060 |
3C |
< |
146 |
92 |
’ |
231 |
E7 |
з |
061 |
3D |
= |
147 |
93 |
“ |
232 |
E8 |
и |
062 |
3E |
> |
148 |
94 |
” |
233 |
E9 |
й |
063 |
3F |
? |
149 |
95 |
• |
234 |
EA |
к |
064 |
40 |
@ |
150 |
96 |
– |
235 |
EB |
л |
065 |
41 |
A |
151 |
97 |
— |
236 |
EC |
м |
066 |
42 |
B |
152 |
98 |
237 |
ED |
н |
|
067 |
43 |
C |
153 |
99 |
™ |
238 |
EE |
о |
068 |
44 |
D |
154 |
9A |
љ |
239 |
EF |
п |
069 |
45 |
E |
155 |
9B |
› |
240 |
F0 |
р |
070 |
46 |
F |
156 |
9C |
њ |
241 |
F1 |
с |
071 |
47 |
G |
157 |
9D |
ќ |
242 |
F2 |
т |
072 |
48 |
H |
158 |
9E |
ћ |
243 |
F3 |
у |
073 |
49 |
I |
159 |
9F |
џ |
244 |
F4 |
ф |
074 |
4A |
J |
160 |
A0 |
245 |
F5 |
х |
|
075 |
4B |
K |
161 |
A1 |
Ў |
246 |
F6 |
ц |
076 |
4C |
L |
162 |
A2 |
ў |
247 |
F7 |
ч |
077 |
4D |
M |
163 |
A3 |
Ј |
248 |
F8 |
ш |
078 |
4E |
N |
164 |
A4 |
¤ |
249 |
F9 |
щ |
079 |
4F |
O |
165 |
A5 |
Ґ |
250 |
FA |
ъ |
080 |
50 |
P |
166 |
A6 |
¦ |
251 |
FB |
ы |
081 |
51 |
Q |
167 |
A7 |
§ |
252 |
FC |
ь |
082 |
52 |
R |
168 |
A8 |
Ё |
253 |
FD |
э |
083 |
53 |
S |
169 |
A9 |
© |
254 |
FE |
ю |
084 |
54 |
T |
170 |
AA |
Є |
255 |
FF |
я |
085 |
55 |
U |
Похожие записи:
- ASCII таблица символов.
- Таблица CP 866 DOS.
- Таблица КОИ8-R
- Alt-коды клавиш Windows.
- Таблица ISO-8859-5
В начале 90-х, когда произошел развал СССР и границы России были открыты, к нам стали поступать программные продукты западного производства. Естественно, все они были англоязычными. В это же время начинает развиваться Интернет. Остро встала проблема русификации ресурсов и программ. Тогда и была придумана русская кодировка Windows 1251. Она позволяет корректно отображать буквы славянских алфавитов:
- русского;
- украинского;
- белорусского;
- сербского;
- болгарского;
- македонского.
Разработка велась русским представительством Microsoft совместно с компаниями «Диалог» и «Параграф». За основу были взяты самописные разработки, которые в 1990-91гг имели хождение среди немногочисленных идеологов ИТ в России.
На сегодняшний день разработан более универсальный способ кодировать символы — UTF-8 (Юникод). В нем представлено почти 90% всех программных и веб-ресурсов. Windows 1251 применяется в 1,6% случаев. (Информация по исследованиям Web Technology Surveys)
Кодировка сайта utf 8 или Windows 1251?
Чтобы ответить на этот вопрос, необходимо немного понять, что такое кодировка и чем они отличаются. Текстовая информация, как впрочем, и любая другая, в компьютере хранится в закодированном виде. Нам легче представить ее как числа. Каждый символ может занимать один или более байт. Windows 1251 является однобайтной кодировкой, а UTF-8 восьмибайтной. Это значит, что в Windows 1251 можно закодировать всего 256 символов.
Так как все сводится к двоичной системе исчисления, а байт – это 8 бит (0 и 1), то и максимальное число сочетаний составляет 28 = 256. Юникод позволяет представлять куда большее число символов, да и на каждый может быть выделен больший размер.
Отсюда и следуют преимущества Юникода:
- В шапке сайта следует указать кодировку, которая используется. Иначе вместо символов отобразятся «кракозяблы». А Юникод является стандартным для всех браузеров – они ловят его «на лету» как установленный по умолчанию.
- Символы сайта останутся одними и теми же, независимо от того, в какой стране загружается ресурс. Это зависит не от географического расположения серверов, а от языка программного обеспечения рабочих станций клиента. Житель Португалии, очевидно, использует клавиатуру и все ПО, включая операционную систему, на родном языке. В его компьютере, скорее всего вообще отсутствует Windows 1251. А если это так, то и сайты на русском языке корректно открываться не будут. Юникод, в свою очередь, «зашит» в любую ОС на любом языке.
- UTF-8 позволяет закодировать большее количество символов. На данный момент используется 6 байт из 8-ми, а русские символы кодируются двумя байтами.
Именно поэтому предпочтительней использовать универсальную кодировку, а не узкоспециализированную, которая применяется только в славянских странах.
Таблица кодировки Windows 1251
Для программистов и разработчиков сайтов бывает необходимо знать номера символов. Для этого используются специальные таблицы кодировки. Ниже представлена таблица для Windows 1251.
Что делать, если слетела кодировка командной строки?
Иногда Вы можете столкнуться с ситуацией, когда в командной строке вместо русских отображаются непонятные символы. Это означает, что возникла проблема кодировки командной строки Windows 7. Почему 7-ка? Потому что, начиная с 8-й версии, используется UTF-8, а в семерке еще Windows 1251.
Единовременно помочь решить проблему может команда chcp 866. Текущий сеанс будет работать корректно. А вот чтобы исправить ошибку кардинально, понадобится реестр.
- Нажмите Win+R и наберите команду regedit. Это позволит попасть в редактор реестра.
- Перейдите по ветке HKEY_CURRENT_USERConsole и посмотрите, чему равно значение для CodePage. Скорее всего, вы увидите что-то, отличное от 866 (правильный вариант).
- Исправьте на 866 в положении «Десятичная».
- Закройте и откройте вновь командную строку. Ситуация должна исправиться.
Отличного Вам дня!