Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).
Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.
В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.
Блокнот Windows
Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню «Файл – Сохранить как».
В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку «Сохранить».
К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.
Notepad++
Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.
Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню «Кодировки – Кириллица» и выбрать нужный вариант.
После открытия текста можно изменить его кодировку. Для этого нужно открыть меню «Кодировки» и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.
После преобразования файл нужно сохранить с помощью меню «Файл – Сохранить» или комбинации клавиш Ctrl-S.
Akelpad
Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.
Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню «Файл – Открыть».
В открывшемся окне нужно выделить текстовый файл, снять отметку «Автовыбор» и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.
Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню «Файл – Сохранить как» и сохранить документ с указанием новой схемы кодирования.
В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.
Посмотрите также:
- Чем открыть PDF файл в Windows 7 или Windows 10
- Как перевернуть страницу в Word
- Как копировать текст с помощью клавиатуры
- Как сделать рамку в Word
- Как сделать буклет в Word
Автор
Александр Степушин
Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.
Остались вопросы?
Задайте вопрос в комментариях под статьей или на странице
«Задать вопрос»
и вы обязательно получите ответ.
Notepad++ — отличный текстовый редактор!
В статье о кодировках текста я описал основные моменты, показывающие, почему необходимо учитывать кодировку файла (например, при создании html-страницы). Здесь же я опишу простой способ выставления нужной кодировки текста с помощью простого и быстрого редактора Notepad++.
Чтобы скачать данную программу, заходим на официальный сайт — Notepad-plus-plus.org — далее ищем ссылку «download», кликаем по ней и выбираем «Notepad++ v*** Installer», где вместо звёздочек будет текущая версия редактора. Скачиваем и устанавливаем, никаких сложностей при установке нет.
Чем вообще хорош этот редактор?
Во-первых, подсветка синтаксиса — редактор Notepad++ неплохо понимает разные языки программирования (тип языка определяется по расширению файла, например file.php — php-файл, index.html — html-файл) и производит автоматическую подсветку управляющих конструкций языка.
Notepad++ понимает php и подсвечивает синтаксис языка. Кликабельно
Во-вторых, в нём можно легко изменить кодировку текстового файла на нужную (чтобы быстро её сменить, щёлкаем вкладку «Кодировки», затем «Преобразовать в …» — кликайте рисунок ниже) и, что самое главное, отредактировать любой файл без изменения текущей кодировки (кодировка не «слетает»).
Последняя особенность очень важна, например, при редактировании шаблонов движка вашего сайта (напр., WordPress). Почему? Потому что все файлы WP по умолчанию имеют кодировку Utf-8. Если менять их стандартным блокнотом Windows, то к кодировке Utf-8 добавляется специальная BOM-последовательность. Необязательно знать, что это такое, но из-за неё некоторые функции движка работать вообще не будут. Поэтому так важно, чтобы все файлы шаблонов WP были сохранены в кодировке Utf-8 без BOM.
Преобразование в кодировку Utf-8 без BOM
Теперь, чтобы открыть текстовый файл данным редактором, надо кликнуть по нему правой кнопкой мышки и выбрать соответствующий пункт меню:
Открытие .txt файлов Notepad++
Таким образом, установив на свой компьютер программу Notepad++ можно получить многофункциональный редактор текста с подсветкой синтаксиса и возможностью манипуляций с кодировками.
Loading…
Анализ данных по UTM-меткам в Яндекс.МетрикеВ предыдущей статье я описал, что такое UTM-метки и как их создавать…
Как закрыть весь сайт от индексации в Robots.txt, оставив только главную страницу — и зачем так делать?…ser-agent: *
Disallow: /
Allow: /$
Вот и всё. Эффект от этогоКак НЕ надо раскручивать сайт? Немного о том, что такое САР…(20-30 рублей за 1000 переходов), а пользователи этой системы активной
VLK partners — официальная партнерка казино ВулканВсем привет! Сегодня я хочу рассказать вам, как заработать на онлайн казино. Нет,…
Целевой трафик на сайт: лучше меньше, да лучше!В пятницу, 8 ноября 2013, обнаружил в статистике Яндекс метрики, что соверш…
AU
На сайте с 01.07.2011
Offline
96
9 декабря 2015, 13:07
10750
Всем доброго времени суток.
Столкнулся с проблемкой, notepad++ не делает перекодировку файла из utf8 на win1251.
Может кто знает, какие то способы или софт, который сможет мне в этом помочь.
Заранее благодарю, за ответ.
Скрин:
На сайте с 25.11.2006
Offline
1678
Какая версия нотепада и что значит не делает?
На сайте с 02.12.2007
Offline
239
Вместо кодировать, нужно преобразовать.
«Кодировки» >>> «Преобразовать в ANSI»
ПРОМОКОД НА СКИДКУ 25% (64821976): аренда VPS/VDS — firstvds.ru | выделенные серверы — firstdedic.ru | облачный сервер — ispserver.ru | Локация: РФ, Москва, ПУ: ISPmanager 6.
R
На сайте с 31.08.2010
Offline
78
нотепад обновите, хватит старьем пользоваться.
Какая версия нотепада и что значит не делает?
видимо старая раз на скрине utf8 w/o BOM
у меня utf8 as BOM
Вместо кодировать, нужно преобразовать.
«Кодировки» >>> «Преобразовать в ANSI»
у меня и кодировать работает и все норм. перекодирует.
L
На сайте с 30.10.2015
Offline
34
в блокноте выбираешь сохранить как, там есть выбор кодировки
…
На сайте с 13.04.2006
Offline
372
Rokkkin:
видимо старая раз на скрине utf8 w/o BOM
у меня utf8 as BOM
При чем тут старая версия-то? BOM для php не уперся…
https://REGHOME.ru — регистрация и продление доменов от 169₽ в российских и международных зонах по честным ценам без звездочек. (R01, WebNames, UK2). Принимаем Ю-Money, Visa, MasterCard, Мир
На сайте с 04.03.2005
Offline
327
AlexUzun:
не делает перекодировку файла из utf8 на win1251.
И это правильно, потому что
невозможно в общем случае.
1. Заменить знаки, которых
нет в Windows-1251 кодировке,
на знаки, которые там есть.
2. Пробовать перекодировать.
3. Если не получилось, goto 1
AU
На сайте с 01.07.2011
Offline
96
На сайте с 25.11.2006
Offline
1678
Там только английские буквы, они в любой кодировки одинаковы. Вам зачем его в utf-8 то? Не знаете, что делать, так спросите полноценно.
AU
На сайте с 01.07.2011
Offline
96
LEOnidUKG:
Там только английские буквы, они в любой кодировки одинаковы. Вам зачем его в utf-8 то? Не знаете, что делать, так спросите полноценно.
Вот пример вывода скрипта, но это всего лишь малая часть. Другие страницы открываются тоже с эроглифами.
Скрин:
[Удален]
9 декабря 2015, 23:50
#10
meta charset пропишите в заголовке
Довольно часто приходится менять кодировку в документах, лично мне в PHP файлах, эта заметка о том, как поменять кодировку в Notepad++.
Список кодировок в редакторе Notepad++ :
- ANSI,
- UTF-8 без BOM,
- UTF-8,
- UCS-2 Big Endian,
- UCS-2 Litte Endian,
- Национальные кодировки.
Если у вас не правильная кодировка в документе, вы увидите кракозябры (они же иероглифы и т. д ., по факту – непонятный и бессмысленный набор символов). Для преобразования символов в читаемый текст (как правило в кракозябры преобразуется Кириллица) смените кодировку документа. Текущая кодировка указанна в нижнем правом углу редактора. Для изменения кодировки перейдите на вкладку Кодировки — Преобразовать в (и выберите нужную кодировку).
Национальные кодировки редактора
В редакторе Notepad++ есть несколько национальных кодировок, но мне не приходилось ими пользоваться, думаю, вам тоже не придется, но если вы хотите что бы я сделал их обзор – напишите мне об этом в форме обратной связи.
Кодировка UTF-8 без BOM
Не буду вдаваться в подробности, в целом можно сохранять различные файлы как с BOM (Byte Order Mark, BOM – маркер последовательности байтов), так и без. Исключение – PHP файлы, рекомендую сохранять их без BOM.
Используя сайт abuzov.ru, вы даете согласие на работу с cookie, Яндекс.Метрикой, Google Analytics для сбора технических данных.OKПодробнее
53 / 31 / 4 Регистрация: 19.12.2013 Сообщений: 168 |
|
1 |
|
21.02.2015, 18:30. Показов 36968. Ответов 10
Мне передали много файлов в кодировке Windows-1251 при открытии этих файлов в Notepad++ он определяет кодировку как Macintosh и в результате часть букв отображается не верно. Два вопроса: 2) Если порядок и приоритет нельзя поменять то как добавить в меню Notepad++ свой пункт, я хочу перенести выбор кодировки Windows-1251 поближе в меню чтобы далеко не лазить. Всем заранее спасибо кто откликнется Миниатюры
__________________
5 |
Заблокирован |
|
22.02.2015, 02:17 |
2 |
Решение попробуй отключить автоопределение стилей [Опции->Настройки->Разное]
5 |
Супер-модератор 32451 / 20945 / 8105 Регистрация: 22.10.2011 Сообщений: 36,213 Записей в блоге: 7 |
|
22.02.2015, 13:09 |
3 |
AnastasiaSX, Опции -> Горячие клавиши -> MainMenu крутим вниз, пока не доберемся до 160-х пунктов, там выбираем Windows1251 и назначаем хоткей по желанию. В меню вообще не придется лазить…
2 |
53 / 31 / 4 Регистрация: 19.12.2013 Сообщений: 168 |
|
23.02.2015, 12:35 [ТС] |
4 |
попробуй отключить автоопределение стилей [Опции->Настройки->Разное] Есть спасибо теперь текст больше не Macintosh
Опции -> Горячие клавиши -> MainMenu крутим вниз, пока не доберемся до 160-х пунктов, там выбираем Windows1251 и назначаем хоткей по желанию. В меню вообще не придется лазить… Это хорошо, но сегодня я помню горячие клавиши я завтра забыла…
0 |
Супер-модератор 32451 / 20945 / 8105 Регистрация: 22.10.2011 Сообщений: 36,213 Записей в блоге: 7 |
|
23.02.2015, 12:50 |
5 |
Забыла — открой один раз меню, и посмотри, что там на этот пункт назначено. Редактировать меню стандартными настройками нельзя, этот функционал в NP++ не заложен…
1 |
2 / 2 / 0 Регистрация: 04.05.2012 Сообщений: 131 |
|
09.11.2015, 13:37 |
6 |
Мне не помогло. Этот макинтош все портит, уже запарился править файл каждое утро Добавлено через 4 минуты
попробуй отключить автоопределение стилей [Опции->Настройки->Разное] Точнее нету по этому пути такого пункта. Добавлено через 17 минут
0 |
353 / 114 / 20 Регистрация: 08.01.2015 Сообщений: 1,317 Записей в блоге: 1 |
|
02.12.2015, 17:57 |
7 |
Мне передали много файлов в кодировке Windows-1251 при открытии этих файлов в Notepad++ он определяет кодировку как Macintosh и в результате часть букв отображается не верно. Видел я на одном сайте такое решение: открыть файл в браузере (в подходящей кодировке), затем открыть исходный код и скопировать его в N++. Самое простое, на мой взгляд. Не надо мучиться с этими настройками.
0 |
3 / 3 / 1 Регистрация: 12.02.2017 Сообщений: 75 |
|
28.02.2017, 16:48 |
8 |
Хочу подтвердить, что вот этот вариант: Миниатюры
0 |
53 / 31 / 4 Регистрация: 19.12.2013 Сообщений: 168 |
|
19.08.2017, 00:11 [ТС] |
9 |
Спустя какое то время починили определение кодировки в Notepad++.
1 |
0 / 0 / 0 Регистрация: 06.12.2015 Сообщений: 3 |
|
06.04.2020, 07:54 |
10 |
После обновления до версии Notepad++ v7.8.5 то-же появилась такая же проблема.
0 |
0 / 0 / 0 Регистрация: 05.04.2014 Сообщений: 13 |
|
21.04.2020, 12:26 |
11 |
И мне только снятие галки помогло (версия 7.8.5)…
0 |
Для редактирования кода блога мы будем пользоваться текстовым редактором Notepad++. Эту программу ставьте обязательно себе на компьютер. Ниже перечислю основные функции и особенности Notepad++.
- Этот текстовой редактор предоставляется абсолютно бесплатно;
- Есть возможность отмены действия. То есть, допустим: Вы исправили код, затем он выдает ошибку, а Вы не помните, что да как было. Чтобы вернуть в обратное положение, Вам достаточно нажать «Правка»—>»Отмена» или CTRL+Z до тех пор, пока Вас не устроит состояние блога ;
- Можете одновременно работать с другими файлами, что очень удобно;
- Присутствует подсветка синтаксиса (каждый вид элемента окрашен в свой цвет, так же можно кликнуть по открывающему тегу, в результате программа предоставит Вам закрывающий тег);
- Поддержка плагинов;
- Данный текстовой редактор предоставляет еще кучу возможностей и удобств для Вашей работы.
Думаю, вышеперечисленные преимущества убедили Вас поставить себе на компьютер Notepad++. Если это так, то Вам для начала нужно скачать Notepad++ или с официального сайта, затем установить его себе на компьютер. Запускаем программу, она будет выглядеть следующим образом (я открыл файл index.php темы моего будущего блога):
Здесь:
- Номер строки
- Открывающий тег <p>
- Закрывающий тег </p>
- Кодировка файла.
Об остальных нюансах можете почитать на сайте разработчика, ну или разбираться самому, так как программа полностью на русском и понятная.
Теперь покажу Вам как можно свернуть «внутренность» тега. Для этого нужно нажать на «-» (на рисунке выше показано цифрой 2). В результате Вы легко можете узнать, где находиться закрывающий тег. На рисунке ниже результат после сворачивания (заметьте вместо «-» теперь «+»):
Изменение кодировки файлов темы WordPress на UTF-8 (русский язык)
Чтобы не было проблем с кодировкой на Вашем блоге (русский язык может изображаться крякозабрами — о них ниже). Приведу пример.
В правой части моей темы заголовки на английском языке:
Чтобы слово «Categories» перевести на русский язык нам нужно вспомнить какой файл темы отвечает за правую часть блога. Этот файл называется sidebar.php, открываем его текстовым редактором Notepad++. Находим в этом файле слово, которое нужно перевести (для удобства можете нажать CTRL+F и в поле для поиска нужно набрать необходимое слово: 1 — слово для поиска, 2 — нажать для поиска, 3 — результат поиска):
Теперь, чтобы это слово перевести на нормальный русский язык, нам нужно переделать кодировку в UTF-8, и только потом перевести слово. А если кодировку не менять, получится вот что (заметьте, что вышло на картинке ниже. Это случай, когда я в файле темы изменил слово Categories на Рубрики, вот эти знаки и есть крякозябры):
Так как же сделать так, чтобы вместо этих знаков вышло нормальное русское слово? С программой Notepad++ это довольно легко и просто. То что нам нужно сделать, это всего лишь открыть нужный нам файл (в данном случае я открываю sidebar.php), переделать кодировку в UTF-8 и только потом перевести слово.
Чтобы перевести кодировку в UTF-8 нужно зайти в Notepad++ в раздел «Кодировки» и выбрать «Преобразовать в UTF-8 без BOM»:
В результате в правом нижнем углу у Вас должна выйти следующее:
Теперь сохраняем файл (CTRL+S) и любуемся результатом:
Хочу сказать Вам, что каждый файл нужно переделывать в UTF-8 только один раз и просто сохранить. И, пока я пишу новые уроки, я рекомендую Вам потихонечку начать переводить на русский язык то, что еще не переведено в Вашей теме.
Теперь, если Вы вдруг увидите на своем блоге крякозябры, будете знать в чем проблема, а если что-то подзабыли, этот пост Вам в помощь.
Интегрируем Notepad++ в Total Commander.
Если Вы пользуетесь файловым менеджером Total Commander (Total Commander: зачем он нужен блоггеру?), то для удобства работы интегрируйте Notepad++ в него. Это довольно просто:
- Открываете Total Commander
- Зайдите «Конфигурация» —> «Правка/Просмотр«:
- И укажите программу Notepad++ текстовым редактором по умолчанию (нажимаете на стрелки (показано цифрой 1) и указываете адрес до данной программы, потом у Вас в поле должно появится слово notepad.exe (на рисунке стрелкой 2)):
___________________________
Если Вам понравился урок, подпишитесь на RSS, чтобы не пропускать новые бесплатные уроки моего блога (Что такое RSS-подписка?).
Удачи Вам!
___________________________
Следующий урок: Урок 18 Выводим популярные статьи на блоге.
Как вам урок?
Спасибо, очень приятно быть полезными!
Лучшая благодарность — это комментарий к уроку и «шеринг» в соц. сетях. Спасибо!
Помогите стать лучше, скажите что не так?
Непонятно
Урок устарел
Другое
Спасибо за помощь в развитии проекта!
В данной статье пойдёт речь о кодировках в Windows. Все в жизни хоть раз использовали и писали консольные приложения как таковые. Нету разницы для какой причины. Будь-то выбивание процесса или же просто написать «Привет!!! Я не могу сделать кодировку нормальной, поэтому я смотрю эту статью!».
Тем, кто ещё не понимает, о чём проблема, то вот Вам:
А тут было написано:
echo Я абракадабра, написанная автором.
Но никто ничего не понял.
В любом случае в Windows до 10 кодировка BAT и других языков, не использует кодировку поддерживающую Ваш язык, поэтому все русские символы будут писаться неправильно.
1. Настройка консоли в батнике
Сразу для тех, кто пишет chcp 1251 лучше написать это:
assoc .bat = .mp4
Первый способ устранения проблемы, это Notepad++. Для этого Вам нужно открыть Ваш батник таким способом:
Не бойтесь, у Вас откроется код Вашего батника, а затем Вам нужно будет сделать следующие действия:
Если Вам ничего не помогло, то преобразуйте в UTF-8 без BOM.
2. Написание консольных программ
Нередко люди пишут консольные программы(потому что на некоторых десктопные писать невозможно), а кодировка частая проблема.
Первый способ непосредственно Notepad++, но а если нужно сначала одну кодировку, а потом другую?
Сразу для использующих chcp 1251 пишите это:
del C:Program Data
echo Mne pofig
pause
Второй способ это написать десктопную программу, или же использовать Visual Studio. Если же не помогает, то есть первое: изменение кодировки вывода(Пример на C++).
#include <iostream>
#include <windows.h>
int main() {
SetConsoleCP(номер_кодировки);
SetConsoleOutputCP(номер_кодировки);
}
Если же не сработает:
#include <math.h> //Не забываем про библиотеку Math.
char bufRus[256];
char* Rus(const char* text) {
CharToOem(text, bufRus);
return bufRus
}
int main {
cout << "Тут пишите, что угодно!" << endl;
system("pause")
return 0
}
3. Изменение chcp 1251
Если же у Вас батник, то напишите в начало:
chcp 1251 >nul
for /f "delims=" %%A in ("Мой текст") do >nul chcp 866& echo.%%A
Теперь у Нас будет нормальный вывод в консоль. На других языках (С++):
SetConsoleOutputCP(1251)
//А тут добавляете тот цикл, который был в батнике
4. Сделать жизнь мёдом
При использовании данного способа Вы не сможете:
- Разрабатывать приложения на Windows ниже 10
- Спасти мир от данной проблемы
- Думать о других людях
- Разрабатывать десктопные приложения, так как Вам жизнь покажется мёдом
- Сменить Windows на версию ниже 10
- Ну и понимать людей, у которых Windows ниже 10
Установить Windows 10. Там кодировка консоли специально подходит для языка страны, и Вам больше не нужно будет беспокоиться об этой проблеме. Но у Вас появится ещё 6 проблем, и вернуться к предыдущей лицензионной версии Windows Вы не сможете.