Recoder v3.1.0 (BOM-remover)
github
Небольшая программа для массового (пакетного) перекодирования файлов из одной кодировки в другую. Доступные кодировки windows-1251, koi8-r, cp866, ISO 8859-5, utf-8, utf-8 с BOM-заголовком. Также умеет искать и удалять BOM-заголовок в файлах и каталогах.
Текущая версия: ¶
-
Скачать recoder v3.1.0 для Windows 7+ 64-бит (9.7 MB)
Запускается без установки, не требует дополнительных библиотек.
-
Скачать recoder v3.1.0 для Ubuntu 20.04+ 64-бит (10.8 MB)
Запускается без установки, не требует дополнительных библиотек.
Некоторые антивирусы (например, VirusTotal) могут показывать наличие вирусов в исполняемом файле. Это связано с использованием PyInstaller и его модулей.
Если это является проблемой, то проект можно запускать из исходного кода или использовать версию v2.
Последнее изменение: ¶
- 3 декабря 2022 г. — добавлена галочка «Искать в подкаталогах».
- 5 марта 2022 г. — приложение переписано на Python (tkinter) с публикацией исходного кода.
Предыдущие версии: ¶
- v3.0.0: Windows (9.7 MB), Linux (11 MB)
- v2.3.0: Windows (7.9 MB), Linux (74 kB)
- v2.2.2: Windows (7.9 MB), Linux (67.7 kB)
- v2.2.1: Windows (7.9 MB), Linux (66.5 kB)
- v2.1.1: Windows (7.2 MB), Linux (48.8 kB)
- v2.1: Windows (8.2 MB), Linux (48.5 kB)
- v2.0: Windows (7.9 MB)
Скриншоты ¶
Содержание
- Как изменить кодировку текстового файла на UTF-8 или Windows 1251
- Блокнот Windows
- Notepad++
- Akelpad
- Как преобразовать utf 8 в windows 1251
- Интересные решения Perl. Вопросы и ответы
- Как конвертировать строку из UTF-8 в Windows-1251?
- Комментарии посетителей сайта
- Как преобразовать utf 8 в windows 1251
- Заметки Лёвика
- web программирование, администрирование и всякая всячина, которая может оказаться полезной
- Если не работает iconv
- iconv array для массива
- Как сменить кодировку файла? Notepad++ редактор с подсветкой синтаксиса, кодировка Utf-8 без BOM
- Чем вообще хорош этот редактор?
Как изменить кодировку текстового файла на UTF-8 или Windows 1251
Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).
Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.
В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.
Блокнот Windows
Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню « Файл – Сохранить как ».
В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку « Сохранить ».
К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.
Notepad++
Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.
Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню « Кодировки – Кириллица » и выбрать нужный вариант.
После открытия текста можно изменить его кодировку. Для этого нужно открыть меню « Кодировки » и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.
После преобразования файл нужно сохранить с помощью меню « Файл – Сохранить » или комбинации клавиш Ctrl-S.
Akelpad
Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.
Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню « Файл – Открыть ».
В открывшемся окне нужно выделить текстовый файл, снять отметку « Автовыбор » и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.
Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню « Файл – Сохранить как » и сохранить документ с указанием новой схемы кодирования.
В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.
Источник
Как преобразовать utf 8 в windows 1251
Интересные решения Perl. Вопросы и ответы
Как конвертировать строку из UTF-8 в Windows-1251?
Есть как минимум 4 варианта:
1. Написать собственную процедуру перекодировки.
В этом случае придется потратить время на изучение алгоритмов.
2. Можно использовать модуль Convert::Cyrillic, однако он испытывает зависимость от модуля Unicode::Map8, который легко установить под *nix, но с поиском модуля под ActiveState Perl 5.8 могут возникнуть проблемы.
3. Можно использовать модуль Text::Iconv, который доступен как для Perl 5.6, так и для Perl 5.8.
4. Если Вы используете Perl 5.8, то конвертирование можно прозвести с помощью Encode:
Опубликовано: 19 ноября 2005 года.
Комментарии посетителей сайта
Григорий | 03.08.2016 17:20 |
Отлично. Ничего лишнего и всё понятно. Спасибо! |
Дмитрий | 25.01.2012 15:46 |
Спасибо, за хороший пример и пояснения! |
Андрей | 25.05.2011 00:43 |
Действительно. Четвертый метод сработал. Спасибо.
Есть ли способ для конвертации массива, например, Пытался использовать но ничего не вышло. Ответ: 07.09.2006 20:20 |
Валерий | 05.09.2006 04:14 |
кстати, может есть какой-нибудь вариант вывода perl’ом в браузер текста в UTF-8 без использования модулей Unicode и Text::Iconv. например, с использованием модуля CGI.
и почему не помогает вывод заголовка? Источник Как преобразовать utf 8 в windows 1251Сообщения: 3665 » width=»100%» style=»BORDER-RIGHT: #719bd9 1px solid; BORDER-LEFT: #719bd9 1px solid; BORDER-BOTTOM: #719bd9 1px solid» cellpadding=»6″ cellspacing=»0″ border=»0″> Сообщения: 27459 Сообщения: 3665 поясните плз, AFAIK utf16le (=Unicode) Native-кодировка начиная с Win2K Источник Заметки Лёвикаweb программирование, администрирование и всякая всячина, которая может оказаться полезнойПри помощи функции php iconv (строго говоря, это не совсем функция PHP, она использует стороннюю библиотеку (есть iconv.dll и php_iconv.dll или iconv.so), которой может не быть на хостинге) легко преобразовать кодировку (например, из windows-1251 в utf-8 и наоборот: Если не работает iconvТ.е. чтобы преобразовать текст из кодировки windows-1251 в UTF-8 следует выполнить: iconv array для массиваМетки: iconv Опубликовано Пятница, Октябрь 21, 2011 в 15:02 в следующих категориях: Без рубрики. Вы можете подписаться на комментарии к этому сообщению через RSS 2.0. Вы можете оставить комментарий. Пинг отключен. Автор будет признателен, если Вы поделитесь ссылкой на статью, которая Вам помогла: html-код (для вставки в ЖЖ, WP, blogger и на страницы сайта) ссылка (для отправки по почте) Как быть с запросом select к базе mssql не понимает кирилицу Следует привести столбцы (или всю базу данных сразу) к соответствующему сравнению (кодировке) Или использовать Nvarchar declare @test TABLE Если изменяю версию php 5.6 то не перекодируется. Не подскажете? Источник Как сменить кодировку файла? Notepad++ редактор с подсветкой синтаксиса, кодировка Utf-8 без BOMNotepad++ — отличный текстовый редактор! В статье о кодировках текста я описал основные моменты, показывающие, почему необходимо учитывать кодировку файла (например, при создании html-страницы). Здесь же я опишу простой способ выставления нужной кодировки текста с помощью простого и быстрого редактора Notepad++. Чтобы скачать данную программу, заходим на официальный сайт — Notepad-plus-plus.org — далее ищем ссылку «download», кликаем по ней и выбираем «Notepad++ v*** Installer», где вместо звёздочек будет текущая версия редактора. Скачиваем и устанавливаем, никаких сложностей при установке нет. Чем вообще хорош этот редактор?Notepad++ понимает php и подсвечивает синтаксис языка. Кликабельно Последняя особенность очень важна, например, при редактировании шаблонов движка вашего сайта (напр., WordPress). Почему? Потому что все файлы WP по умолчанию имеют кодировку Utf-8. Если менять их стандартным блокнотом Windows, то к кодировке Utf-8 добавляется специальная BOM-последовательность. Необязательно знать, что это такое, но из-за неё некоторые функции движка работать вообще не будут. Поэтому так важно, чтобы все файлы шаблонов WP были сохранены в кодировке Utf-8 без BOM. Преобразование в кодировку Utf-8 без BOM Теперь, чтобы открыть текстовый файл данным редактором, надо кликнуть по нему правой кнопкой мышки и выбрать соответствующий пункт меню: Таким образом, установив на свой компьютер программу Notepad++ можно получить многофункциональный редактор текста с подсветкой синтаксиса и возможностью манипуляций с кодировками. Спасибо! Хорошая статья. Утвердился в том, чтобы преобразовывать всегда на «без BOM», раньше постоянно мучился: «Что же использовать?». Ещё раз, спасибо. Огромное спасибо. у меня часто не с кодировками а со шрифтами возникают проблемы.открываешь текстовый файл нотепадом скопированный и сохранённый из командной строки, а там крякозябры. потому что шрифт терминал, а у нотепада сегое уи и не как не сохранить этот файл в сегои уи, хотя изменять шрифт в нотепад можно и читать, но сохранить текст в другом шрифте нельзя =-O а где скачать нормальный нотепад. чтобы без виросов всяких? я, а чего вы с официального сайта не качаете? Там же без вирусов. Источник Adblock |
Version: 20220421
By the same author: Virtour.fr — visites virtuelles
Универсальный декодер — конвертер кириллицы
Результат
[Результат перекодировки появится здесь…]
Гостевая книга
Поставьте ссылку на наш сайт! <a href=»https://2cyr.com/decode/»>Универсальный декодер кириллицы</a> |
Custom Work For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites… or write custom functions you can use (invoice available). FAQ and contact information. |
О программе
Здравствуйте! Эта страница может пригодиться, если вам прислали текст (предположительно на кириллице), который отображается в виде странной комбинации загадочных символов. Программа попытается угадать кодировку, а если не получится, покажет примеры всех комбинаций кодировок, чтобы вы могли выбрать подходящую.
Использование
- Скопируйте текст в большое текстовое поле дешифратора. Несколько первых слов будут проанализированы, поэтому желательно, чтобы в них содержалась (закодированная) кириллица.
- Программа попытается декодировать текст и выведет результат в нижнее поле.
- В случае удачной перекодировки вы увидите текст в кириллице, который можно при необходимости скопировать и сохранить.
- В случае неудачной перекодировки (текст не в кириллице, состоящий из тех же или других нечитаемых символов) можно выбрать из нового выпадающего списка вариант в кириллице (если их несколько, выбирайте самый длинный). Нажав OK вы получите корректный перекодированный текст.
- Если текст перекодирован лишь частично, попробуйте выбрать другие варианты кириллицы из выпадающего списка.
Ограничения
- Если текст состоит из вопросительных знаков («???? ?? ??????»), то проблема скорее всего на стороне отправителя и восстановить текст не получится. Попросите отправителя послать текст заново, желательно в формате простого текстового файла или в документе LibreOffice/OpenOffice/MSOffice.
- Не любой текст может быть гарантированно декодирован, даже если есть вы уверены на 100%, что он написан в кириллице.
- Анализируемый и декодированный тексты ограничены размером в 100 Кб.
- Программа не всегда дает стопроцентную точность: при перекодировке из одной кодовой страницы в другую могут пропасть некоторые символы, такие как болгарские кавычки, реже отдельные буквы и т.п.
- Программа проверяет максимум 7245 вариантов из двух и трех перекодировок: если имело место многократное перекодирование вроде koi8(utf(cp1251(utf))), оно не будет распознано или проверено. Обычно возможные и отображаемые верные варианты находятся между 32 и 255.
- Если части текста закодированы в разных кодировках, программа сможет распознать только одну часть за раз.
Условия использования
Пожалуйста, обратите внимание на то, что данная бесплатная программа создана с надеждой, что она будет полезна, но без каких-либо явных или косвенных гарантий пригодности для любого практического использования. Вы можете пользоваться ей на свой страх и риск.
Если вы используете для перекодировки очень длинный текст, убедитесь, что имеется его резервная копия.
Переводчики
Русский (Russian) : chAlx ; Пётр Васильев (http://yonyonson.livejournal.com/)
Страница подготовки переводов на другие языки находится тут.
Что нового
October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.
На английской версии страницы доступен changelog программы.
Вернуться к кириллической виртуальной клавиатуре.
Программа позволяет перекодировать текстовые файлы из кодировки UTF-8 в кодировку Windows-1251, а также добавлять маркер UTF-8, если его нет. | Автор статьи: romix | Редакторы: Последняя редакция №3 от 03.07.07 | История URL: http://kb.mista.ru/article.php?id=481 |
Ключевые слова: кодировка, utf-8, windows-1251, windows
http://x-romix.narod.ru/UTF8_1251.rar
(скачивать ЛЕВОЙ кнопкой мыши, 24К)
Пример вызова:
utf8_1251.exe test_utf8.xml test.xml
Программа изменяет объявление кодировки в первой строке XML.
Перекодирование из Windows-1251 в UTF-8
Перекодирует XML-файл из кодировки Windows-1251 в UTF8.
Если файл уже в кодировке UTF8, то он остается как есть.
Если файл не содержит маркера кодировки UTF8, то добавляет его.
Вызов win1251_utf8.exe Файл1.xml Файл2.xml
Добавление маркера в UTF-8
Используйте ту же самую программу win1251_utf8.exe для добавления маркера UTF-8.
Если кодировка уже была UTF-8, и был маркер, то файл не изменится.
smaharbA пишет:
9 — 28.02.07 — 21:52
//******************************************* Процедура Сформировать() Стрим = СоздатьОбъект("Adodb.Stream"); Стрим.Type = 2; Стрим.Mode= 3; Стрим.charset="utf-16"; //Стрим.charset="windows-1251"; Стрим.Open(); Стрим.WriteText("Проверочка"); Стрим.SaveToFile("c:unicode.txt",2); Стрим.Close(); Стрим.charset="koi8-r"; Стрим.Open(); Стрим.WriteText("Проверочка"); Стрим.Close(); Стрим.charset="utf-8"; Стрим.Open(); Стрим.WriteText("Проверочка"); Стрим.SaveToFile("c:utf-8.txt",2); Стрим.Close(); КонецПроцедуры
Программы — Кодировки
Аналоги платных |
Наша рекомендация |
Случайная программа
★★★★★
ANSI2Uni
| Windows | 13 Kb | домашняя страница | скачать у нас |
Freeware
Массовая конвертация html и текстовых файлов из кодировки ANSI в UTF-8 (Unicode).
Пакетное преобразование файлов по папкам, но не по подкаталогам.
Поддерживает следующие перекодировки из ANSI в Unicode.
- ANSI
- 1251 (Windows)
- 866 (DOS, OEM)
- 1250
- 1252
- Unicode:
- UTF8
- Unicode (little-endian)
- Unicode (big-endian)
- UTF-8 (no BOM)
★★★★☆
Polyglot 3000
| Windows-64 | 2.25 Mb | домашняя страница | скачать |
Freeware
Автоматический определитель языка, распознает более 400 языков.
Punto Switcher
| Windows/Mac OS | 8.4 Mb | домашняя страница | скачать у нас |
Собственник: Яндекс, надежные сайт.
Freeware
Автоматический переключатель клавиатуры с русского на английский и обратно, можно отключить его действие в определенных программах, или не исправлять аббревиатуры.
Простым нажатием клавиши Break можно отключить или вернуть переключение языка.
Горячие клавиши
- Alt+Break — переключение РЕГИСТРА,
- Alt+Scroll Lock — транслитерация выделенного текста — transliteratciia vy`delennogo teksta,
- Shift+Break — смена раскладки выделенного текста — cvtyf hfcrkflrb dsltktyyjuj ntrcnf,
и т.д. можно задать и другие, например преобразовать числа в текст.
Кроме этого, можно задать автоисправление двух заглавных вначале слова (частая ошибка), или ставить запятую по двойному пробелу.
Автозамена
Мне очень нравится эта функция. Вводим текст, который нам приходится вводить часто и задаем набор текста — кода.
Например. мне часто требуется вводить мой адрес, задаю адр и ввожу в программу полный адрес.
И где мне нужно, я просто печатаю адр+Break и получаю Рязанская обл. г. Москва, пр. им. улицы, дом. 100 кв. 200.
Можно задать email, номер телефона, фрагмент кода …
★★★★☆
TCode
| Windows | 325 Kb | домашняя страница | скачать |
Freeware
Перекодировщик (DOS, Windows, KOI-8, ISO 8859-5) с полностью автоматическим распознаванием и восстановлением многократно перекодированных текстов (до 8-ми кратных), поддерживается Base64, QP, HTML, RTF, UTF-8.
★★★★★
Unicode2Ansi v2.0
| Windows | 130 Kb | домашняя страница | скачать | скачать у нас |
Freeware
Массовая конвертация html и текстовых файлов из кодировки UTF-8 (Unicode) в ANSI.
Пакетное преобразование файлов включая поиск по подкаталогам и подпапкам из Юникода в Анси.
Поддерживает следующие перекодировки из Unicode в ANSI:
- Unicode:
- UTF7
- UTF8
- Unicode (little-endian)
- Unicode (big-endian)
- UTF-8 (no BOM)
- ANSI
- 1251 (Windows)
- 866 (DOS, OEM)
- 1250
- 1252
★★★★☆
Штирлиц 4
| Windows | 576 Kb | скачать у нас |
Adware
Распознает кодировку, а также перекодирует текст.
★★★★☆
CarambaSwitcher
| Windows | 3 Mb | домашняя страница | скачать |
надежные сайт.
Freeware
Принципиально новый, умный автоматический переключатель клавиатуры.
В свое время им был создан Punto Switcher и продан Яндексу, который сегодня стал мегапопулярен и вряд ли нуждается в представлении.
Сегодня авторы вернулись к этой идее, но не к старому коду.
Все, кто пользуется Punto, знают, что периодически Punto переключат там, где это не надо. Скажем, мы вводим пароль, а он переключат на русский, потому что это не по английски. Или мы вводим аббревиатуру, имя …
Программа предугадывает, чем вы занимаетесь и будет ли уместно переключение клавиатуры.
Пока выходят первые, сырые версии. Мне недостает автозамены, которые здесь отсутствуют и как минимум, пока не планируются.
Bulk Barcode Generator 1.0
Бесплатная программа, которая предназначена для пакетной генерации штрих-кодов, содержащих различные простые тексты. Особенность программы заключается в том, что преобразование выполняется полностью в автономном режиме. Поддерживается кодировка Code 39…
get_app78 | Бесплатная |
Punto Switcher 4.4.4.489
Punto Switcher — нужная программа, которая автоматически исправит текст, набранный не в той раскладке. Бывает, что вместо «скачать» пишем «crfxfnm» или «Цштвщцы» вместо «Windows». Теперь не нужно набирать новый текст, смена раскладки произойдет автоматом…
get_app1 021 473 | Бесплатная |
Caramba Switcher 2022.03.29
Бесплатный автоматический переключатель раскладки клавиатуры от создателя Punto Switcher. Приложение очень простое в эксплуатации и содержит минимум настроек, умеет определять язык редактируемого текста и не досаждает ошибочными автопереключениями…
get_app5 766 | Бесплатная |
LangOver 5.8.2.0
LangOver — полезная утилита, которая автоматически исправляет текст, набранный в неверной раскладке клавиатуры. Кроме того программа позволяет изменять регистр букв (с верхнего на нижний и наоборот), реверсировать текст…
get_app4 223 | Бесплатная |
Alt SwitchER 16.17
Простая в использовании программа для перевода текста в другую раскладку, изменения регистра символов, транслитерации, сохранения истории буфера обмена, шифрования файлов, перевода чисел в разные системы счисления и др. Приложение не требует установки…
get_app1 232 | Бесплатная |
Число прописью 2.45
Число прописью — программа для перевода числа в текст, пишет число прописью. Возможности: длина числа до 15 цифр, 2 формата вывода: числовой и денежный, 3 вида валюты: рубли, доллары, евро….
get_app26 201 | Бесплатная |
Переименование файлов на Транслит 3.3
Переименование файлов на Транслит — крохотная программа для перевода имен файлов с русского языка в файлы с транслитовскими именами (Translit), которые допустимы для задания имён файлов Интернет сайта…
get_app17 636 | Бесплатная |
NI Transliterator 2.10
NI Transliterator — программа для перевода текстов с транслита на русский и обратно…
get_app5 237 | Бесплатная |
Alternate QR Code Generator 1.760
Alternate QR Code Generator — простенький генератор QR-кодов для быстрого считывания информации мобильными устройствами…
get_app2 121 | Бесплатная |
Key Switcher 2.7
Key Switcher — удобная программа, предназначенная для автоматического переключения раскладки клавиатуры при наборе текста, а также автоматического исправления ошибочно набранного не в той языковой раскладке текста…
get_app11 347 | Бесплатная |
My QR Code Generator 1.20
My QR Code Generator — простой портативный генератор QR-кодов для удобного и быстрого доступа к нужной информации с мобильных устройств…
get_app9 971 | Бесплатная |
Штирлиц 4.01
Штирлиц — Программа расшифровывает русские тексты, написанные в различных русских кодировках (Win-1251, KOI-8r, DOS, ISO-8859-5, MAC и др.), в транслитерации, в форматах Quoted Printable, UTF-7, UTF-8, RTF, HTML, закодированные с помощью uuencode, xxencod…
get_app279 080 | Бесплатная |
TranslitePro 1.1.1.190
TranslitePro — программа для транслита Русского и Украинского языка в Английский, Немецкий и Французский. Поддерживает траслит по госстандарту, предлагает несколько вариантов замены пробелов и запись суммы прописью…
get_app789 | Бесплатная |
Zint Barcode Studio 2.5
Zint Barcode Studio — бесплатный генератор штрих-кодов. Процесс генерации осуществляется в режиме реального времени, т.е. по мере набора последовательности символов, которые требуется закодировать. Присутствует поддержка более 50 символик…
get_app14 806 | Бесплатная |
Мультиязычный конвертер символов шрифта Брайля 1.1.0
Мультиязычный конвертер символов шрифта Брайля позволяет легко и быстро осуществить как перевод кириллицы (латиницы) в символы шрифта Брайля, так и наоборот: символы шрифта Брайля в кириллицу (латиницу)…
get_app1 651 | Бесплатная |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 |
Public Function UTF8ToWin(sUTF As String) As String Const CP_UTF8 = 65001 Dim i&, s$ If Len(sUTF) = 0 Then Exit Function i& = MultiByteToWideChar(CP_UTF8, 0&, sUTF, &HFFFF, s, 0) If i <> 0 Then s = String$(i * 2, 0&) Call MultiByteToWideChar(CP_UTF8, 0&, sUTF, &HFFFF, s, i) s = StrConv(s, vbFromUnicode) s = Replace(s, "<br>", vbLf, 1, -1, vbTextCompare) s = Replace(s, "<p>", "", 1, -1, vbTextCompare) UTF8ToWin = s End If End Function Public Function DecodeUTF8(ByVal sInput As String) As String Dim iStrSize As Long, lMaxSize As Long, str1 As String Dim p As Long Dim str2 As String If Len(sInput) = 0 Then Exit Function lMaxSize = Len(sInput) * 2 str1 = String$(lMaxSize, 0&) iStrSize = MultiByteToWideChar(65001, 0&, sInput, &HFFFF, StrPtr(str1), lMaxSize) If iStrSize > 0 Then DecodeUTF8 = Left$(str1, iStrSize - 1) Else DecodeUTF8 = sInput End If End Function Function DecodeUTF81(ByVal sInput) As String Dim iCharPos, iCharCode Dim iLoByteCounter, iLoByteCount, iLoCharCode Dim iInputLen: iInputLen = Len(sInput) ReDim aUnicode(iInputLen) For iCharPos = 1 To iInputLen aUnicode(iCharPos) = Mid(sInput, iCharPos, 1) iCharCode = Asc(aUnicode(iCharPos)) If (iCharCode > 191) Then If (iCharCode < 224) Then '110xxxxx prefix for 2 bytes unicode iCharCode = iCharCode And 31 'remove the 3 bit two bytes prefix iLoByteCount = 1 ElseIf (iCharCode < 240) Then '1110xxxx prefix for 3 bytes unicode iCharCode = iCharCode And 15 'remove the 4 bit three bytes prefix iLoByteCount = 2 ElseIf (iCharCode < 248) Then '11110xxx prefix for 4 bytes unicode iCharCode = iCharCode And 7 'remove the 5 bit four bytes prefix iLoByteCount = 3 ElseIf (iCharCode < 252) Then '111110xx prefix for 5 bytes unicode iCharCode = iCharCode And 3 'remove the 6 bit five bytes prefix iLoByteCount = 4 Else '1111110x prefix for 6 bytes unicode iCharCode = iCharCode And 1 'remove the 7 bit six bytes prefix iLoByteCount = 5 End If For iLoByteCounter = 1 To iLoByteCount iLoCharCode = Asc(Mid(sInput, iCharPos + iLoByteCounter, 1)) 'the next byte 'сдвиг влево на 6 битов + 6 младших битов следующего символа iCharCode = iCharCode * 64 + (iLoCharCode And 63) Next aUnicode(iCharPos) = ChrW(iCharCode) iCharPos = iCharPos + iLoByteCount End If Next DecodeUTF81 = Join(aUnicode, "") End Function |
Декодер онлайн (decoder online)
Текст успешно скопирован!
Определить исходную кодировку
Привет, друзья. Я уже 3 года работаю с вебом, но с таким не встречался еще. В чем суть:
Есть у меня кириллический текст с кодировкой UTF-8 и отображается он нормально.
Мне нужно изменить кодировку на windows-1251 так, чтобы кириллический текст так же нормально читабельно отображался. И вот что-то ну вообще не могу взять в толк, как это сделать?
-
Вопрос заданболее трёх лет назад
-
22334 просмотра
Пригласить эксперта
для большого количества файлов есть однострочник на powershell:
Get-ChildItem folderwithfiles -File | foreach {Get-Content $_.fullname -Encoding UTF8 | Out-File folderwithconvertedfiles$_ -encoding default}
Одна загвоздка : encoding default — берет кодировку системы.
Проверить что это windows 1251 можно так(powershell) :[System.Text.Encoding]::Default.Codepage
Вы имеете в виду, самостоятельно, а не в программном коде? Тогда с помощью Вашего текстового редактора, которым Вы пользуетесь. Например, если Вы предпочитаете Sublime Text, то просто воспользуйтесь пунктом меню File->Save with encoding > Cyrillic (Windows 1251)
-
Показать ещё
Загружается…
07 февр. 2023, в 23:29
3000 руб./за проект
07 февр. 2023, в 23:29
51000 руб./за проект
07 февр. 2023, в 23:02
2000 руб./за проект