Конвертер текста в двоичный код — кодирование и декодирование

Введите любой текст для преобразования в двоичный код (нули и единицы) или вставьте двоичный код для его декодирования обратно в текст. Каждый символ преобразуется с использованием его значения ASCII/Unicode. Выберите вывод с разделением пробелами, переносами строк или непрерывный. Кнопка «Поменять» немедленно обращает последнее преобразование.

Разделитель:ПробелПеренос строкиНет

Входной текст

Двоичный вывод

Как это работает

Как работает преобразование текста в двоичный код

Каждый символ в компьютере хранится как число. Для стандартного ASCII-текста буква «A» — это число 65, «B» — 66, строчная «a» — 97, пробел — 32 и так далее. Для преобразования текста в двоичный код этот инструмент находит числовое значение (кодовую точку ASCII/Unicode) каждого символа и записывает это число в системе счисления с основанием 2 (двоичной), дополненное до 8 цифр. Например: «H» = 72 в десятичной = 01001000 в двоичной, «e» = 101 в десятичной = 01100101 в двоичной, «l» = 108 в десятичной = 01101100 в двоичной.

Обратный процесс (из двоичного в текст) считывает группы из 8 бит, преобразует каждую из двоичной обратно в десятичное число, а затем находит символ с этой кодовой точкой. Если вставить двоичный код, разделённый пробелами (например, 01001000 01100101), инструмент разбивает по пробелам. Если вставить непрерывный двоичный код (например, 0100100001100101), он автоматически группирует в блоки по 8 бит. Каждая группа из 8 бит должна содержать ровно 8 единиц и нулей — иначе инструмент покажет ошибку, указывающую на недопустимый байт.

Двоичный код против шестнадцатеричного в представлении данных

Двоичная система (основание 2) использует только 0 и 1, что делает её наиболее фундаментальным представлением цифровых данных — она напрямую отражает то, как биты хранятся в памяти компьютера. Однако она многословна: один символ ASCII требует 8 цифр. Шестнадцатеричная система (основание 16, цифры 0–9 и A–F) более компактна: каждая шестнадцатеричная цифра представляет ровно 4 двоичных цифры (полубайт), поэтому один байт занимает всего 2 шестнадцатеричные цифры. «H» = 0x48 в шестнадцатеричной против 01001000 в двоичной.

Двоичное представление наиболее полезно, когда нужно видеть или манипулировать отдельными битами — например, проверять флаги в битовой маске, понимать, как кодовые точки Unicode кодируются в байты UTF-8, или анализировать структуры сетевых пакетов на уровне битов. Для большинства задач проверки данных шестнадцатеричная система предлагает хороший баланс между компактностью и читаемостью. Многие отладчики, шестнадцатеричные редакторы и анализаторы протоколов отображают данные в шестнадцатеричном виде, с опциональным двоичным представлением для работы на уровне битов.

За пределами ASCII: Unicode и многобайтовые символы

Стандартный ASCII охватывает только 128 символов (7 бит, коды 0–127), чего достаточно для английского текста, но не для символов с диакритическими знаками, нелатинских алфавитов или эмодзи. Современный текст кодируется в Unicode, определяющем более 140 000 символов. Этот инструмент использует встроенный метод JavaScript charCodeAt(), который возвращает кодовую единицу UTF-16 для каждого символа. Для базовых латинских символов это равно кодовой точке Unicode, которая также совпадает с кодом ASCII.

Для символов не из ASCII, таких как «é» (233), «ñ» (241), «中» (20013) или «😀» (128512, использующий суррогатную пару UTF-16), двоичное представление будет длиннее или разделено иначе. Если нужно двоичное кодирование, соответствующее тому, как UTF-8 реально хранит байты на диске, нужно сначала закодировать строку в UTF-8, а затем преобразовать каждый полученный байт в двоичный код. Для большинства образовательных и головоломочных целей используемый здесь посимвольный подход является стандартным.

Частые вопросы

›Как преобразовать текст в двоичный код?

Каждый символ текста преобразуется в свой числовой код ASCII или Unicode, который затем записывается в двоичном виде (основание 2) с дополнением до 8 бит. Например: «A» = 65 в десятичной = 01000001 в двоичной. «Hello» становится 01001000 01100101 01101100 01101100 01101111. Инструмент выполняет преобразование автоматически — просто введите текст в левое поле с выбранным режимом Text → Binary.

›Как преобразовать двоичный код в текст?

Выберите режим Binary → Text и вставьте двоичную строку. Двоичный код должен быть в 8-битных группах (байтах). При разделении пробелами каждая группа, ограниченная пробелами, — это один байт. При непрерывном вводе (без пробелов) инструмент группирует каждые 8 цифр как один байт. Каждый байт преобразуется из двоичного в число, затем находится соответствующий символ ASCII/Unicode.

›Почему каждая двоичная группа состоит из 8 цифр?

Байт — это 8 бит, и ASCII использует 7-битные коды (0–127). По соглашению коды ASCII хранятся в полном 8-битном байте с ведущим нулём, что делает все записи ровно 8 двоичных цифр. Это делает разбор однозначным: каждые 8 цифр = один символ. Некоторые более старые представления используют 7-битный ASCII (без ведущего нуля), но 8-битное кодирование является современным стандартом.

›Каков двоичный код распространённых символов?

Пробел = 00100000, «A» = 01000001, «a» = 01100001, «0» = 00110000, Enter/перенос строки (LF) = 00001010, точка «.» = 00101110. Закономерность легко заметить: прописные буквы начинаются с 010, строчные — с 011, а цифры — с 0011.

›Может ли инструмент работать с не-английскими символами?

Да, для символов с кодовыми точками Unicode ниже 65 536 (большинство латинских, греческих, кириллических, CJK, арабских, иврит и других символов). Каждый символ преобразуется в свою кодовую точку Unicode в двоичном виде. Однако, поскольку символы выше 127 требуют более 8 бит, они дадут двоичные группы длиннее 8 цифр. Для эмодзи и других символов выше U+FFFF JavaScript разбивает их на суррогатные пары, что может дать неожиданные результаты.

›Что делает кнопка «Поменять»?

«Поменять» берёт текущий вывод (двоичную строку при кодировании или текст при декодировании) и перемещает его в поле ввода, одновременно переключая режим на противоположный. Это позволяет мгновенно проверить двустороннее преобразование: закодируйте текст, нажмите «Поменять» и убедитесь, что получаете исходный текст обратно. Это также удобно для изучения того, что кодируют двоичные строки.

›Двоичный код — это то же самое, что код Морзе?

Нет. Двоичный код использует ровно 8 бит (нули и единицы) для представления каждого символа через его числовое значение ASCII/Unicode. Код Морзе использует точки и тире переменной длины для представления букв и цифр, с последовательностями, основанными на частотности букв в английском языке (распространённые буквы, такие как E и T, имеют более короткие коды). Две системы — это совершенно разные схемы кодирования, хотя обе представляют текст как набор символов.

›Чем двоичный код отличается от Base64?

Двоичный код показывает фактический битовый паттерн каждого символа — «сырые» биты, хранящиеся в памяти. Base64 — это кодирование более высокого уровня, которое преобразует произвольные двоичные данные (любой файл или последовательность байтов) в безопасную строку ASCII-текста с использованием 64 печатаемых символов. Base64 используется, когда нужно встроить двоичные данные в контексты, принимающие только текст (например, вложения электронной почты или URI данных). Двоичное представление служит для визуального анализа битовых паттернов; Base64 — для передачи и хранения данных.