Codificador e Decodificador de Entidades HTML

Cole texto para codificar caracteres especiais como entidades HTML, ou cole HTML com entidades para decodificá-las de volta em texto legível. Escolha entre entidades nomeadas (&, <, ©), numéricas decimais (©) ou hexadecimais (©). Opcionalmente, codifique todos os caracteres não-ASCII para máxima compatibilidade.

Codificar todos os não-ASCII

Texto de entrada

Saída codificada

Como funciona

O que são entidades HTML?

Entidades HTML são códigos de texto especiais usados para representar caracteres que têm significado especial em HTML ou que não podem ser digitados diretamente. Os mais importantes são os cinco caracteres reservados na sintaxe HTML: & (e comercial) → &, < (menor que) → <, > (maior que) → >, " (aspas duplas) → " e ' (apóstrofo) → '. Se esses caracteres aparecerem no conteúdo de texto sem codificação, o navegador pode interpretá-los como marcação HTML, causando erros de renderização ou vulnerabilidades de segurança.

Entidades HTML existem em três formatos: entidades nomeadas usam um nome descritivo (© para ©, € para €), referências numéricas decimais de caracteres usam um número de ponto de código (© para ©), e referências hexadecimais de caracteres usam um código hex (© para ©). Os três formatos são equivalentes — o navegador renderiza o mesmo caractere independentemente do formato usado. Entidades nomeadas são as mais legíveis; entidades numéricas são as mais universais pois funcionam para qualquer caractere Unicode.

Quando codificar entidades HTML

Você deve codificar no mínimo os cinco caracteres HTML reservados (&, <, >, ", ') sempre que aparecerem em conteúdo de texto ou valores de atributos. Deixar de codificá-los é uma fonte de vulnerabilidades de Cross-Site Scripting (XSS): se a entrada do usuário for inserida em HTML sem codificação, um invasor pode injetar tags de script ou manipuladores de eventos. Frameworks modernos como React, Vue e Angular codificam HTML automaticamente por padrão — innerHTML é a principal exceção onde a codificação manual ainda é crítica.

Além dos cinco obrigatórios, você também pode querer codificar caracteres não-ASCII para ambientes que não lidam de forma confiável com UTF-8: HTML de e-mail, sistemas CMS legados ou documentos para máxima compatibilidade. A opção «Codificar todos os não-ASCII» converte cada caractere acima do ponto de código 127 em uma entidade numérica, garantindo que a saída seja ASCII puro enquanto preserva a aparência visual quando renderizada. Para arquivos HTML UTF-8 modernos, codificar não-ASCII é opcional — declarar o charset corretamente é suficiente.

Entidades HTML vs codificação de URL vs Base64

Entidades HTML, codificação de URL (codificação percentual) e Base64 são três esquemas de codificação diferentes para contextos distintos. Entidades HTML (como &) são usadas dentro de documentos HTML para representar caracteres com segurança. Codificação de URL (como %26 para &) é usada em strings de consulta e URLs para codificar caracteres com significado especial em uma URL. Base64 codifica dados binários arbitrários como texto ASCII, usado para URIs de dados e anexos de e-mail.

Um erro comum é misturá-los: codificar em URL conteúdo HTML ou codificar em HTML URLs. Por exemplo, um e comercial em uma string de consulta de URL precisa de codificação percentual (%26), não de codificação de entidade HTML (&). Se você construir uma URL que depois é incorporada em um atributo HTML, você precisa de ambas: a forma codificada em URL vai no atributo, e o valor do atributo em si é codificado em HTML. Entender qual codificação se aplica em qual contexto evita bugs de dupla codificação e problemas de segurança.

Perguntas frequentes

›Qual é a entidade HTML para o e comercial (&)?

A entidade HTML para o e comercial é & — literalmente os caracteres &, a, m, p e ponto e vírgula. Quando você escreve & no código-fonte HTML, o navegador exibe um único caractere &. Essa codificação é obrigatória sempre que um e comercial aparece no conteúdo de texto ou valores de atributos, porque um & não codificado inicia uma sequência de entidade que o analisador tenta interpretar.

›Qual é a entidade HTML para copyright (©)?

O copyright © tem três entidades HTML equivalentes: a nomeada ©, a numérica decimal © e a hexadecimal ©. Todas renderizam o mesmo caractere ©. Entidades nomeadas são a opção mais legível quando disponíveis. Para HTML UTF-8 moderno, você também pode digitar o caractere © diretamente — sem entidade — desde que seu arquivo HTML declare charset=utf-8.

›Preciso codificar aspas em HTML?

Aspas duplas (") devem ser codificadas como " dentro de atributos HTML delimitados por aspas duplas: <input value=""">. Aspas simples (') devem ser codificadas como ' ou ' dentro de atributos com aspas simples. Dentro do conteúdo de texto de elementos (entre tags), ambos os caracteres de aspas podem aparecer sem codificação, mas codificá-los não causa dano. Codificar ambos de forma consistente em todos os contextos é a abordagem mais segura.

›Qual é a diferença entre entidades nomeadas e numéricas?

Entidades nomeadas usam uma palavra descritiva (©, €, &hearts;) e são definidas na especificação HTML — nem todo caractere Unicode tem uma entidade nomeada. Entidades numéricas usam o ponto de código Unicode, seja em decimal (€ para €) ou hexadecimal (€ para €). Entidades numéricas funcionam para qualquer caractere Unicode, enquanto nomeadas cobrem apenas um subconjunto. Ambas são renderizadas de forma idêntica nos navegadores.

›Devo codificar caracteres não-ASCII em HTML?

Geralmente não. Se seu documento HTML declara codificação UTF-8 (meta charset=utf-8) e está salvo como UTF-8, você pode escrever caracteres não-ASCII diretamente: é, ñ, 中, 🎉. Codificá-los como entidades é opcional e torna o código-fonte mais difícil de ler. A exceção é quando se envia HTML em contextos que podem não preservar a codificação: mensagens de e-mail, APIs legadas ou sistemas que corrompem bytes não-ASCII. Nesses casos, codificar todos os não-ASCII como entidades numéricas garante que a saída seja ASCII puro e seguro.

›O que é XSS e como as entidades HTML o previnem?

Cross-Site Scripting (XSS) é uma vulnerabilidade de segurança onde um invasor injeta JavaScript malicioso em uma página web inserindo texto que o servidor reflete em HTML sem codificação. Por exemplo, se a entrada do usuário <script>alert('xss')</script> for inserida diretamente em uma página, o navegador executa o script. Se você codificar corretamente a entrada — convertendo < em < e > em > — o navegador exibe o texto literalmente em vez de analisá-lo como uma tag. A codificação de entidades HTML é a principal defesa contra XSS refletido e armazenado.

›Por que   não aparece na lista desta ferramenta?

Esta ferramenta codifica caracteres que têm entidades nomeadas. O espaço não separável (Unicode U+00A0) é codificado como   quando você digita o caractere de espaço não separável real (que você pode inserir com Alt+Espaço em alguns sistemas ou copiar de mapas de caracteres). O espaço regular (U+0020, a barra de espaço) não é codificado porque é um caractere ASCII seguro. Se você precisar especificamente de   na saída, digite ou cole um caractere de espaço não separável na entrada.

›Posso usar isso para prevenir injeção HTML na entrada do usuário?

Sim — codificar o texto fornecido pelo usuário antes de inseri-lo em HTML é uma das defesas principais contra injeção HTML e XSS. No mínimo, codifique os cinco caracteres reservados: &, <, >, ", '. Esta ferramenta codifica todos os cinco. No entanto, a codificação sozinha não é uma solução de segurança completa: você também precisa de cabeçalhos Content Security Policy adequados, tratamento cuidadoso de URLs javascript: em atributos e proteções no nível do framework. Para aplicações em produção, use uma biblioteca do lado do servidor projetada para segurança (OWASP Java Encoder, DOMPurify para o lado do cliente, etc.) em vez de codificação manual.

Ferramentas relacionadas

Última atualização: 2026-05-18

Experimente nossos prompts de IA →