Codificador y Decodificador de Entidades HTML

Pega texto para codificar caracteres especiales como entidades HTML, o pega HTML con entidades para decodificarlos de vuelta a texto legible. Elige entre entidades nombradas (&, <, ©), numéricas decimales (©) o hexadecimales (©). Opcionalmente, codifica todos los caracteres no ASCII para máxima compatibilidad.

Codificar todos los caracteres no ASCII

Texto de entrada

Salida codificada

Cómo funciona

¿Qué son las entidades HTML?

Las entidades HTML son códigos de texto especiales que representan caracteres que tienen un significado especial en HTML o que no se pueden escribir directamente. Las más importantes son los cinco caracteres reservados en la sintaxis HTML: & (ampersand) → &, < (menor que) → <, > (mayor que) → >, " (comilla doble) → " y ' (comilla simple/apóstrofo) → '. Si estos caracteres aparecen en el contenido de texto sin codificar, el navegador puede interpretarlos como marcado HTML, causando errores de representación o vulnerabilidades de seguridad.

Las entidades HTML existen en tres formatos: las entidades nombradas usan un nombre descriptivo (© para ©, € para €), las referencias numéricas decimales de caracteres usan un número de punto de código (© para ©), y las referencias de caracteres hexadecimales usan un código hex (© para ©). Los tres formatos son equivalentes: el navegador renderiza el mismo carácter independientemente del formato utilizado. Las entidades nombradas son las más legibles; las numéricas son las más universales ya que funcionan para cualquier carácter Unicode.

Cuándo codificar entidades HTML

Debes codificar como mínimo los cinco caracteres HTML reservados (&, <, >, ", ') siempre que aparezcan en el contenido de texto o valores de atributos. No codificarlos es una fuente de vulnerabilidades de Cross-Site Scripting (XSS): si la entrada del usuario se inserta en HTML sin codificar, un atacante puede inyectar etiquetas de script o manejadores de eventos. Los frameworks modernos como React, Vue y Angular codifican HTML automáticamente por defecto — innerHTML es la principal excepción donde la codificación manual sigue siendo crítica.

Más allá de los cinco requeridos, también puedes querer codificar caracteres no ASCII para entornos que no manejan UTF-8 de forma confiable: HTML de correo electrónico, sistemas CMS heredados o documentos para máxima compatibilidad. La opción «Codificar todos los no ASCII» convierte cada carácter por encima del punto de código 127 en una entidad numérica, garantizando que la salida sea ASCII puro mientras se preserva la apariencia visual al renderizar. Para archivos HTML UTF-8 modernos, codificar los no ASCII es opcional — declarar el charset correctamente es suficiente.

Entidades HTML vs. codificación de URL vs. Base64

Las entidades HTML, la codificación de URL (codificación porcentual) y Base64 son tres esquemas de codificación diferentes para contextos distintos. Las entidades HTML (como &) se usan dentro de documentos HTML para representar caracteres de forma segura. La codificación de URL (como %26 para &) se usa en cadenas de consulta y URLs para codificar caracteres con significado especial en una URL. Base64 codifica datos binarios arbitrarios como texto ASCII, utilizado para URIs de datos y adjuntos de correo electrónico.

Un error común es mezclarlos: codificar en URL contenido HTML o codificar en HTML URLs. Por ejemplo, un ampersand en una cadena de consulta de URL necesita codificación porcentual (%26), no codificación de entidad HTML (&). Si construyes una URL que luego se incrusta en un atributo HTML, necesitas ambas: la forma codificada en URL va en el atributo, y el valor del atributo en sí se codifica en HTML. Entender qué codificación aplica en qué contexto evita errores de doble codificación y problemas de seguridad.

Preguntas frecuentes

›¿Cuál es la entidad HTML para el ampersand (&)?

La entidad HTML para el ampersand es & — literalmente los caracteres &, a, m, p y punto y coma. Cuando escribes & en el código fuente HTML, el navegador muestra un único carácter &. Esta codificación es obligatoria cuando un ampersand aparece en contenido de texto o valores de atributos, porque un & sin codificar inicia una secuencia de entidad que el analizador intenta interpretar.

›¿Cuál es la entidad HTML para el copyright (©)?

El copyright © tiene tres entidades HTML equivalentes: la nombrada ©, la numérica decimal © y la hexadecimal ©. Todas renderizan el mismo carácter ©. Las entidades nombradas son la opción más legible cuando están disponibles. Para HTML UTF-8 moderno, también puedes escribir el carácter © directamente — sin necesidad de entidad — siempre que tu archivo HTML declare charset=utf-8.

›¿Necesito codificar las comillas en HTML?

Las comillas dobles (") deben codificarse como " dentro de atributos HTML delimitados por comillas dobles: <input value=""">. Las comillas simples (') deben codificarse como ' o ' dentro de atributos con comillas simples. Dentro del contenido de texto de los elementos (entre etiquetas), ambos caracteres de comillas pueden aparecer sin codificar, pero codificarlos no causa daño. Codificar ambos de manera consistente en todos los contextos es el enfoque más seguro.

›¿Cuál es la diferencia entre entidades nombradas y numéricas?

Las entidades nombradas usan una palabra descriptiva (©, €, &hearts;) y están definidas en la especificación HTML — no todos los caracteres Unicode tienen una entidad nombrada. Las entidades numéricas usan el punto de código Unicode, ya sea en decimal (€ para €) o hexadecimal (€ para €). Las entidades numéricas funcionan para cualquier carácter Unicode, mientras que las nombradas solo cubren un subconjunto. Ambas se renderizan de forma idéntica en los navegadores.

›¿Debo codificar los caracteres no ASCII en HTML?

Generalmente no. Si tu documento HTML declara codificación UTF-8 (meta charset=utf-8) y está guardado como UTF-8, puedes escribir caracteres no ASCII directamente: é, ñ, 中, 🎉. Codificarlos como entidades es opcional y hace el código fuente más difícil de leer. La excepción es cuando se envía HTML en contextos que pueden no preservar la codificación: mensajes de correo, APIs heredadas o sistemas que dañan los bytes no ASCII. En esos casos, codificar todos los no ASCII como entidades numéricas garantiza que la salida sea ASCII puro y seguro.

›¿Qué es XSS y cómo lo previenen las entidades HTML?

El Cross-Site Scripting (XSS) es una vulnerabilidad de seguridad en la que un atacante inyecta JavaScript malicioso en una página web insertando texto que el servidor refleja en HTML sin codificar. Por ejemplo, si la entrada del usuario <script>alert('xss')</script> se inserta directamente en una página, el navegador ejecuta el script. Si codificas correctamente la entrada — convirtiendo < en < y > en > — el navegador muestra el texto literalmente en lugar de analizarlo como una etiqueta. La codificación de entidades HTML es la defensa principal contra XSS reflejado y almacenado.

›¿Por qué   no aparece en la lista de esta herramienta?

Esta herramienta codifica caracteres que tienen entidades nombradas. El espacio de no separación (Unicode U+00A0) se codifica como   cuando escribes el carácter de espacio de no separación real (que puedes insertar con Alt+Espacio en algunos sistemas o copiar de mapas de caracteres). El espacio regular (U+0020, la barra espaciadora) no se codifica porque es un carácter ASCII seguro. Si necesitas específicamente   en tu salida, escribe o pega un carácter de espacio de no separación en la entrada.

›¿Puedo usar esto para prevenir inyección HTML en la entrada del usuario?

Sí — codificar el texto proporcionado por el usuario antes de insertarlo en HTML es una de las defensas principales contra la inyección HTML y XSS. Como mínimo, codifica los cinco caracteres reservados: &, <, >, ", '. Esta herramienta codifica los cinco. Sin embargo, la codificación sola no es una solución de seguridad completa: también necesitas encabezados adecuados de Content Security Policy, manejo cuidadoso de URLs javascript: en atributos y protecciones a nivel de framework. Para aplicaciones en producción, usa una biblioteca del lado del servidor diseñada para seguridad (OWASP Java Encoder, DOMPurify del lado del cliente, etc.) en lugar de codificación manual.

Herramientas relacionadas

Última actualización: 2026-05-18

Ver nuestros prompts AI →