Encodeur et Décodeur d'Entités HTML

Collez du texte pour encoder les caractères spéciaux en entités HTML, ou collez du HTML avec des entités pour les décoder en texte lisible. Choisissez entre les entités nommées (&, <, ©), numériques décimales (©) ou hexadécimales (©). Encodez optionnellement tous les caractères non-ASCII pour une compatibilité maximale.

Encoder tous les caractères non-ASCII

Texte d'entrée

Sortie encodée

Fonctionnement

Que sont les entités HTML ?

Les entités HTML sont des codes texte spéciaux représentant des caractères qui ont une signification particulière en HTML ou qui ne peuvent pas être saisis directement. Les plus importantes sont les cinq caractères réservés dans la syntaxe HTML : & (esperluette) → &, < (inférieur à) → <, > (supérieur à) → >, " (guillemet double) → " et ' (apostrophe) → '. Si ces caractères apparaissent dans du contenu textuel sans encodage, le navigateur peut les interpréter comme du balisage HTML, provoquant des erreurs de rendu ou des failles de sécurité.

Les entités HTML se déclinent en trois formats : les entités nommées utilisent un nom descriptif (© pour ©, € pour €), les références numériques décimales de caractères utilisent un numéro de point de code (© pour ©), et les références hexadécimales utilisent un code hex (© pour ©). Les trois formats sont équivalents — le navigateur affiche le même caractère quel que soit le format utilisé. Les entités nommées sont les plus lisibles ; les entités numériques sont les plus universelles car elles fonctionnent pour n'importe quel caractère Unicode.

Quand encoder les entités HTML

Vous devez encoder au minimum les cinq caractères HTML réservés (&, <, >, ", ') chaque fois qu'ils apparaissent dans du contenu textuel ou des valeurs d'attributs. Ne pas les encoder est une source de vulnérabilités Cross-Site Scripting (XSS) : si l'entrée utilisateur est insérée dans du HTML sans encodage, un attaquant peut injecter des balises script ou des gestionnaires d'événements. Les frameworks modernes comme React, Vue et Angular encodent automatiquement HTML par défaut — innerHTML est la principale exception où l'encodage manuel reste critique.

Au-delà des cinq caractères requis, vous souhaiterez peut-être aussi encoder les caractères non-ASCII pour les environnements qui ne gèrent pas fiablement UTF-8 : HTML d'e-mail, systèmes CMS anciens ou documents nécessitant une compatibilité maximale. L'option «Encoder tous les non-ASCII» convertit chaque caractère au-dessus du point de code 127 en entité numérique, garantissant que la sortie est du pur ASCII tout en préservant l'apparence visuelle au rendu. Pour les fichiers HTML UTF-8 modernes, encoder les non-ASCII est optionnel — déclarer correctement le charset est suffisant.

Entités HTML vs encodage d'URL vs Base64

Les entités HTML, l'encodage d'URL (encodage en pourcentage) et Base64 sont trois schémas d'encodage différents pour des contextes distincts. Les entités HTML (comme &) sont utilisées dans les documents HTML pour représenter des caractères en toute sécurité. L'encodage d'URL (comme %26 pour &) est utilisé dans les chaînes de requête et les URLs pour encoder les caractères ayant une signification spéciale dans une URL. Base64 encode des données binaires arbitraires en texte ASCII, utilisé pour les URIs de données et les pièces jointes d'e-mail.

Une erreur courante consiste à les confondre : encoder en URL du contenu HTML ou encoder en HTML des URLs. Par exemple, une esperluette dans une chaîne de requête URL nécessite un encodage en pourcentage (%26), pas un encodage d'entité HTML (&). Si vous construisez une URL qui sera ensuite intégrée dans un attribut HTML, vous avez besoin des deux : la forme encodée en URL va dans l'attribut, et la valeur de l'attribut elle-même est encodée en HTML. Comprendre quel encodage s'applique dans quel contexte évite les bugs de double encodage et les problèmes de sécurité.

Questions fréquentes

›Quelle est l'entité HTML pour l'esperluette (&) ?

L'entité HTML pour l'esperluette est & — littéralement les caractères &, a, m, p et point-virgule. Lorsque vous écrivez & dans le code source HTML, le navigateur affiche un seul caractère &. Cet encodage est obligatoire dès qu'une esperluette apparaît dans du contenu textuel ou des valeurs d'attributs, car un & non encodé commence une séquence d'entité que l'analyseur tente d'interpréter.

›Quelle est l'entité HTML pour le copyright (©) ?

Le copyright © possède trois entités HTML équivalentes : la nommée ©, la numérique décimale © et l'hexadécimale ©. Toutes affichent le même caractère ©. Les entités nommées sont l'option la plus lisible lorsqu'elles sont disponibles. Pour le HTML UTF-8 moderne, vous pouvez aussi taper le caractère © directement — sans entité — tant que votre fichier HTML déclare charset=utf-8.

›Dois-je encoder les guillemets en HTML ?

Les guillemets doubles (") doivent être encodés en " dans les attributs HTML délimités par des guillemets doubles : <input value=""">. Les guillemets simples (') doivent être encodés en ' ou ' dans les attributs à guillemets simples. Dans le contenu textuel des éléments (entre balises), les deux types de guillemets peuvent apparaître sans encodage, mais les encoder est sans danger. Encoder les deux de façon cohérente dans tous les contextes est l'approche la plus sûre.

›Quelle est la différence entre entités nommées et numériques ?

Les entités nommées utilisent un mot descriptif (©, €, &hearts;) et sont définies dans la spécification HTML — tous les caractères Unicode n'ont pas d'entité nommée. Les entités numériques utilisent le point de code Unicode, soit en décimal (€ pour €) soit en hexadécimal (€ pour €). Les entités numériques fonctionnent pour n'importe quel caractère Unicode, tandis que les nommées ne couvrent qu'un sous-ensemble. Les deux sont rendus de façon identique dans les navigateurs.

›Dois-je encoder les caractères non-ASCII en HTML ?

Généralement non. Si votre document HTML déclare l'encodage UTF-8 (meta charset=utf-8) et est enregistré en UTF-8, vous pouvez écrire des caractères non-ASCII directement : é, ñ, 中, 🎉. Les encoder en entités est optionnel et rend le code source plus difficile à lire. L'exception concerne l'envoi de HTML dans des contextes qui peuvent ne pas préserver l'encodage : messages e-mail, API anciennes ou systèmes qui altèrent les octets non-ASCII. Dans ces cas, encoder tous les non-ASCII en entités numériques garantit une sortie en pur ASCII sécurisé.

›Qu'est-ce que XSS et comment les entités HTML le préviennent-elles ?

Le Cross-Site Scripting (XSS) est une faille de sécurité où un attaquant injecte du JavaScript malveillant dans une page web en insérant du texte que le serveur reflète dans HTML sans encodage. Par exemple, si l'entrée utilisateur <script>alert('xss')</script> est insérée directement dans une page, le navigateur exécute le script. Si vous encodez correctement l'entrée — en convertissant < en < et > en > — le navigateur affiche le texte littéralement plutôt que de l'analyser comme une balise. L'encodage d'entités HTML est la principale défense contre les XSS réfléchis et stockés.

›Pourquoi   n'apparaît-il pas dans la liste de cet outil ?

Cet outil encode les caractères qui ont des entités nommées. L'espace insécable (Unicode U+00A0) est encodé en   lorsque vous tapez le caractère d'espace insécable réel (que vous pouvez insérer avec Alt+Espace sur certains systèmes ou copier depuis des tables de caractères). L'espace régulier (U+0020, la barre espace) n'est pas encodé car c'est un caractère ASCII sûr. Si vous avez spécifiquement besoin de   dans votre sortie, saisissez ou collez un espace insécable dans l'entrée.

›Puis-je l'utiliser pour prévenir l'injection HTML dans les entrées utilisateur ?

Oui — encoder le texte fourni par l'utilisateur avant de l'insérer dans HTML est l'une des défenses principales contre l'injection HTML et XSS. Encodez au minimum les cinq caractères réservés : &, <, >, ", '. Cet outil encode les cinq. Cependant, l'encodage seul n'est pas une solution de sécurité complète : vous avez aussi besoin d'en-têtes Content Security Policy appropriés, d'une gestion prudente des URLs javascript: dans les attributs, et de protections au niveau du framework. Pour les applications en production, utilisez une bibliothèque côté serveur conçue pour la sécurité (OWASP Java Encoder, DOMPurify côté client, etc.) plutôt que l'encodage manuel.

Outils similaires

Dernière mise à jour: 2026-05-18

Découvrez nos prompts IA →