Un fichier d'extension .htm ou .html peut être déclaré HTML ou XHTML.
Un fichier déclaré XHTML est un document XML (Langage de balisage extensible). Un fichier déclaré HTML est un document SGML (Langage normalisé de balisage généralisé).
SGML et XML sont des langages formels de description de langages de programmation (métalangages) utilisant des balises.
Le HTML, langage SGML libre de droit, est défini par le W3C.
Un fichier déclaré XHTML ou HTML qui respecte les règles de syntaxe du XML est dit « bien formé ».
Des erreurs sur les points 1, 2, 3, ainsi que sur la syntaxe correcte des éléments et des attributs peuvent perturber le bon fonctionnement des aides techniques. Le RGAA exige donc un document bien formé XML.
La déclaration <!DOCTYPE...> en tête du document appelle une DTD (Définition de Type de Document).
Pour être "valide" HTML ou XHTML, le document ne doit utiliser que les éléments et attributs définies dans la DTD déclarée.
L'ajout d'attribut propriétaire ou l'utilisation de balises absentes de la DTD ne perturbe pas le bon fonctionnement des aides techniques.
La validation des pages HTML se fait sur la page du validateur HTML du W3C
Un module complémentaire "HTML Validator" donne la possibilité d'analyser la syntaxe HTML ou XHTML. Il fournit des indications sur l'accessibilité de la page.
Mise à jour : 3 mai 2012