C'est la langue avec laquelle le contenu d'une page web est écrit. C’est aussi l’élément ajouté sur la balise HTML qui indique la langue d’une page. Par exemple, si le contenu de votre page est en anglais, vous devez ajouter sur la balise HTML lang ="en".
Il est important de définir la langue d'une page puisqu’elle facilite l'interprétation du contenu par les robots (même si Google ne l'utilise pas forcément), il est intéressant de la définir parce qu’elle aide les vérificateurs d’orthographe et de grammaire à appliquer la vérification ou l’ignorer (quand il s’agit d’une langue qui n’est pas dans la langue du vérificateur orthographe). Définir la langue aide aussi les outils de traduction à reconnaître des pages ou des parties de texte dans une langue spécifique. L’indication de la langue permet aussi aux synthétiseurs de la parole et aux traducteurs de Braille d'obtenir des résultats exploitables.
L’attribut lang peut être définie comme un attribut HTML, dans une en-tête HTTP Content-Language et aussi dans une balise HTML. La langue doit être valide et définie grâce à son code ISO-639 (i.e fr, fr-fr, fr-ca, en-us).
Voici comment gérer l’attribut lang dans ces différents éléments:
Example 1 : Langue définie comme attribut dans la balise HTML
<html lang="fr">
Example2 : Langue définie dans une balise HTML
<meta http-equiv="content-language" content="fr">
Plusieurs langues peuvent être définies au sein d'un même élément, mais il est préférable d'en définir une seule pour faciliter la compréhension des moteurs de recherche. Dans notre analyse, nous prenons en compte la première langue rencontrée.
Example 3 : Plusieurs langues définies
<meta http-equiv="content-language" content="fr, en">