En HTML, puedes especificar el idioma del documento o de partes específicas del documento usando el atributo lang. Es una buena práctica definir el idioma del contenido, ya que:
Ayuda a los motores de búsqueda a comprender el idioma del sitio web.
Mejora la accesibilidad, en especial para las personas que utilizan lectores de pantalla.
Puede afectar la forma en que los navegadores renderizan el texto, especialmente si se trata de idiomas que se escriben de derecha a izquierda o que utilizan caracteres especiales.
Para establecer el idioma de todo el documento HTML, debes agregar el atributo lang a la etiqueta <html>.
Por ejemplo, para especificar que el contenido está en español:
html
<html lang="es">
...
</html>
También puedes establecer el idioma para secciones específicas del documento, en lugar de todo el documento. Esto es útil cuando se incluye texto en un idioma diferente al del documento principal.
Por ejemplo, si tienes un documento en inglés pero quieres incluir un párrafo en español:
html
<p>Here is some text in English.</p>
<p lang="es">Aquí hay un texto en español.</p>
Los valores para el atributo lang provienen de una norma estándar (como las etiquetas de idioma BCP 47). Algunos ejemplos comunes incluyen:
en: Inglés
es: Español
Los "Character Sets" (conjuntos de caracteres) determinan cómo se traducen los bytes en caracteres en una página web. Es esencial especificar el conjunto de caracteres correcto para garantizar que los caracteres, especialmente aquellos fuera del conjunto de caracteres ASCII básico (como caracteres acentuados, caracteres especiales o caracteres de idiomas no latinos), se muestren correctamente.
El conjunto de caracteres recomendado para HTML5 es UTF-8. UTF-8 es una codificación Unicode que puede representar cualquier carácter en el estándar Unicode, lo que lo hace adecuado para muchos idiomas y contenido.
Para especificar UTF-8 como el conjunto de caracteres de tu documento HTML, debes incluir la siguiente etiqueta <meta> en el <head> de tu documento:
<meta charset="UTF-8">
En HTML, algunos caracteres tienen significados especiales y se consideran "reservados". Estos caracteres no se pueden usar directamente en el contenido de un documento HTML si quieres representar su valor literal, ya que el navegador los interpretará de una manera específica. Para usarlos en el contenido, debes representarlos utilizando "entidades de carácter" o "entidades HTML".
Aquí hay algunos caracteres reservados en HTML y sus correspondientes entidades:
< (Menor que)
Uso directo: <
Entidad HTML: <
> (Mayor que)
Uso directo: >
Entidad HTML: >
& (Ampersand)
Uso directo: &
Entidad HTML: &
" (Comillas dobles)
Uso directo: "
Entidad HTML: "
' (Apóstrofo o comilla simple)
Uso directo: '
Entidad HTML: ' (Aunque no es parte de HTML4, es ampliamente soportado y es estándar en XML y HTML5.)
Ejemplo de cómo usar estas entidades:
Si deseas escribir el siguiente contenido: El símbolo "menor que" se escribe así: <, en tu código HTML deberías escribirlo de la siguiente manera:
html
El símbolo "menor que" se escribe así: <
La razón principal para usar estas entidades es evitar confusiones en la interpretación del contenido. Por ejemplo, si usas el símbolo < directamente en tu contenido, el navegador podría interpretarlo como el inicio de una nueva etiqueta.
Además de estas entidades para caracteres reservados, existen muchas otras entidades que representan otros caracteres especiales, símbolos y diacríticos. Usar entidades HTML garantiza que tu contenido se muestre correctamente, independientemente de la codificación de caracteres que esté usando tu página.