Unicode es un estándar industrial destinado a componer informalmente cualquier texto en cualquier idioma.
La extensión de este nuevo sistema es un proyecto abrumador para reemplazar los sistemas de codificación existentes, muchos de estos sistemas de codificación son muy escasos, y muchos caracteres de los idiomas que se pueden encontrar no se puede afirmar. Actualmente es un estándar utilizado en la mayoría de los proyectos internacionales, utilizando la última tecnología,
como XML, Java y sistemas operativos modernos.
Se basa en el conjunto de caracteres ASCII. Tomó un modelo de 16 bits que permite la codificación de todos los idiomas, sin entrar en los códigos de control o secuencias de escape.
Declaraciones de documentos
HTML5
Utiliza el atributo de metacharset en un meta-elemento en la parte superior del elemento de cabecera y asegúrese de que la instrucción completa esté dentro de los primeros 1024 bytes de la página.
<meta charset = "UTF-8">
HTML4
<meta http-equiv="Content-type" content = "text/html;charset=UTF-8">
XHTML 1.x servido con texto / html tipo MIME
Utilice UTF-8 para decodificar su página y utilice una directiva pragma en la parte superior del elemento head.
XHTML 1.x servido como XML
Utilice la declaración codificada de la declaración XML en la primera línea de la página. Asegúrese de que no hay nada antes, ni siquiera los espacios (aunque una marca de orden de bytes está bien).
<? xml version = "1.0" encoding = "UTF-8"?>