La especificación de XHTML, basada en HTML 4, ha sido un intento de ir XML. HTML no era un XML válido y, por consiguiente, había muchos problemas con el procesamiento automático: atributos desconocidos, etiquetas sin pausa, etiquetas escritas con letras, etc.
Encontrará la especificación completa en http://www.w3.org/TR/xhtml1/.
El resultado fue muy bueno, ya que gradualmente todos los desarrolladores web están trabajando en este nuevo formato. El contenido antiguo del HTML a la actualización XHTML también es una gran ventaja por muchas razones:
Facilita en gran medida la migración de contenido, ya que el contenido se adapta automáticamente al diseño de cualquier sitio web.
Se asegura la duración del contenido, ya que el formato puede ser rediseñado en el futuro, si es necesario.
El procesamiento automático de texto se puede realizar, por ejemplo, para extraer cierta información.
Le permite ver muchos otros navegadores no estándar, como teléfonos móviles, PDAs, lectores ciegos, TV, etc.
En nuestros motores de búsqueda, nuestro contenido será mucho más fácil de hacer, así como mantener una jerarquía correcta.
Sin embargo, acortar, y para alguien que sabe HTML4, las reglas son bastante simples:
Documento XHTML con etiqueta mínima.
1 <?xml version="1.0" encoding="iso-8859-1"?> 2 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 3 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 4 <html xmlns="http://www.w3.org/1999/xhtml"> 5 <head> 6 <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> 7 <title>No title</title> 8 <meta name="generator" content="Amaya, see http://www.w3.org/Amaya/" /> 9 </head> 1011 <body> 12 </body> 13 </html>
Este código se compone de diferentes bloques de bloques anidados:
1 <?xml version="1.0" encoding="iso-8859-1"?>
2 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 3 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
3 <html xmlns="http://www.w3.org/1999/xhtml">
4 <head>
5 <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
6 <title>No title</title>
7 <meta name="generator" content="Amaya, see http://www.w3.org/Amaya/" />
</head>
9
<body>
</body>
</html>
<title>Qué es una página web. XHTML. Amaya. Bartolomé Sintes Marco</title>
(<body> ... </ body>, 11 y 12) estarán visibles en la ventana del navegador.
Tipos XHTML
La recomendación XHTML 1.1 es una reformulación de XHTML 1.0 Strict de acuerdo con criterios de modularización, pero apenas supone en la práctica más de tres cambios con respecto a XHTML 1.0.
En este curso se trata la versión HTML 1.0 Strict. Los ejercicios están realizados en esta versión, salvo aquellos en los que es necesario utilizar la versión HTML 1.1.
Diferencias entre XHTML 1.0 y HTML 4.0, compatibilidad con HTML
Notas sobre los SITIOS WEB
Una página web puede contener notas que no son visibles. Vamos a limitar estas etiquetas a través de <! - .... ->, por ejemplo:
<p>Esto es un párrafo p normal y corriente. <!--Esto es un ejemplo de comentario--></p> <p>Entre este párrafo y el anterior hay un comentario que sólo puede verse en el código fuente.</p> <!--Esto es otro comentario-->
Esto es un párrafo p normal y corriente.
Entre este párrafo y el anterior hay un comentario que sólo puede verse en el código fuente.
Acentos, eñes y cedillas
En los primeros procesadores de texto y editores web, al escribir en lenguaje HTML era preciso representar adecuadamente los acentos y otros caracteres no-ASCII escribiendo cosas como "á" y "ñ". Sin embargo, el protocolo del WWW (http) transmite 8 bits y el juego de caracteres oficial del WWW es el ISO Latin 1 (ISO 8859-1). Mediante ISO Latin-1 se pueden representar la mayoría de los idiomas europeos occidentales (como castellano, catalán, francés, italiano, etc.). Si el ordenador puede producir ISO Latin-1 (y hay utilidades para traducir automáticamente los juegos de caracteres de cualquiera de ellos) no hace falta huir de los caracteres acentuados o emplear esta grafía compleja, esta grafía había sido pensada para los ordenadores que no utilizaban ese juego de caracteres. Además, si se pretende indexar los documentos del servidor WWW se complicará el tema de las búsquedas y los usuarios no podrán utilizar los términos acentuados.
Caracteres especiales HTML
Una URL (o Uniform Resource Locator) es "la sintaxis y semántica de información formalizada para la localización y el acceso a recursos a través de Internet". Dicho así (RFC 1738) Esta es la clave de la World Wide Web. Los URL se utilizan en la WWW para "localizar" recursos y proporcionan, de forma compacta, inteligible para los humanos e interpretable para aplicaciones informáticas, la información básica que permite acceder a un recurso en Internet ya que incluyen el protocolo de acceso (http, ftp, gopher, wais, nntp, etc.), el ordenador remoto en el que se encuentra (y el puerto en el que se encuentra dicho protocolo si no es el estándar) y una forma de identificar el recurso en cuestión (el camino o ruta a seguir por la estructura jerárquica de archivos, un identificador único, etc.) o de interactuar con él (las palabras clave a buscar, por ejemplo).
Una vez localizado el recurso, el sistema puede realizar las operaciones pertinentes: transferir una copia y mostrarla al usuario o almacenarla, interrogar una base de datos, iniciar una sesión remota, actualizar el recurso, solicitar sus atributos, etc. Cada protocolo permite diferentes operaciones y la sintaxis URL se ha diseñado de modo que pueda ampliarse a futuros protocolos.
Los URL nos permiten realizar "saltos hipertextuales" por la Web. Son lo que se esconde tras las palabras o frases marcadas como vínculos y que ordenan al agente de usuario qué ha de hacer cuando el usuario las señala haciendo clic con el ratón sobre ellas.
A dictionary of HTML Metatags. http://vancouver-webpages.com/META
BERNERS-LEE, Tim. Style Guide for Online Hypertext.http://www.w3.org/Provider/Style/Overview.html
Cover Pages. XML Schemas. http://www.oasis-open.org/cover/schemas.html
Cover Pages. XML Schemas. http://www.oasis-open.org/cover/schemas.html
Desarrolloweb.com Manual de HTML http://www.desarrolloweb.com/manuales/21/
Desarrolloweb.com HTML a fondo http://www.desarrolloweb.com/html/
ENGELFRIET, Arnoud "Galactus". The other HTML FAQ. http://www.stack.nl/~galactus/html/other-faq.html
ISO/IEC 15445:2000. Information technology -Document description and processing languages- HyperText Markup Language (HTML). http://purl.org/NET/ISO+IEC.15445/15445.html
MARCOS, Mari Carmen. Diseño de interfaces web. http://rayuela.uc3m.es/~mcmarcos/interfaz/indice.html
MARTÍNEZ ECHEVARRÍA, Álvaro. Manual Práctico de HTML. http://www.etsit.upm.es/~alvaro/manual/manual.html
MÉNDEZ RODRÍGUEZ, Eva. Metadatos y recuperación de información: Estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón, Trea, 2002.
NCSA. Beginner's Guide to HTML. http://www.ncsa.uiuc.edu/General/Internet/WWW/HTMLPrimer.html
PULIDO ALONSO, Esther. DOMÍNGUEZ ARTEAGA, Octavio. JIMÉNEZ PEÑATE, Cristina. Tutorial de HTML. http://gias720.dis.ulpgc.es/Gias/Cursos/Tutorial_html/indice.htm
UCC Computer Centre. How to write HTML files.http://www.ucc.ie:8080/cocoon/cc/docs/htmldoc
Universidad de Cádiz. Manual de HTML. http://www.uca.es/manual-html/
Universidad de Navarra. HTML. http://www.unav.es/cti/manuales/HTML/indice.html
W3C. HyperText Markup Languaje (HTML) Home Page. http://www.w3.org/MarkUp
W3C. HTML 4.01 Specification. http://www.w3.org/TR/html401/
W3C. HTML Working Group Roadmap. http://www.w3.org/MarkUp/xhtml-roadmap/
W3C. XForms for HTML Authors. http://www.w3.org/MarkUp/Forms/2003/xforms-for-html-authors.html (traducción al castellano: CHUTER, Alan. XForm para Diseñadores HTML http://www.infoescena.es/achuter/web/w3cdocs/xforms-for-html-authors_es.html)
W3Schools. HTML Tutorial. http://www.w3schools.com/html/
Web Design Group. The WDG Reference section. http://www.htmlhelp.com/reference/
Web Design Group. Validators and Checkers. http://www.htmlhelp.com/links/validators.htm
Web Design Group. Web Authoring FAQ. http://www.htmlhelp.com/faq/html/all.html