HTML a XML: Extendiendo el lenguaje de marcado
Una gran mayoría de las personas que están en la industria de la computación saben qué es HTML (Hypertext Markup Language). Ha existido durante mucho tiempo y se ha utilizado ampliamente en el diseño de páginas web que, aunque ya es raro ver páginas web escritas únicamente en HTML, se considera un conocimiento básico de todo el proceso de creación de páginas web..
XML (Extensible Markup Language), por otro lado, es una tecnología más reciente y mucho menos conocida en comparación con HTML. XML fue creado en 1996 por un grupo de 11 personas como una adaptación de SGML (Lenguaje de marcado generalizado estándar) para su uso en la World Wide Web. XML es un lenguaje de marcado más estructurado y estricto en comparación con HTML que permite a los usuarios crear sus propias definiciones y código modular. Fue creado para crear especificaciones estandarizadas para la creación de lenguajes de marcado personalizados que ahora se conocen como dialectos XML. Puede que no sea aparente al instante, pero los lenguajes de marcado personalizados como HTML, RSS y Atom se crearon a partir de XML como un método para aumentar la usabilidad de Internet..
Dado que XML se adaptó de SGML, contiene una gran cantidad de código y técnicas que originalmente eran de SGML, como su rigor y lo que se denomina "bien formado". Características que se extienden incluso a los descendientes de XML. Ciertas reglas siempre deben considerarse al crear código que se basa en XML. Incluso hay una declaración bien formada con cada documento para indicar qué tipo de documento es y en qué reglas debe basarse el procesamiento. Esto es muy diferente en comparación con la codificación muy relajada que se utiliza en HTML.
Cuando procesa una página HTML, tendrá algún tipo de resultado independientemente de cuál fue la entrada. El procesador HTML intenta dar sentido a lo que estaba en el documento y hace una salida que cree que representa mejor los datos de entrada. Esto no es cierto viene a XML. XML emplea un mecanismo de manejo de errores que se considera "draconiano". Cuando el procesador XML encuentra algo que no puede comprender, simplemente crea un informe de errores y finaliza el procesamiento del archivo. Eso te deja con un cuadro de error y ningún resultado a diferencia de HTML.
Para ponerlo en perspectiva, HTML es un lenguaje de marcado utilizado para mostrar de manera rápida y sencilla algún tipo de resultado. No se preocupa por la corrección de la entrada y solo intenta crear una salida basada en el archivo de entrada. XML, por otro lado, es un lenguaje de marcado muy estricto que no suele utilizarse para crear contenido. Su uso principal es como una herramienta para crear otros lenguajes de marcado que crean el contenido necesario..