HTML to XML: Rozšírenie značkovacieho jazyka
Veľká väčšina ľudí v počítačovom priemysle vie, čo je HTML (Hypertext Markup Language). Existuje už veľmi dlho a vo veľkom rozsahu sa používa v dizajne webových stránok, že hoci už je zriedkavé vidieť webové stránky písané výlučne v HTML, považuje sa za základné znalosti celého procesu vytvárania webových stránok..
XML (Extensible Markup Language) je na druhej strane novšou a oveľa menej známou technológiou v porovnaní s HTML. XML bol vytvorený v roku 1996 skupinou 11 ľudí ako adaptácia SGML (Standard Generalized Markup Language) pre použitie na World Wide Web. XML je štruktúrovanejší a prísnejší značkovací jazyk v porovnaní s HTML, ktorý používateľom umožňoval vytvárať svoje vlastné definície a modularizovaný kód. Bol vytvorený za účelom vytvorenia štandardizovaných špecifikácií na vytváranie vlastných značkovacích jazykov, ktoré sa teraz nazývajú nárečia XML. To nemusí byť okamžite zrejmé, ale vlastné značkovacie jazyky ako HTML, RSS a Atom boli všetky vytvorené z XML ako metóda na zvýšenie použiteľnosti internetu..
Keďže XML bolo upravené z SGML, obsahuje veľa kódov a techník, ktoré boli pôvodne z SGML, ako je jeho striktnosť a tzv. Vlastnosti, ktoré siahajú až po potomkov XML. Pri vytváraní kódu založeného na XML by sa mali vždy brať do úvahy určité pravidlá. S každým dokumentom je dokonca dobre preformulované vyhlásenie, v ktorom sa uvádza, o aký druh dokumentu ide a na základe akých pravidiel by malo byť spracovanie založené. Toto je veľmi odlišné v porovnaní s veľmi uvoľneným kódovaním, ktoré sa používa v HTML.
Pri spracovaní stránky HTML by ste dosiahli nejaký výsledok bez ohľadu na to, aký bol vstup. Procesor HTML sa pokúša pochopiť, čo bolo v dokumente, a vytvára výstup, ktorý podľa jeho názoru najlepšie predstavuje vstupné údaje. To neplatí, pokiaľ ide o XML. XML používa mechanizmus spracovania chýb, ktorý sa považuje za „drakonický“. Kedykoľvek procesor XML narazí na niečo, čomu nedokáže porozumieť, iba vytvorí správu o chybe a ukončí spracovanie súboru. To vám ponechá chybové pole a na rozdiel od HTML nebude mať vôbec žiadny výsledok.
Z hľadiska perspektívy je HTML značkovacím jazykom, ktorý sa používa na rýchle a ľahké zobrazenie určitého spôsobu výstupu. Nezaoberá sa správnosťou vstupu a iba sa pokúša vytvoriť výstup na základe vstupného súboru. Na druhej strane XML je veľmi prísny značkovací jazyk, ktorý sa zvyčajne na vytváranie obsahu zvyčajne nepoužíva. Primárne sa používa ako nástroj na vytváranie ďalších značkovacích jazykov, ktoré vytvárajú potrebný obsah.