Ako previesť súbor XML, aby bol dobre formovaný

Tento článok vysvetľuje, ako správne písať XML ukážkou príkladu. Newsletter Web Writer je písaný vo forme XML; nazývame to AML alebo About Markup Language. Aj keď sa jedná o pracovný dokument, nejde o dobre formovaný alebo platný dokument XML.

Dobre formovaný

Existuje niekoľko špecifických pravidiel na vytvorenie dobre formovaného dokumentu XML:

  • Vyhlásenie XML musí byť v každom dokumente na prvom mieste.
  • Komentáre nie sú v rámci značky platné. Komentáre nesmú obsahovať dva spojovníky za sebou, okrem začiatku a konca komentára.
  • Značky musia mať koncovú značku alebo musia byť uzavreté napríklad v samotnej jednoduchej značke.
  • Všetky atribúty značiek musia byť citované, najlepšie dvojité úvodzovky, pokiaľ samotný atribút neobsahuje dvojité úvodzovky.
  • Každý dokument XML musí obsahovať jeden prvok, ktorý úplne obsahuje všetky ostatné prvky.

Existujú iba dva problémy s dokumentom, ktoré ho robia nedostatočne tvarovaným:

  • Prvá vec, ktorú dokument AML potrebuje, je vyhlásenie XML.
  • Ďalším problémom je, že žiadny prvok úplne nezakrýva všetky ostatné prvky. Aby sme to napravili, pridáme prvok externého kontajnera:
    instagram viewer

Urobenie týchto dvoch jednoduchých zmien (a zabezpečenie toho, aby všetky prvky obsahovali iba CDATA) spôsobí, že sa z dobre tvarovaného dokumentu stane dobre tvarovaný dokument.

Platný dokument XML sa overuje podľa definície typu dokumentu (DTD) alebo schémy XML. Jedná sa o množinu pravidiel vytvorených vývojárom alebo organizáciou pre štandardy, ktoré definujú sémantiku dokumentu XML. Tieto informujú počítač o tom, čo má robiť so značkami.

V prípade About Značkovací jazyk, pretože nejde o štandardný jazyk XML, ako napríklad XHTML alebo SMIL, DTD by vytvoril vývojár. Tento DTD by sa s najväčšou pravdepodobnosťou nachádzal na rovnakom serveri ako dokument XML a odkazoval by sa na hornú časť dokumentu.

Predtým, ako začnete s vývojom DTD alebo schémy pre svoje dokumenty, mali by ste si uvedomiť, že dokument XML je jednoducho dobre formovaný, takže sám seba popisuje, a preto nepotrebuje DTD.

Napríklad s našim dobre tvarovaným dokumentom AML existujú nasledujúce značky:

Ak ste oboznámení s bulletinom Web Writer, môžete poznať rôzne časti tohto bulletinu. Takto je veľmi ľahké vytvárať nové dokumenty XML v rovnakom štandardnom formáte. Do značky by sme vždy vložili názov celej dĺžky a do značky adresu URL prvej sekcie.

DTD

Ak sa od vás vyžaduje, aby ste napísali platný dokument XML, a to buď na použitie údajov, alebo na ich spracovanie, zahrnuli by ste ich do dokumentu so značkou. V tejto značke definujete základnú značku XML v dokumente a umiestnenie DTD (zvyčajne webový identifikátor URI).

Napríklad:

Jedna príjemná vec na deklaráciách DTD je, že môžete vyhlásiť, že DTD je lokálny v systéme, kde Dokument XML obsahuje „SYSTÉM“. Môžete tiež ukázať na verejný DTD, napríklad s dokumentom HTML 4.0:

Keď použijete obe, hovoríte dokumentu, aby použil konkrétny DTD (verejný identifikátor) a kde ho nájde (systémový identifikátor).

Nakoniec môžete zahrnúť interný DTD priamo do dokumentu v rámci značky DOCTYPE. Napríklad (nejde o úplný DTD pre dokument AML):

Schéma XML

Ak chcete vytvoriť platný dokument XML, môžete na definovanie svojho XML použiť aj dokument schémy XML. Schéma XML je dokument XML, ktorý popisuje dokumenty XML. Naučte sa, ako napísať schému.

Poznámka

Iba ukazovanie na schému DTD alebo XML nestačí. XML, ktorý je v dokumente, musí zodpovedať pravidlám v DTD alebo schéme. Používanie validačného syntaktického analyzátora je jednoduchý spôsob, ako skontrolovať, či vaše XML dodržiava pravidlá DTD. Mnoho takýchto analyzátorov nájdete online.