XML pro začátečníky

Důležité :  Tento článek je strojově přeložený – přečtěte si toto upozornění. Anglickou verzi tohoto článku pro referenci najdete tady.

Budete slyšet z jazyk XML (Extensible Markup) a budete slyšet mnoho důvodů, proč organizaci zacházet. Ale co přesně je XML? Tento článek vysvětluje základy XML – co je a jak to funguje.

V tomto článku:

Stručný popis: co je to mark up (označit), markup (používání značek) a tag (značka)

Co tedy charakterizuje jazyk XML?

Několik slov o dobře formátovaných datech

Stručně o schématech

Stručně o transformacích

Jazyk XML v systému Microsoft Office

Stručný popis: co je to mark up (označit), markup (používání značek) a tag (značka)

K pochopení jazyka XML je užitečné porozumět myšlence značkování (označování) dat. Lidé vytvářejí dokumenty již po staletí a stejně dlouho tyto dokumenty opatřují různými značkami. Například učitelé vždycky označovali písemné práce studentů. Říkali tím studentům, že mají udělat nový odstavec, vysvětlit větu, opravit pravopisné chyby atd. Opatřit dokument značkami znamená určit strukturu, význam a vizuální vzhled informací v něm obsažených. Pokud jste někdy použili funkci Sledování změn v aplikaci Microsoft Office Word, použili jste počítačovou formu značkování.

V počítačové, "označovat" taky změnil na "značky." Marže je proces pomocí kódů s názvem značky (nebo v některých případech tokeny) k definování struktury vizuální vzhled a – v případě XML – smyslu všechna data.

Kód HTML pro tento článek je příkladem značek počítač v práci. Pokud jste Procházet (v Microsoft Internet Explorer, klikněte pravým tlačítkem myši na stránku a klikněte na Zobrazit zdroj ), zobrazí se kombinaci čitelný text a značky Hypertext Markup Language (HTML), například <p> a <h2>. Značky HTML a XML dokumentů se snadno rozpoznatelný, protože jsou uzavřeny v lomených závorkách. Ve zdrojovém kódu pro tento článek značky HTML pro různé úlohy, například definovat začátek a konec odstavce (<p> ... </p>) a označení umístění jednotlivé obrázky.


Co tedy charakterizuje jazyk XML?

Dokumenty ve formátu HTML a jazyk XML obsahují dat obklopená značky, ale je to, kde podobnosti mezi dvěma jazyky končit. Ve formátu HTML, značky určit vzhled dat – nadpisy přejděte sem, odstavec začíná tam atd. Ve formátu XML definují značky struktury a významu datům – co je data.

Popíše-li se struktura a význam dat, umožní se tím jejích opakované používání libovolným počtem způsobů. Máte-li například blok dat o  prodeji a každá položka v bloku je jasně identifikována, můžete do výkazu o prodeji obratů načíst jen ty položky, které potřebujete, a jiné položky načíst do účetní databáze. Jinými slovy, je možné použít jeden systém k vytvoření dat a jejich označení značkami XML a potom tato data zpracovávat v libovolném počtu jiných systémů, nezávisle na hardwarové platformě nebo na operačním systému. Díky této přenositelnosti se jazyk XML stal jednou z nejoblíbenějších technologií pro předávání dat.

Mějte přitom na paměti následující skutečnosti:

  • Místo jazyka XML nemůžete použít jazyk HTML. Můžete však svá data XML zabalit do značek HTML a zobrazit je na webové stránce.

  • Jazyk HTML je omezen na předdefinovanou množinu značek, které všichni uživatelé sdílejí.

  • Jazyk XML uživateli umožňuje vytvořit libovolnou značku, kterou potřebuje k popisu svých dat a jejich struktury. Dejme tomu, že potřebujete ukládat a sdílet informace o domácích zvířatech. Můžete vytvořit následující kód XML:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Je vidět, že značky XML umožňují přesně vědět, na jaký druh dat se díváte. Víte například, že toto jsou data o kočce, a můžete snadno najít jméno kočky, stáří atd. A právě díky schopnosti vytvářet značky definující takřka libovolnou strukturu dostal jazyk XML přívlastek „rozšiřitelný" (extensible).

Nezaměňujme však značky v této ukázce kódu se značkami v souboru HTML. Kdybychom tuto strukturu XML vložili do souboru HTML a zobrazili jej v prohlížeči, dostali bychom následující výsledek:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Prohlížeč značky XML ignoruje a zobrazuje jen data.


Několik slov o dobře formátovaných datech

Možná jste od někoho z vašeho oddělení informačních technologií slyšeli zmínku o „dobře formátovaném“ XML. Dobře formátovaný soubor XML splňuje řadu velmi přísných pravidel, kterými se jazyk XML řídí. Pokud soubor tato pravidla nesplňuje, jazyk XML přestane pracovat. Například ve výše uvedeném příkladu má každá otevírací značka zavírací značku, takže příklad vyhovuje jednomu z pravidel dobrého formátování. Kdybyste nějakou značku odstranili a pokusili se tento soubor otevřít v některé z aplikací sady Office, zobrazila by se chybová zpráva a aplikace by vám neumožnila soubor používat.

Nemusíte nutně znát pravidla pro vytváření ve správném formátu XML (když jsou snadno srozumitelné), ale je potřeba si zapamatovat, že jste sdílení dat XML mezi programy a systémy jenom v případě, že se tato data ve správném formátu. Pokud nejde otevřít soubor XML, dost možná je, že není ve správném formátu.

Jazyk XML je také nezávislý na platformě, což znamená, že kterýkoliv program vytvořený pro použití jazyka XML můžete číst zpracovávat data XML, bez ohledu na hardware nebo operační systém. Například s správné značky XML můžete desktopová aplikace otevřít a práce s daty z počítače, sálové počítače. A bez ohledu na to, který vytvoří obsah XML dat, můžete pracovat se stejnými daty v několika aplikace sady Microsoft Office 2003 a Microsoft Office Professional 2007, včetně Microsoft Office Access 2007, Microsoft Office Word 2007, Microsoft Office InfoPath 2007 a Microsoft Office Excel 2007. Protože je přenosná, stal XML jednou z nejoblíbenějších technologií pro výměnu dat mezi databázemi a uživatel plochy.

Jazyk XML používaný jinými programy

Kromě značkovaných, dobře naformátovaných dat používají systémy XML obvykle dvě další komponenty: schémata a transformace. V následujících oddílech je vysvětleno, jak tyto komponenty pracují.


Stručně o schématech

Nenechte se slovem "schéma" polekat. Schéma je prostě soubor XML, která obsahuje pravidla pro co můžete a nemůžete uložena v datového souboru XML. Soubory schématu obvykle používají .xsd příponu souboru, zatímco datových souborů XML používají příponu XML.

Schémata umožňují aplikací pro ověření dat. Poskytují rámec pro strukturování dat a za ověření oprávněnosti dává smysl poznámkové bloky pro školy a žádní jiní uživatelé. Například pokud uživatel zadá neplatných dat, třeba k textu v poli s datem, program můžete zobrazí výzvu k zadejte správná data. Některá data v souboru XML splňuje tato pravidla v daném schématu, libovolný program podporující XML můžete použít toto schéma číst, interpretovat a zpracování dat. Například jak je znázorněno na následujícím obrázku, Excel může ověřovat data <CAT> vzhledem ke schématu KOČKA.

Schémata umožňují sdílení dat XML aplikacemi.

Schémata mohou být složitá a podrobný popis jejich vytváření by překročil rámec tohoto článku. (Pravděpodobně máte oddělení informačních technologií, které vytváření schémat zná.) Je však užitečné vědět, jak schémata vypadají. Následující schéma definuje pravidla pro množinu značek <CAT> ... </CAT>

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Nedělejte si starosti, jestliže v tomto příkladu neporozumíte všemu. Zapamatujte si prostě tato fakta:

  • Řádky v tomto vzorovém schématu se nazývají deklarace. Pokud byste potřebovali další informace o zvířeti, například barvu nebo charakteristické zbarvení, vaše oddělení IT by pravděpodobně přidalo do schématu další deklaraci. Když potřebujte své aktivity rozvinout, můžete systém XML změnit.

  • Deklarace poskytují rozsáhlou publikum nemůže ovládat datová struktura. Například deklaraci <xsd:sequence> znamená, že značky, například <NAME> a <BREED> , může docházet v pořadí, ve kterém je uvádí výše. Deklarace můžete taky určit typy dat, které uživatelé mohou zadat. Například schématu výše vyžaduje kladné číslo pro kočky věku a hodnoty logickou hodnotu (PRAVDA nebo NEPRAVDA) značek ALTERED a DECLAWED.

  • Jestliže data v souboru XML vyhovují pravidlům předepsaným schématem, jsou tato data prohlášena za platná. Proces kontroly dat XML podle schématu se nazývá ověření (což je logické). Velkou výhodou používání schémat je, že mohou zabránit použití poškozených dat. Usnadňují také nalezení poškozených dat, protože jazyk XML vyvolá zastavení, jestliže narazí na problém.


Stručně o transformacích

Jsme zmínili dříve, XML také poskytuje výkonné způsoby, jak používat nebo opětovné použití data. Mechanismus pro opakované použití dat se nazývá jazyk transformací XSLT (Extensible Stylesheet) nebo jednoduše, transformace.

Transformaci může uživatel (nebo oddělení IT) použít také k předávání dat mezi serverovými systémy, například databázemi. Předpokládejme, že v databázi A jsou data uložena v tabulkové struktuře, která dobře vyhovuje oddělení prodeje. V databázi B jsou uložena data příjmů a výdajů v tabulkové struktuře přizpůsobené potřebám účtárny. V databázi B lze použít transformaci pro příjem dat z databáze A a zapsání těchto dat do odpovídajících tabulek.

Základem systému XML je kombinace datového souboru, schématu a transformace. Následující ilustrace ukazuje, jak systémy obvykle pracují. Datový soubor je ověřen podle schématu a potom zpracován libovolným počtem užitečných způsobů pomocí transformace. V tomto případě transformace převede data na tabulku na webové stránce.

Základní struktura souboru XML se schématem a transformací

Následující příklad kódu ukazuje jedním ze způsobů zápisu transformace. Načte data < KOČKA > do tabulky na webovou stránku. Znovu čárky vzorku není pro předvedení můžete psát nebo transformaci, ale k zobrazení formuláře, který může trvat transformace.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

Tento příklad ukazuje, jak může vypadat jeden typ transformace při kódování, běžnému uživateli však stačí, když popíše to, co potřebuje, v běžném jazyce. Může například přijít do oddělení IT a říci, že potřebuje vytisknout data o prodeji pro určité oblasti za poslední dva roky, a že sestava má vypadat určitým způsobem. Oddělení IT potom může napsat (nebo pozměnit) transformaci, která tuto úlohu provede.

To vše je ještě pohodlnější díky tomu, že společnost Microsoft a rostoucí počet dalších dodavatelů vytváří transformace pro úlohy všeho druhu. V budoucnu si pravděpodobně budete moci stáhnout transformaci, která vyhovuje vašim potřebám, nebo kterou si budete moci přizpůsobit tak, aby vyhovovala vašemu účelu. To znamená, že náklady na používání jazyka XML budou časem nižší.


Jazyk XML v systému Microsoft Office

Profesionální edice systému Microsoft Office 2003 a Office 2007 poskytují podporu rozsáhlé XML.

  • Office Excel 2007Office Word 2007 a Office PowerPoint 2007 pro použití jazyka XML jako jejich výchozí formát souborů změnu, která má několik výhod:

    • Menší velikosti souborů. Nový formát používá kompresi ZIP a jiné kompresní technologie ke snížení velikosti souborů až o 75 procent ve srovnání s binárními formáty používanými ve starších verzích sady Office.

    • Snazší obnova informací a lepší zabezpečení. XML je lidské čitelné, takže pokud soubor poškodí, můžete otevřete soubor v Notepad nebo jiném textovém editoru a obnovit alespoň některých informací. Nové soubory jsou také bezpečnější, protože nemohou obsahovat Visual Basic for Applications (VBA) kód. Pokud používáte nový formát pro vytváření šablon, ovládací prvky ActiveX a makra jazyka VBA uložena v samostatném, bezpečnější část souboru. Kromě toho můžete nástroje, například metadat, chcete-li odebrat osobní údaje. Další informace o používání metadat naleznete v článku Odebrání skrytých dat a osobních informací z dokumentů sady Office.

    • Lepší přenosnost a flexibilita. Protože v jazyce XML jsou data uložena v textovém formátu místo ve speciálním binárním formátu, vaši zákazníci si mohou definovat svá vlastní schémata a používat vaše data různými způsoby, aniž by museli platit licenční poplatky. Další informace o nových formátech naleznete v článku Úvod k otevřeným formátům souborů XML.

  • Některé aplikace sady Office používají formát XML v pozadí a některé, například Microsoft Office OneNote™, formát XML vůbec nepodporují. Nejlepší způsob, jak zjistit, do jaké míry určitá aplikace sady Office podporuje formát XML, je spustit nápovědu pro tuto aplikaci a vyhledat v ní položku XML.

Takže úplně tak velký, ale co dělat, když budete mít dat XML bez schématu? Aplikace Office, které podporují XML mít vlastní přístupy k nápovědu, se kterými pracujete s daty. Například Excel odvozeny schéma Pokud otevřete soubor XML, který už ještě není. Potom vám dá možnost načíst tato data do souboru jen pro čtení nebo namapovat data do seznamu XML (Microsoft Office Excel 2003) nebo některá tabulka XML (v Office Excel 2007 ). Řadit, filtrovat nebo přidat výpočty dat můžete seznamy nebo tabulky XML.

Office Professional 2007 a Microsoft Office 2003 obsahují stejný sady nástrojů XML. V Office Professional 2007 musíte napřed povolit podpora XML a spusťte nástroje z různých míst. Však po spuštění nástroje fungují v aplikaci Microsoft Office 2003 a Office Professional 2007 stejné.

Poznámka : Microsoft Office Access 2007 umožňuje XML tools ve výchozím nastavení tak, aby první kroky můžete přeskočit, pokud používáte aplikaci Access.

Povolení XML tools v Office Excel 2007

  1. V Excelu klikněte na Tlačítko Microsoft Office Obrázek tlačítka Office a potom klikněte na Možnosti aplikace Excel.

  2. Klepněte na položku Individuální nastavení.

  3. V části Nejpoužívanější možnosti při práci s aplikací Excel vyberte Zobrazit kartu Vývojář na pásu karet a potom klikněte na OK.

    Poznámka : Pás karet je součástí rozhraní Fluent systému Microsoft Office.

Spuštění nástroje XML v Office Excel 2007

  • Na kartě Vývojář klikněte na příkaz všechny dostupné ve skupině XML.

Spuštění nástroje XML v Office Access 2007

  1. Klepněte na kartu Externí data.

  2. Proveďte některou z následujících akcí:

    • Ve skupině Import klepněte na položku Soubor XML.

    • Ve skupině Export klikněte na Další a potom klikněte na Soubor XML.

Poznámka : Upozornění ke strojovému překladu: Tento článek přeložil počítačový systém bez zásahu člověka. Společnost Microsoft nabízí tyto strojové překlady proto, aby umožnila uživatelům, kteří nemluví anglicky, získat informace o produktech, službách a technologiích této společnosti. Protože je tento článek strojově přeložený, může obsahovat slovní, syntaktické nebo gramatické chyby.

Byly tyto informace užitečné?

Výborně! Je ještě něco dalšího, co byste nám chtěli dát vědět?

Jak bychom ho mohli vylepšit?

Děkujeme vám za zpětnou vazbu.

×