XML algajatele

Võib-olla olete kuulnud laiendatavast märgistuskeelest (XML) ning sellest, miks peaks teie ettevõte seda kasutama. Kuid mis see XML õigupoolest on? Selles artiklis tuuakse välja XML-i puudutavad põhitõed – mida see endast kujutab ning kuidas see toimib.

Selle artikli teemad

Põgus ülevaade märgistamisest, märgistusest ja märgenditest

Mis teeb sellest XML-i?

Teave regulaarsete andmete kohta

Skeemide lühiülevaade

Teisenduste lühiülevaade

XML-i kasutamisest Microsoft Office‘i süsteemis

Põgus ülevaade märgistamisest, märgistusest ja märgenditest

XML-ist arusaamine aitab mõista andmete märgistamise vajadust. Inimesed on juba sajandeid dokumente koostanud ning sama kaua on ka neid dokumente märgistatud. Näiteks õpetajad märgistavad alatasa õpilaste töid. Nad paluvad õpilastel lõike ümber tõsta, muuta lauseid selgemaks, parandada kirjavigu jne. Dokumendi märgistamine määrab dokumendis sisalduva teabe struktuuri, tähenduse ning ilme. Kui olete kunagi Microsoft Office Wordis kasutanud funktsiooni „Jälita muutusi“, siis olete kasutanud arvutipõhist märgistamise viisi.

Andmetöötluses on „märgistamisest“ välja arenenud „märgistus“. Märgistus on protsess, mille käigus kasutatakse andmete struktuuri, ilme (XML-i korral ka tähenduse) määramiseks koode, mida kutsutakse märgenditeks.

Selle artikli HTML-kood on hea näide töötavast arvutimärgistusest. Selle sirvimisel (paremklõpsake Microsoft Internet Exploreris lehte ning klõpsake käsku Kuva allikas) kuvatakse läbisegi loetav tekst ning HTML-märgendid (nt <p> ja <h2>). HTML- ja XML-dokumentides on märgendid hõlpsasti äratuntavad, kuna neid ümbritsevad noolsulud. Selle artikli lähtekoodis on HTML-märgenditel mitmesuguseid funktsioone, nt määrata iga lõigu algus ja lõpp (<p> ... </p>) ja märkida iga pildi asukoht.


Mis teeb sellest XML-i?

Nii HTML- kui ka XML-dokumendid sisaldavad märgenditega ümbritsetud andmeid, kuid see on ka kõik, mis neid kaht keelt ühendab. HTML-märgendid määravad andmete ilme – kuhu lähevad pealkirjad, kust algavad lõigud jne. XML-märgendid määravad andmete struktuuri ja tähenduse – mis andmed need on.

Kirjeldades oma andmete struktuuri ja tähendust saate neid andmeid mitmel viisil uuesti kasutada. Kui teil on näiteks hulk müügiandmeid ning iga üksus on selgelt märgistatud, saate müügiaruandesse laadida üksnes vajalikud üksused ning laadida muud üksused raamatupidamise andmebaasi. Teisisõnu saate ühes süsteemis andmed genereerida ja XML-märgenditega märgistada ning seejärel neid andmeid paljudes teistes süsteemides töödelda mis tahes riistvaraplatvormil või operatsioonisüsteemis. XML on tänu oma ülekantavusele saanud üheks populaarseimaks andmevahetustehnoloogiaks.

Pidage meeles järgmist.

  • HTML-i ei saa kasutada XML-i asemel. Kuid te saate mähkida oma XML-andmed HTML-märgenditesse ning need veebilehel kuvada.

  • HTML-is saab kasutada piiratud hulka valmismärgendeid, mis on kõigi kasutajate jaoks samad.

  • XML võimaldab teil luua andmete ja andmestruktuuri kirjeldamiseks vajalikke märgendeid. Oletame näiteks, et teil on vaja talletada ja jagada teavet lemmikloomade kohta. Saate luua järgmise XML-koodi:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Nagu näha, siis tänu XML-märgenditele teate täpselt, millist tüüpi andmetega on tegu. Näiteks teate, et andmed käivad kassi kohta, ning leiate hõlpsasti kassi nime, vanuse jpm. XML-i teeb laiendatavaks võimalus luua märgendeid peaaegu kõigi andmestruktuuride määramiseks.

Kuid ärge ajage selle koodinäite märgendeid segi HTML-faili märgenditega. Näiteks kui kleepida see XML-struktuur HTML-faili ning vaadata faili brauseris, näeks tulemus välja umbes selline:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Brauser ignoreerib XML-märgendeid ja kuvab ainult andmed.


Teave regulaarsete andmete kohta

Võib-olla olete kuulnud kedagi IT-osakonnast mainimas fraasi „regulaarne XML“. Regulaarne XML-fail vastab väga rangetele reeglitele, mis XML-i reguleerivad. Kui fail neile reeglitele ei vasta, siis lakkab XML töötamast. Näiteks eelmises koodinäites on igal algusmärgendil ka lõpumärgend, seega peab näide kinni ühest regulaarsuse reeglitest. Kui märgendi eemaldate ning proovite faili mõnes Office‘i programmis avada, kuvatakse tõrketeade ning programm ei lase teil faili kasutada.

Teil pole ilmtingimata vaja regulaarse XML-i loomise reegleid teada (ehkki need on lihtsasti mõistetavad), kuid pidage meeles, et programmide ja süsteemide vahel saate jagada ainult regulaarseid XML-andmeid. Kui te ei saa XML-faili avada, pole see fail tõenäoliselt regulaarne.

XML on ka platvormist sõltumatu, mis tähendab, et iga XML-i kasutamiseks loodud programm saab olenemata riistvarast või operatsioonisüsteemist teie XML-andmeid lugeda ja töödelda. Näiteks saate õigete XML-märgenditega kasutada suurarvutist pärit andmete avamiseks ja töötamiseks töölauaprogrammi. Ja sõltumata sellest, kes loob XML-andmete sisu, saate samade andmetega töötada mitmes Office‘i programmis. XML-ist on saanud tänu teisaldatavusele üks populaarsemaid andmebaasi ja kasutaja töölaua vahelisi andmete vahetamise tehnoloogiaid.

XML-i kasutamine avatud rakendustes

Lisaks märgistatud, regulaarsetele andmetele kasutavad XML-süsteemid tavaliselt kaht lisakomponenti – skeeme ja teisendusi. Järgnevates lõikudes selgitatakse, kuidas need kaks komponenti toimivad.


Skeemide lühiülevaade

Ärge laske terminil „skeem“ ennast hirmutada. Skeem on lihtsalt XML-fail, mis sisaldab reegleid selle kohta, mis võib XML-andmefailis sisalduda ja mis mitte. Skeemifaili failinime lõpus on tavaliselt laiend .xsd, XML-andmefaili lõpus aga seevastu laiend .xml.

Skeemid võimaldavad programmidel andmeid valideerida. Skeemid tagavad andmete struktureerimiseks raamistiku ja kannavad hoolt selle eest, et see oleks arusaadav nii loojale kui ka kõigile teistele kasutajatele. Näiteks kui kasutaja sisestab sobimatuid andmeid (nt kuupäevaväljale teksti), saab programm paluda kasutajal sisestada õiged andmed. Kuni XML-faili andmed vastavad konkreetse skeemi reeglitele, saab mis tahes XML-i toetav programm skeemi andmeid lugeda, tõlgendada ja töödelda. Näiteks, nagu on näidatud järgmisel joonisel, saab Excel valideerida <CAT> andmeid CAT-skeemi suhtes.

Skeemid võimaldavad rakendustel XML-andmeid jagada.

Skeemid võivad olla keerukad ning nende loomist see artikkel ei käsitle. (Pealegi on teil tõenäoliselt IT-osakond, kes teab, kuidas see käib). Siiski on kasulik teada, millised skeemid välja näevad. Järgmine skeem määrab märgendikomplekti <CAT> ...</CAT> reeglid.

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Ärge muretsege, kui te ei saa näitest täielikult aru. Pidage lihtsalt need põhimõtted meeles.

  • Skeemi reaüksusi nimetatakse deklaratsioonideks. Kui peaksite vajama mõne looma kohta täiendavat teavet (nt värv, tunnused), lisab teie IT-osakond tõenäoliselt skeemi deklaratsiooni. Äri laienemise korral saate oma XML-süsteemi muuta.

  • Deklaratsioonid tagavad andmestruktuuride üle tohutult suure kontrolli. Näiteks tähendab deklaratsioon <xsd:sequence> seda, et märgendid (nt <NAME> ja <BREED>) peavad tingimata asetsema ülalpool esitatud järjestuses. Deklaratsioonid saavad reguleerida ka kasutajate sisestatud andmetüüpe. Näiteks nõuab ülaltoodud skeem kassi vanuse juures positiivset arvu ning märgendite ALTERED ja DECLAWED juures kahendväärtust (TÕENE või VÄÄR).

  • Kui XML-faili andmed vastavad skeemi reeglitele, tunnistatakse andmed sobivaks. XML-andmefaili kontrollimist skeemi suhtes nimetatakse valideerimiseks. Skeemide kasutamise suur eelis on see, et need aitavad vältida rikutud andmete esinemist. Skeemid muudavad ka rikutud andmete otsimise lihtsamaks, kuna probleemi ilmnemisel XML seiskub.


Teisenduste lühiülevaade

Nagu eelnevalt mainitud, pakub XML ka tõhusaid viise andmete kasutamiseks või korduvkasutamiseks. Andmete korduvkasutamise mehhanismi nimetatakse laiendatava laadilehekeele teisenduseks (XSLT) või lihtsalt teisenduseks.

Ka teie (õigemini teie IT-osakond saab) saate tagasüsteemide (nt andmebaaside) vahel andmete vahetamiseks kasutada teisendusi. Oletame näiteks, et andmebaas A talletab müügiandmeid tabeli kujul, mis sobib hästi müügiosakonnale. Andmebaas B talletab tulude ja kulude andmeid tabeli kujul, mis on kohandatud raamatupidamisosakonnale sobivaks. Andmebaas B saab andmebaasist A teisenduse abil andmeid vastu võtta ning tabelite korrigeerimiseks andmeid kirjutada.

Andmefaili, skeemi ja teisenduse kooslus moodustab XML-i põhisüsteemi. Järgnev joonis toob välja, kuidas sellised süsteemid tavaliselt toimivad. Andmefail valideeritakse skeemi suhtes ja seejärel renderdab teisendus seda kõikvõimalikel viisidel. Praegusel juhul juurutab teisendus andmed veebilehel asuvasse tabelisse.

Põhiline XML-failistruktuur koos skeemi ja teisendusega

Järgmine koodinäide kujutab üht teisenduse kirjutamise viisi. See laadib <CAT>-andmed veebilehel asuvasse tabelisse. Taas pole näite eesmärk selgitada, kuidas teisendust kirjutada, vaid näidata üht võimalikku teisenduse vormi.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

See näide kirjeldab seda, milline üks teisendustüüp võib kodeeritult välja näha, kuid pidage meeles, et saate lihtsas inglise keeles kirjeldada, milliseid andmeid vajate. Saate näiteks minna oma IT-osakonda ja öelda, et soovite välja printida mõne kindla piirkonna viimase kahe aasta müügiandmed, mis „peavad välja nägema sellised“. IT-osakond saab siis kirjutada (või muuta) teisenduse, mis selle ära teeb.

Asja muudab veelgi mugavamaks asjaolu, et Microsoft ja paljud muud tarkvaratarnijad loovad mitmesuguste tööde jaoks teisendusi. Tulevikus võib saada alla laadida teisenduse, mis kas juba vastab teie vajadustele või mida saab vastavalt otstarbele kohandada. See tähendab, et XML muutub aja jooksul odavamaks.


XML-i kasutamisest Microsoft Office‘i süsteemis

Office Professional Editioni versioonid pakuvad ulatuslikku XML-i tuge. Alates Microsoft Office 2007-st kasutab Microsoft Office XML-põhiseid failivorminguid (nt .docx, .xlsx ja .pptx). Kuna XML talletab andmeid kaitstud kahendvormingu asemel tekstivormingus, saavad teie kliendid määrata enda skeeme ning kasutada teie andmeid mitmekülgsemalt, seda kõike kasutusmaksuta. Uute vormingute kohta leiate lisateavet teemast Avatud XML-vormingud ja failinimelaiendid. Muud eelised on järgmised.

  • Väiksemad failimahud. Uus vorming kasutab ZIP-i ja muid tihendustehnoloogiaid, et vähendada failimahtu võrreldes Office‘i varasemates versioonides kasutatavate kahendvormingutega koguni kuni 75%.

  • Hõlpsam teabetaaste ja suurem turve. XML on inimesele loetav, seega kui fail on saanud kahjustada, saate selle avada Microsoft Notepadis või mõnes muus tekstiredaktoris ning taastada andmed vähemalt osaliselt. Lisaks on uued failid turvalisemad, kuna need ei tohi sisaldada rakenduse Visual Basic for Applications (VBA) koodi. Kui kasutate mallide loomiseks uut vormingut, asuvad ActiveX-juhtelemendid ja VBA-makrod eraldi faili turvalisemas sektsioonis. Lisaks saate isikuandmete eemaldamiseks kasutada tööriistu (nt dokumendiinspektorit). Lisateavet dokumendiinspektori kasutamise kohta leiate teemast Office‘i dokumentidest peitandmete ja isikuandmete eemaldamine.

Siiani on kõik hästi, kuid mida teha siis, kui teil on ilma skeemita XML-andmed? XML-i toetavates Office‘i programmides on oma võimalused, mis aitavad teil andmetega töötada. Näiteks tuletab Excel ilma skeemita XML-faili avamisel skeemi. Seejärel annab Excel teile võimaluse laadida need andmed XML-tabelisse. XML-loendeid ja tabeleid saate kasutada andmete sortimiseks ja filtreerimiseks või neile arvutuste lisamiseks.

XML-tööriistade lubamine Office‘is

Menüüd „Arendaja“ ei kuvata vaikimisi, kuid kui soovite Office‘is kasutada XML-käske, peate selle lindile lisama.

Täiendage oma oskusi
Tutvuge koolitusmaterjalidega
Kasutage uusi funktsioone enne teisi
Liituge Office Insideri programmiga

Kas sellest teabest oli abi?

Täname tagasiside eest!

Täname tagasiside eest! Tundub, et võiksime teid kokku viia ühega meie Office'i tugiagentidest, kes aitab teil probleemi lahendada.

×