Oblika XML za neizkušene uporabnike

Morda ste že slišali za XML in morda ste slišali mnoge razloge, zakaj bi ga vaša organizacija morala uporabljati. Kaj pravzaprav je XML? V tem članku so razložene osnove XML-ja – kaj je in kako deluje.

V tem članku

Na kratko o popravkih, označevanju in oznakah

Zakaj XML?

Nekaj besed o pravilno oblikovanih podatkih

Hiter pregled shem

Hiter pregled transformacij

Povzetek XML-ja v sistemu Microsoft Office

Na kratko o popravkih, označevanju in oznakah

Če želite razumeti XML, je dobro imeti predstavo o popravljanju podatkov. Ljudje že stoletja ustvarjajo dokumente in enako dolgo te dokumente tudi popravljajo. Učitelji v šolah na primer stalno popravljajo teste svojih študentov. Študentom govorijo, naj premaknejo odstavke, pojasnijo stavke, popravijo črkovanje in tako naprej. Popravljanje dokumenta je način določanja strukture, pomena in videza informacij v dokumentu. Če ste že uporabljali funkcijo sledenja spremembam v programu Microsoft Office Word, ste uporabili računalniško obliko popravljanja.

V računalništvu se je »popravljanje« razvilo v »označevanje«. Označevanje je postopek uporabe kod, ki se imenujejo oznake (ali včasih žetoni) za določanje strukture, videza in, kot v primeru XML-ja, pomena podatkov.

Koda HTML za ta članek je dober primer delovanja računalniškega označevanja. Če jo boste prebrskali (v brskalniku Microsoft internet Explorer z desno miškino tipko kliknite stran in nato kliknite Ogled izvorne kode), boste videli kombinacijo berljivega besedila in oznak HTML, kot sta <p> in <h2>. Oznake v dokumentih HTML in XML je enostavno prepoznati, saj so obdane z oglatimi oklepaji. V izvorni kodi za ta članek oznake HTML opravljajo različne naloge, kot je na primer določanje začetka in konca vsakega odstavka (<p> ... </p>) in označevanje mesta za vsako sliko.


Zakaj XML?

Dokumenti HTML in XML vsebujejo podatke, ki so obdani z oznakami, toda tu se podobnost med jezikoma tudi konča. V jeziku HTML oznake določajo videz in delovanje podatkov – naslovi so tukaj, odstavek se začne tam in tako naprej. V jeziku XML oznake določajo strukturo in pomen podatkov – kaj podatki sploh so.

Ko opisujete strukturo in pomen svojih podatkov, omogočite vnovično uporabo teh podatkov na različne načine. Če imate na primer blok podatkov o prodaji in je vsak element v bloku jasno označen, lahko v poročilo o prodaji naložite samo elemente, ki jih potrebujete, preostale elemente pa naložite v računovodsko zbirko podatkov. Povedano drugače, uporabite lahko en sistem za pridobivanje podatkov, ki jih označite z oznakami XML, nato pa te podatke obdelate v poljubnem številu drugih sistemov, ne glede na strojno opremo ali operacijski sistem. Ta prenosljivost je razlog, da je jezik XML postal ena najbolj priljubljenih tehnologij za izmenjavo podatkov.

V nadaljevanju upoštevajte ta dejstva:

  • HTML-ja ni mogoče uporabiti namesto XML-ja. Lahko pa svoje podatke XML obdate z oznakami HTML in jih prikažete na spletni strani.

  • HTML je omejen na vnaprej določen nabor oznak, ki so skupne vsem uporabnikom.

  • XML vam omogoča, da ustvarite poljubno oznako, ki jo potrebujete, če želite opisati svoje podatke in strukturo teh podatkov. Če morate na primer shraniti in dati v skupno rabo informacije o domačih ljubljenčkih. Ustvarite lahko to kodo XML:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Lahko vidite, da oznake XML omogočajo, da ugotovite, natančno kakšne vrste podatkov si ogledujete. Veste, da gre za podatke o mački, in zlahka ugotovite ime in starost mačke in tako naprej. Zmožnost ustvarjanja oznak, ki določajo skoraj vsako strukturo podatkov, je tisto, zaradi česar je XML »razširljiv«.

Oznak v tej vzorčni kodi ne zamenjujte z oznakami v datoteki HTML. Če na primer prilepite to strukturo XML v datoteko HTML in si datoteko ogledate v brskalniku, bodo rezultati videti nekako tako:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Brskalnik prezre vaše oznake XML in prikaže samo podatke.


Nekaj besed o pravilno oblikovanih podatkih

Morda boste slišali koga iz svojega oddelka IT omeniti »pravilno oblikovan« XML. Pravilno oblikovana datoteka XML je skladna z naborom zelo strogih pravil, ki urejajo XML. Če datoteka ne izpolnjuje teh pravil, XML preneha delovati. V prejšnji vzorčni kodi ima na primer vsaka začetna oznaka zaključno oznako, tako da vzorčna koda upošteva pravilo, zaradi katerega je pravilno oblikovana. Če odstranite oznako in poskusite odpreti datoteko v enem od Officeovih programov, boste videli sporočilo o napaki in program vam bo preprečil uporabo datoteke.

Ni nujno, da poznate pravila za ustvarjanje pravilno oblikovanega XML-ja (čeprav jih ni težko razumeti), vendar morate vedeti, da lahko daste podatke XML v skupno rabo med programi in sistemi, samo če so ti podatki pravilno oblikovani. Če ne morete odpreti datoteke XML, ta datoteke verjetno ni pravilno oblikovana.

XML tudi ni odvisen od platforme, kar pomeni, da lahko kateri koli program, ki je ustvarjen za uporabo XML-ja, prebere in obdela vaše podatke XML, ne glede na strojno opremo ali operacijski sistem. Z ustreznimi oznakami XML lahko na primer uporabite namizni program za odpiranje in delo s podatki iz velikega računalnika. In ne glede na to, kdo ustvari entiteto s podatki XML, lahko delate z istimi podatki v več Officeovih programih. Zaradi svoje prenosljivosti je XML postal ena najbolj priljubljenih tehnologij za izmenjavo podatkov med zbirkami podatkov in namizni računalniki uporabnikov.

Jezik XML, ki ga uporabljajo drugi programi

Poleg označenih in dobro oblikovanih podatkov lahko sistemi XML običajno uporabljajo dve dodatni komponenti: sheme in transformacije. V teh razdelkih je razloženo, kako delujejo te dodatne komponente.


Hiter pregled shem

Naj vas izraz »shema« ne prestraši. Shema je samo datoteka XML, ki vsebuje pravila o tem, kaj lahko in česa ne sme vsebovati podatkovna datoteka XML. Datoteke shem običajno uporabljajo datotečno pripono .xsd, medtem ko podatkovne datoteke XML uporabljajo pripono .xml.

Sheme omogočajo programom, da preverjajo veljavnost podatkov. Omogočajo ogrodje za strukturiranje podatkov ter zagotovilo, da je struktura smiselna za avtorja in druge uporabnike. Če uporabnik na primer vnese neveljavne podatke, kot je na primer besedilo v polju z datumom, lahko program pozove uporabnika k vnosu pravilnih podatkov. Dokler so podatki v datoteki XML skladni s pravili v dani shemi, lahko vsak program, ki podpira XML, uporabi to shemo za branje, razlago in obdelavo podatkov. Kot je na primer prikazano v tej ilustraciji, lahko Excel preveri veljavnost podatkov <CAT> s shemo MAČKA.

Sheme omogočajo programom, da imajo podatke XML v skupni rabi.

Sheme lahko postanejo zapletene in namen tega članka ni, da bi se naučili ustvariti shemo. (Poleg tega imate verjetno oddelek za IT, kjer to znajo.) Vendar pa je dobro vedeti, kako so sheme videti. Ta shema določa pravila za nabor oznak <MAČKA> … < /MAČKA>.

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Ne obremenjujte se, če ne razumete vsega v vzorcu. Upoštevajte samo ta dejstva:

  • Elementi vrstice v vzorčni shemi se imenujejo deklaracije. Če potrebujete dodatne informacije o živali, kot so barva ali oznake, obstaja verjetnost, da bi vaš oddelek za IT shemi dodal deklaracijo. Z razvojem poslovnih potreb lahko spreminjate svoj sistem XML.

  • Deklaracije nudijo ogromno nadzora nad strukturo podatkov. Deklaracija <xsd:sequence> na primer pomeni, da se morajo oznake, kot sta <NAME> in <BREED>, zgoditi v vrstnem redu, ki je naveden zgoraj. Deklaracije lahko nadzorujejo tudi vrste podatkov, ki jih uporabniki lahko vnesejo. Zgornja shema na primer zahteva pozitivno število za starost mačke in logične vrednosti (TRUE ali FALSE) vrednosti za oznake SPREMENJENO in BREZ KREMPLJEV.

  • Ko se podatki v datoteki XML skladajo s pravili, ki so na voljo v shemi, so podatki veljavni. Postopek preverjanja podatkovne datoteke XML s shemo se imenuje (logično) preverjanje veljavnosti. Velika prednost pri uporabi sheme je v tem, da vam lahko pomagajo preprečiti poškodovane podatke. Prav tako olajšajo iskanje poškodovanih podatkov, saj se XML ustavi, ko naleti na težavo.


Hiter pregled transformacij

Kot smo že omenili, XML omogoča tudi zmogljive načine za uporabo ali vnovično uporabo podatkov. Mehanizem za vnovično uporabo podatkov se imenuje jezik za pretvorbe XSLT ali poenostavljeno transformacija.

Transformacije lahko uporabite (ne vi, pač pa vaš oddelek za IT) tudi za izmenjavo podatkov med fizičnimi sistemi, kot so zbirke podatkov. Recimo, da so v zbirki podatkov A shranjeni podatki o prodaji v strukturi tabele, ki je primerna za prodajni oddelek. V zbirki podatkov B so shranjeni podatki o prihodkih in stroških v strukturo tabele, ki je prilagojena za računovodski oddelek. Zbirka podatkov B lahko s transformacijo sprejema podatke od A in te podatke zapiše v pravilne tabele.

Kombinacija podatkovne datoteke, sheme in transformacije predstavlja osnovni sistem XML. Na tej sliki je prikazano običajno delovanje teh sistemov. Veljavnost podatkovne datoteke je preverjena s shemo in nato s transformacijo upodobljena v poljubnem številu načinov. V tem primeru transformacija uvede podatke v tabelo na spletni strani.

Osnovna zgradba datoteke XML s shemo in pretvorbo

Ta vzorčna koda prikazuje en način zapisa transformacije. Naloži podatke <MAČKA> v tabelo na spletni strani. Bistvo vzorca ni pokazati, kako zapisati transformacijo, pač pa pokazati eno obliko transformacije.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

Ta vzorec prikazuje, kako je videti ena vrsta transformacije, ko je kodirana, vendar ne pozabite, da lahko preprosto opišete tisto, kar potrebujete od podatkov, v preprostem jeziku. Lahko greste na primer v svoj oddelek za IT in rečete, da želite natisniti podatke o prodaji za določene regije v zadnjih dveh letih, ki »morajo imeti določen videz«. Oddelek za IT lahko nato zapiše (ali spremeni) transformacijo za to opravilo.

Še bolj priročno je to, da Microsoft in vedno več drugih ponudnikov ustvarja transformacije za opravila vseh vrst. V prihodnosti boste verjetno lahko prenesli transformacijo, ki ustreza vašim potrebam, ali transformacijo, ki jo lahko prilagodite svojemu namenu. To pomeni, da bo uporaba XML-ja sčasoma cenejša.


Povzetek XML-ja v sistemu Microsoft Office

Profesionalne izdaje sistema Office ponujajo obsežno podporo XML. Od sistema Microsoft Office 2007 naprej Microsoft Office uporablja oblike zapisa datotek, ki temeljijo na XML-ju, na primer .docx, .xlsx in .pptx. Ker XML shranjuje podatke v obliki besedila namesto v lastni binarni obliki, lahko vaše stranke določijo lastne sheme in uporabljajo vaše podatke na več načinov, ne da bi morale plačati tantieme. Če želite več informacij o novih oblikah zapisa, si oglejte Oblike zapisa Open XML in datotečne pripone. Druge prednosti:

  • Manjša velikost datotek. Nova oblika zapisa uporablja ZIP in druge tehnologije stiskanja za zmanjšanje velikosti datotek za do 75 odstotkov v primerjavi z binarnimi oblikami, ki se uporabljajo v starejših različicah Officea.

  • Lažje obnavljanje podatkov in večja varnost. XML je človeško berljiv, kar pomeni, da lahko poškodovano datoteko odprete v programu Microsoft Notepad ali drugem bralniku besedila in obnovite vsaj nekatere podatke. Nove datoteke so tudi varnejše, saj ne smejo vsebovati kode Visual Basic for Applications (VBA). Če za ustvarjanje predlog uporabljate novo obliko zapisa, so vsi kontrolniki ActiveX in makri VBA v ločenem, varnejšem odseku datoteke. Poleg tega lahko uporabite orodja, kot je na primer Nadzornik dokumentov, za odstranjevanje osebnih podatkov. Če želite več informacij o uporabi Nadzornika dokumentov, si oglejte Odstranjevanje skritih podatkov in osebnih informacij iz Officeovih dokumentov.

Doslej je vse v redu, kaj pa narediti, če imate podatke XML brez sheme? Officeovi programi, ki podpirajo XML, imajo svoje lastne pristope, s katerimi vam pomagajo pri delu s podatki. Excel na primer določi shemo, če odprete datoteko XML, ki je še nima. Excel vam nato da možnost nalaganja teh podatkov v tabelo XML. Sezname in tabele XML lahko uporabite za razvrščanje, filtriranje ali dodajanje izračunov podatkom.

Omogočanje orodja XML v Officeu

Zavihek »Razvijalec« ni prikazan privzeto, vendar ga boste morali dodati na trak, ko boste želeli uporabiti ukaze XML v Officeu.

Razširite svoja znanja
Oglejte si izobraževanje
Prvi dobite nove funkcije
Pridružite se programu Office Insider

Vam je bila informacija v pomoč?

Zahvaljujemo se vam za povratne informacije.

Zahvaljujemo se vam za povratne informacije. Videti je, da bi vam prišla prav pomoč enega od naših Officeovih agentov za podporo.

×