Neinicijuoto XML

Galbūt girdėjote apie išplėstinę dokumentų aprašų kalbą (XML) ir daug priežasčių, kodėl jūsų organizacija turėtų ją naudoti. Bet kas tiksliai yra XML? Šiame straipsnyje paaiškinami XML pagrindai – kas tai ir kaip tai veikia.

Šiame straipsnyje:

Trumpa žymėjimo, dokumentų aprašų ir žymių apžvalga

Taigi, kas yra XML?

Trumpai apie tinkamus duomenis

Greita schemų apžvalga

Greita transformacijų apžvalga

Žvilgsnis į „Microsoft Office“ sistemoje esančią XML

Trumpa žymėjimo, dokumentų aprašų ir žymių apžvalga

Norint suprasti XML, gerai suprasti duomenų žymėjimo idėją. Žmonės kūrė dokumentus per amžius ir tiek pat laiko juos žymėjo. Pvz., mokytojai žymi mokinių darbuose visą laiką. Jie nurodo, kur mokiniai turi perkelti pastraipas, paaiškina sakinius, ištaiso rašybos klaidas ir t. t. Dokumento žymėjimas yra tai, kaip mes apibrėžiame dokumento informacijos struktūrą, reikšmę ir išvaizdą. Jei kada nors naudojote „Microsoft Office Word“ keitimų sekimo funkciją, naudojote kompiuterizuotą žymėjimo formą.

Kompiuterijoje „žymėjimas“ išsivystė ir į „dokumentų aprašus“. „Dokumentų aprašymas“ – tai procesas, kuriame naudojami kodai (arba kartais vadinami atpažinimo ženklai), kad būtų aprašyta struktūra, išvaizda ir – XML atveju – visų duomenų prasmė.

Šio straipsnio HTML kodas yra geras veikiančio kompiuterinio žymėjimo pavyzdys. Jei jį naršysite („Microsoft Internet Explorer“ dešiniuoju pelės mygtuku spustelėkite puslapį, tada spustelėkite Rodyti šaltinį), matysite perskaitomo teksto ir dokumentų aprašų kalbos (HTML) žymių, pvz., <p> ir <h2>, mišinį. HTML ir XML žymes dokumentuose lengva atpažinti, nes jos yra laužtiniuose skliaustuose. Šios straipsnio kodo šaltinyje HTML žymės atlieka įvairias užduotis, pvz., nustato kiekvienos pastraipos pradžią ir pabaigą (<p> ... </p>) ir pažymėti kiekvieno vaizdo vietą.


Taigi, kas yra XML?

Ir HTML, ir XML dokumentuose yra duomenų, apsuptų žymėmis, bet tuo šių dviejų kalbų panašumas ir baigiasi. HTML dokumente žymės nustato duomenų išvaizdą – čia pateikiamos antraštės, čia prasideda pastraipos ir t. t. XML dokumente žymės nustato struktūrą ir duomenų prasmę – kas tie duomenys yra.

Kai aprašote struktūrą ir duomenų prasmę, duomenis galite iš naujo panaudoti įvairiais būdais. Pvz., jei yra pardavimo duomenų blokas ir bloke aiškiai nurodytas kiekvienas elementas, galite įkelti tik pardavimo ataskaitai reikalingus elementus, o kitus elementus įkelti į apskaitos duomenų bazę. Kitaip tariant, galite naudoti vieną sistemą, kad sugeneruotumėte duomenis ir juos pažymėtumėte XML žymėmis, tada apdorotumėte tuos duomenis įvairiose kitose sistemose, neatsižvelgiant į aparatūros platformą ar operacinę sistemą. Dėl tokio mobilumo XML tapo viena iš populiariausių apsikeitimo duomenimis technologijų.

Prieš tęsdami prisiminkite šiuos faktus:

  • Vietoj XML negalite naudoti HTML. Tačiau XML duomenis galite apgaubti HTML žymėmis ir pateikti tinklalapyje.

  • HTML naudoja iš anksto apibrėžtą žymių, kurias naudoja visi vartotojai, rinkinį.

  • XML leidžia sukurti bet kokią žymę, reikalingą duomenims ir tų duomenų struktūrai aprašyti. Pvz., tarkime, kad turite saugoti ir bendrinti informaciją apie augintinius. Galite sukurti šį XML kodą:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Matote, kad pagal XML žymes galima sužinoti, kokius tiksliai duomenis peržiūrite. Pvz., žinote, kad tai duomenys apie katę, galite lengvai rasti katės vardas, amžių ir t. t. Galimybė sukurti žodžius, apibrėžiančius beveik bet kurią duomenų struktūrą, – štai kas daro XML „išplečiama“.

Nesupainiokite šiame kodo pavyzdyje pateiktų žymių su žymėmis HTML faile. Pvz., jei į HTML failą įklijuosite XML struktūrą ir peržiūrėti failą naršyklėje, rezultatas atrodys maždaug taip:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Naršyklė nepaiso jūsų XML žymių ir rodo tik duomenis.


Trumpai apie tinkamus duomenis

Galbūt girdėjote ką nors iš jūsų IT skyriaus minint tinkamą XML. Tinkamas XML failas atitinka labai griežtų taisyklių, kurios valdo XML, rinkinį. Jei failas neatitinka šių taisyklių, XML nebeveikia. Pvz., ankstesniame kodo pavyzdyje, kiekvieną atidarymo žymę atitinka uždarymo žymė, todėl šis pavyzdys atitinka vieną iš tinkamumo taisyklių. Jei pašalinsite žymę ir tą failą bandysite atidaryti vienoje iš „Office“ programų, pamatysite klaidos pranešimą ir programa neleis naudoti failo.

Jums nebūtina žinoti tinkamo XML kūrimo taisyklių (nors jas lengva suprasti), tačiau reikia prisiminti, kad XML duomenis galėsite bendrinti su programomis ir sistemomis tik tada, jei duomenys bus tinkami. Jei negalite atidaryti XML failo, tikėtina, kad jis netinkamai sukurtas.

Be to, XML nepriklauso platformos, tai reiškia, kad bet kuri programa, sukurta naudoti XML, gali skaityti ir apdoroti jūsų XML duomenis, neatsižvelgiant į aparatūrą ar operacinę sistemą. Pvz., esant tinkamoms XML žymėms, asmeninio kompiuterio programa galite atidaryti duomenis iš centrinio kompiuterio ir su jais dirbti. Ir neatsižvelgiant į tai, kas sukūrė XML duomenų tekstą, su tais pačiais duomenimis galite dirbti keliomis „Office“ programomis. XML tokia mobili, kad tapo viena iš populiariausių technologijų, skirtų keistis duomenimis tarp duomenų bazių ir vartotojų asmeninių kompiuterių.

XML, naudojama kitose programose

Be pažymėtų, tinkamų duomenų, XML sistemos paprastai naudoja du papildomus komponentus: schemas ir transformacijas. Tolesniuose skyriuose aiškinama, kaip šie papildomi komponentai veikia.


Greita schemų apžvalga

Neišsigąskite termino „schema“. Schemos – tai tiesiog XML failas, kuriame yra taisyklių, nurodančių, kas gali ir ko negali būti XML duomenų failą. Schemos failams paprastai naudojamas .xsd failo vardo plėtinys, o XML duomenų failams .xml plėtinys.

Naudodamos schemas programos gali patikrinti duomenis. Jos pateikia duomenų struktūrizavimo sistemą ir užtikrina, kad ji bus logiška ir kūrėjui, ir kitiems vartotojams. Pvz., jei vartotojas įveda netinkamus duomenis (tarkime, tekstą datos lauke), programa gali paraginti vartotoją įvesti tinkamus duomenis. Tol, kol XML failo duomenys atitinka nurodytos schemos taisykles, visos programos, palaikančios XML, gali tą schemą naudoti duomenims skaityti, interpretuoti ir tvarkyti. Pvz., kaip parodyta tolesnėje iliustracijoje, „Excel“ galite patikrinti <CAT> duomenis pagal CAT schemą.

Schemos leidžia programoms bendrai naudoti XML duomenis.

Schemos gali būti sudėtingos ir mokyti, kaip jas sukurti, ne šio straipsnio tema. (Beje, pas jus tikriausiai yra IT skyrius, kuris žino, kaip tai padaryti.) Tačiau naudinga žinoti, kaip schemos atrodo. Ši schema apibrėžia žymių rinkinio <CAT>... </CAT> taisykles.

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Nesirūpinkite, kad ne viską pavyzdyje suprantate. Tiesiog turėkite omenyje šiuos dalykus:

  • Pavyzdžio schemos eilutės elementai vadinami aprašais. Jei reikia papildomos informacijos apie gyvūną, pvz., jo spalvą arba ženklinimą, tikėtina, jūsų IT skyrius įtrauks į schemą aprašą. Savo XML sistemą galite keisti pagal besikeičiančius įmonės poreikius.

  • Aprašai labai padeda valdyti duomenų struktūrą. Pvz., <xsd:sequence> aprašas reiškia, kad tokios žymės kaip <NAME> ir <BREED> turi būti pateikiamos tokia tvarka, kaip jos aukščiau išvardytos. Aprašai taip pat gali valdyti, kokius duomenų tipus vartotojai gali įvesti. Pvz., aukščiau pateiktoje schemoje reikalaujama, kad katės amžius būtų teigiamas skaičius, o žymių ALTERED ir DECLAWED reikšmės – Bulio logikos reikšmės (TRUE arba FALSE) .

  • Kai XML failo duomenys atitinka schemos pateiktas taisykles, tuomet duomenys vadinami tinkamais. XML duomenų failo įvertinimo pagal schemą procesas vadinamas (logiškai pakankamu) tikrinimu. Didelė schemų naudojimo nauda – jos gali padėti išvengti sugadintų duomenų. Jos taip pat padeda lengvai rasti sugadintus duomenis, nes XML sustoja, kai susiduria su problema.


Greita transformacijų apžvalga

Kaip minėjome anksčiau, XML taip pat suteikia efektyvių būdų duomenims naudoti arba pakartotinai jiems naudoti. Pakartotinio duomenų naudojimo mechanizmas vadinamas išplėstosios stiliaus aprašo kalbos transformacija (XSLT) arba tiesiog transformacija.

Jūs (gerai, jūsų IT skyrius) taip pat galite naudoti transformacijas norėdami keistis duomenimis tarp vidinių sistemų, pvz., duomenų bazių. Pvz., tarkime, kad duomenų bazėje A pardavimo duomenys saugomi lentelės struktūroje, kuri puikiai tinka pardavimo skyriui. Duomenų bazėje B pajamų ir išlaidų duomenys saugomi lentelės struktūroje, pritaikytoje apskaitos skyriui. Duomenų bazė B gali naudoti transformaciją, kad priimtų duomenis iš A, ir įrašytų juos į tinkamas lenteles.

Duomenų failo, schemos ir transformacijos derinys sudaro bazinę XML sistemą. Toliau pateiktoje iliustracijoje parodyta, kaip tokios sistemos paprastai veikia. Duomenų failas tikrinamas pagal schemą, tada, pasitelkus transformaciją, atvaizduojamas įvairiais naudingais būdais. Šiuo atveju transformacija tinklalapyje duomenis išdėsto lentelėje.

Bazinė XML failo struktūra su schema ir transformacija

Toliau pateiktame kodo pavyzdyje parodytas vienas būdas transformacijai parašyti. Žiniatinklyje ji įkelia <CAT> duomenis į lentelę. Kartojame, pavyzdžio esmė – ne parodyti, kaip parašyti transformaciją, bet parodyti vieną iš formų, kurią gali įgauti transformaciją.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

Šiame pavyzdyje parodyta vieno tipo transformacija, kaip ji gali atrodyti koduota, bet nepamirškite, kad galite tiesiog paprasta kalba aprašyti, ko norite iš duomenų. Pvz., galite nueiti į IT skyrių ir pasakyti, kad norite išspausdinti tam tikrų regionų 2 metų pardavimo duomenis ir, kad „jie atrodytų va taip“. Tad IT skyrius gali parašyti (arba pakeisti) transformaciją, kuri atliktų šią užduotį.

Kas yra dar patogiau – „Microsoft“ ir didėjantis kaičius kitų tiekėjų kuria transformacijas įvairioms užduotims atlikti. Greičiausiai ateityje galėsite atsisiųsti transformaciją, kuri atitiks jūsų poreikius arba kurią galėsite pakoreguoti pagal savo tikslą. Tai reiškia, kad laikui bėgant XML naudoti bus pigiau.


Žvilgsnis į „Microsoft Office“ sistemoje esančią XML

„Office Professional“ leidimuose pateikiamas platus XML palaikymas. Pradedant nuo 2007 m. „Microsoft Office“ sistemos, „Microsoft Office“ naudojami XML pagrindu veikiantys failų formatai, pvz., .docx, .xlsx ir .pptx. XML duomenys saugomi teksto formatu, o ne priklausančiu nuosavybės teisėmis dvejetainiu formatu, todėl jūsų klientai gali nustatyti savo schemas ir naudoti duomenis įvairesniais būdais – visa tai nemokant už autorines teises. Daugiau informacijos apie naujus formatus rasite „Open XML“ formatai ir failų vardų plėtiniai. Kiti pranašumai:

  • Mažesnio dydžio failai. Naujajame formate naudojamos ZIP ir kitos glaudinimo technologijos, kad būtų sumažintas failo dydis – iki 75 procentų, palyginti su dvejetainiais formatais, naudotais ankstesnėse „Office“ versijose.

  • Paprastesnis informacijos atkūrimas ir geresnė sauga. XML gali perskaityti žmogus, todėl jei failas sugadinamas, galite jį atidaryti naudodami „Microsoft“ užrašinę ar kitą teksto skaitytuvą ir atkurti bent dalį savo informacijos. Be to, nauji failai saugesnis, nes juose negali būti „Visual Basic for Applications“ (VBA) kodo. Jei naująjį formatą naudojate šablonams kurti, visi „ActiveX“ valdikliai ir VBA makrokomandos laikomos atskirai, saugesnėje failo sekcijoje. Be to, galite naudoti įrankius, pvz. dokumentų inspektorių, kad pašalintumėte visus asmeninius duomenis. Daugiau informacijos apie dokumentų inspektoriaus naudojimą, žr. straipsnį Paslėptų duomenų ir asmeninės informacijos šalinimas iš „Office“ dokumentų.

Kol kas viskas gerai, bet ką daryti, jei turite XML duomenis be schemos? „Office“ programose, palaikančiose XML, yra būdų, padėsiančių dirbti su duomenimis. Pvz., „Excel“ numano, kokia turi būti schema, jei atidarote XML failą, kuriame jos dar nėra. Tuomet „Excel“ suteikia galimybę įkelti šiuos duomenis į XML lentelę. XML sąrašus ir lenteles galite naudoti duomenims rikiuoti, filtruoti ar įtraukti skaičiavimus.

XML įrankių įgalinimas „Office“ pakete

Pagal numatytuosius parametrus skirtukas Programų kūrėjas nerodomas, todėl turite jį įtraukti į juostelę, jei „Office“ paketo programose norite naudoti XML komandas.

Tobulinkite savo įgūdžius
Ieškoti mokymo
Pirmiausia gaukite naujų funkcijų
Prisijunkite prie „Office Insider“ dalyvių

Ar ši informacija buvo naudinga?

Dėkojame už jūsų atsiliepimus!

Dėkojame už jūsų atsiliepimą! Panašu, kad gali būti naudinga jus sujungti su vienu iš mūsų „Office“ palaikymo agentų.

×