XML iesācējiem

Iespējams, ka esat dzirdējis par paplašināmo iezīmēšanas valodu (XML) un dzirdējis daudzus iemeslus, kāpēc jūsu organizācijā tā būtu jāizmanto. Bet kas tieši ir XML? Šajā rakstā ir izskaidroti XML pamati — kas tā ir un kā darbojas.

Šajā rakstā

Īss iezīmēšanas, atzīmju un tagu apskats

Kas to padara par XML?

Nedaudz par pareizi veidotiem datiem

Ieskats shēmās

Ieskats transformācijās

Īss ieskats XML valodā sistēmā Microsoft Office

Īss iezīmēšanas, atzīmju un tagu apskats

Lai saprastu XML, palīdzēs izpratne par datu atzīmēšanas jēdzienu. Cilvēki jau gadsimtiem ilgi veido dokumentus, un tikpat ilgi dokumentos veic atzīmēšanu. Piemēram, skolotāji visu laiku veic atzīmes audzēkņu darbos. Viņi norāda, lai skolēni pārvieto rindkopas, pārveido teikumus, izlabo pārrakstīšanās kļūdas un tā tālāk. Atzīmju veikšana dokumentā ir veids, kā varam definēt dokumentā esošās informācijas struktūru, nozīmi un vizuālo izskatu. Ja esat lietojis izmaiņu reģistrēšanas līdzekli programmā Microsoft Office Word, esat izmantojis datorizētu atzīmēšanas veidu.

Datorizētajā datu apstrādē “atzīmēšana” ir arī kļuvusi par “iezīmēšanu”. Iezīmēšana ir process, kurā izmanto kodus jeb tagus (ko dēvē arī par atzīmēm vai marķieriem), lai definētu datu struktūru, vizuālo izskatu, un — XML gadījumā — nozīmi.

Šajā rakstā HTML kods ir labs piemērs tam, kā darbojas datorizētā iezīmēšana. Ja to pārlūkojat (pārlūkprogrammā Microsoft Internet Explorer ar peles labo pogu noklikšķiniet uz lapas un pēc tam noklikšķiniet uz Skatīt lapas avotu), redzams gan lasāms teksts, gan hiperteksta iezīmēšanas valodas (HTML) tagi, piemēram, <p> un <h2>. HTML un XML dokumentos tagi ir viegli atpazīstami, jo tie ir leņķiekavās. Šī raksta avota kodā HTML tagi pilda dažādus uzdevumus, piemēram, definē katras rindkopas sākumu un beigas (<p> ... </p>) un iezīmē katra attēla atrašanās vietu.


Kas to padara par XML?

Gan HTML, gan XML dokumenti satur datus, kas ir ietverti tagos, bet šeit līdzība starp abām valodām arī beidzas. HTML gadījumā tagi nosaka datu izskatu un darbību — virsraksti atrodas šeit, rindkopa sākas tur, un tā tālāk. XML gadījumā tagi nosaka datu struktūru un nozīmi — kas īsti šie dati ir.

Kad raksturojat datu struktūru un nozīmi, jūs radāt iespēju datus atkārtoti izmantot visdažādākajos veidos. Piemēram, ja jums ir pārdošanas datu bloks, un katrs bloka vienums ir skaidri identificēts, pārdošanas atskaitē varat ielādēt tikai tai nepieciešamos vienumus, bet pārējos vienumus ielādēt grāmatvedības datu bāzē. Citiem vārdiem sakot, varat izmantot vienu sistēmu, lai ģenerētu datus un tos atzīmētu ar XML tagiem, bet pēc tam šos datus apstrādātu dažnedažādās citās sistēmās neatkarīgi no aparatūras platformas vai operētājsistēmas. Šī pārnesamība ir iemesls, kāpēc XML kļuvusi par vienu no vispopulārākajām tehnoloģijām datu apmaiņas vajadzībām.

Lasot tālāk, atcerieties šos faktus:

  • HTML nevar izmantot XML vietā. Taču XML datus var ietvert HTML tagos un parādīt tīmekļa lapā.

  • HTML aprobežojas tikai ar iepriekšnoteiktu tagu kopu, ko visi lietotāji lieto.

  • XML ļauj izveidot jebkādu tagu, kāds nepieciešams, lai aprakstītu datus un šo datu struktūru. Piemēram, iedomāsimies, ka ir jāsavāc un jākopīgo informācija par mājdzīvniekiem. Varat izveidot šādu XML kodu:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Redzams, ka XML tagi ļauj precīzi uzzināt, kāda veida datus meklējat. Piemēram, ir zināms, ka dati ir par kaķiem, un jūs varat viegli atrast kaķa vārdu, vecumu un tā tālāk. Iespēja izveidot tagus, kas definē gandrīz jebkuru datu struktūru, ir tas, kas XML valodu padara par “paplašināmu”.

Taču nevajadzētu sajaukt tagus šajā koda piemērā ar tagiem HTML failā. Piemēram, ja XML struktūru ielīmējat HTML failā un failu skatāt pārlūkprogrammā, rezultāti izskatās apmēram šādi:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Pārlūkprogramma ignorē XML tagus un rāda tikai datus.


Īsumā par pareizi veidotiem datiem

Iespējams, gadījies dzirdēt kādu IT nodaļas speciālistu pieminam “pareizi veidotu” XML. Pareizi veidots XML fails atbilst ļoti stingru noteikumu prasībām, kas attiecas uz XML darbību. Ja fails neatbilst šiem noteikumiem, XML pārtrauc darboties. Piemēram, iepriekšējā koda piemērā katram sākuma tagam ir beigu tags, jo šajā paraugā ir ievērots viens no pareizas izveides noteikumiem. Ja noņemat atzīmi un mēģināt atvērt šo failu kādā no Office programmām, tiek parādīts kļūdas ziņojums, un programma neļauj failu izmantot.

Jums nav obligāti jāzina XML pareizas izveides noteikumi (lai gan tie ir viegli saprotami), bet ir jāatceras, ka XML datus programmu un sistēmu starpā var koplietot tikai tad, ja šie dati ir pareizi veidoti. Ja nevarat atvērt XML failu, pastāv iespēja, šis fails nav pareizi izveidots.

XML ir arī neatkarīga no platformām, kas nozīmē, ka programmas, kas būvētas XML izmantošanai, var lasīt un apstrādāt XML datus neatkarīgi no aparatūras vai operētājsistēmas. Piemēram, ja ir pareizie XML tagi, var izmantot darbvirsmas programmu, lai atvērtu un strādātu ar datiem no lieldatora. Turklāt neatkarīgi no tā, kurš ir izveidojis XML datu pamatu, varat strādāt ar tiem pašiem datiem vairākās Office programmās. Savas pārnesamības dēļ XML ir kļuvusi par vienu no populārākajām tehnoloģijām datu apmaiņai starp datu bāzēm un lietotāju datoriem.

XML lietošana citās programmās

Papildus ar tagiem atzīmētajiem, pareizi veidotajiem datiem, XML sistēmas parasti izmanto vēl divus komponentus: shēmas un transformācijas. Tālāk ir paskaidrots, kā darbojas šie papildu komponenti.


Ieskats shēmās

Neļaujiet terminam “shēma” sevi iebiedēt. Shēma ir tikai XML fails, kurā ir kārtulas, kas nosaka, kas var un kas nevar atrasties XML datu failā. Shēmas failiem parasti ir faila nosaukuma paplašinājums .xsd, bet XML datu failiem izmantots paplašinājums .xml.

Shēmas ļauj programmām validēt datus. Tās nodrošina pamatu datu strukturēšanai un tam, ka dati ir saprotami veidotājam un citiem lietotājiem. Piemēram, ja lietotājs ievada nederīgus datus, piemēram, tekstu datu laukā, programma var lūgt lietotāju ievadīt pareizos datus. Ja vien dati XML failā atbilst konkrētās shēmas kārtulām, jebkura programma, kas atbalsta XML, var izmantot šo shēmu, lai lasītu, interpretētu un apstrādātu datus. Piemēram, kā redzams nākamajā attēlā, programma Excel var validēt <CAT> datu atbilstību shēmai CAT.

Shēmas ļauj lietojumprogrammām kopīgot XML datus.

Shēmas var būt sarežģītas, un šī raksta mērķis nav jūs apmācīt to izveidē. (Turklāt jums droši vien ir IT nodaļa, kas zina, kā tas darāms.) Tomēr ir noderīgi zināt, kā shēmas izskatās. Šī shēma definē kārtulas tagu kopai <CAT> ... </CAT>.

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Necentieties saprast visu, kas paraugā attēlots. Paturiet prātā šos faktus:

  • Rindiņu vienumi parauga shēmā tiek dēvēti par deklarācijām. Ja jums būtu nepieciešama papildinformācija par dzīvnieku, piemēram, tā krāsa, pastāv iespēja, ka IT nodaļa shēmai pievienotu deklarāciju. Savu XML sistēmu varat mainīt atbilstoši tam, kā attīstās jūsu biznesa vajadzības.

  • Deklarācijas nodrošina milzīgas iespējas noteikt datu struktūru. Piemēram, deklarācija <xsd:sequence> nozīmē, ka tagiem, piemēram, <NAME> un <BREED>, ir jābūt tādā secībā, kā tie ir norādīti augstāk. Deklarācijas var arī noteikt, kādu tipu datus lietotāji var ievadīt. Piemēram, iepriekš norādītā shēma paredz, ka ir jābūt pozitīvam skaitlim, norādot kaķa vecumu, un Būla vērtībām (TRUE vai FALSE) tagiem ALTERED (kastrēts) un DECLAWED (nogriezti nagi).

  • Ja dati XML failā atbilst shēmā norādītajām kārtulām, var apgalvot, ka dati ir derīgi. XML datu faila pārbaudīšanu, salīdzinot ar shēmu, (gluži loģiski) sauc par validāciju. Lielā shēmu izmantošanas priekšrocība ir tā, ka tās var palīdzēt izvairīties no bojātiem datiem. Tās arī atvieglo bojātu datu atrašanu, jo XML pārstāj darboties, ja radusies problēma.


Ieskats transformācijās

Kā jau iepriekš minēts, XML piedāvā arī jaudīgas datu izmantošanas un atkārtotas izmantošanas iespējas. Datu atkārtotas izmantošanas mehānismu dēvē par paplašināmo stila lapu valodas transformāciju (XSLT) jeb vienkārši par transformāciju.

Jūs (vai drīzāk jūsu IT nodaļa) var izmantot transformācijas, lai arī apmainītos ar datiem starp aizmugursistēmām, piemēram, datu bāzēm. Pieņemsim, ka datu bāzē A tiek glabāti pārdošanas dati tabulas struktūrā, kas ir lieliski piemērota tirdzniecības nodaļai. Datu bāzē B tiek glabāti ieņēmumu un izdevumu dati tabulas struktūrā, kas ir ērta grāmatvedības nodaļai. Datu bāze B var izmantot transformāciju, lai akceptētu datus no A un šos datus ierakstītu pareizajās tabulās.

Datu faila, shēmas un transformācijas kombinācija veido XML pamatsistēmu. Nākamajā attēlā ir parādīts, kā šādas sistēmas parasti darbojas. Datu fails tiek validēts pret shēmu un pēc tam, izmantojot transformāciju, atveidots dažādos lietojamos veidos. Šajā gadījumā transformācija izvieto datus tabulā tīmekļa lapā.

Pamata XML faila struktūra ar shēmu un transformāciju

Tālāk sniegtajā parauga kodā parādīts viens no veidiem, kā rakstīt transformāciju. Tas ielādē <CAT> datus tabulā tīmekļa lapā. Bez tam, parauga mērķis nav parādīt, kā rakstīt transformāciju, bet parādīt vienu no formām, kādā var būt transformācijas.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

Šajā paraugā ir parādīts, kā viens transformācijas veids varētu izskatīties kodā, taču atcerieties, ka to, kas jums no datiem būtu vajadzīgs, varat vienkārši aprakstīt parastā valodā. Piemēram, varat doties uz IT nodaļu un izstāstīt, ka vēlaties izdrukāt pārdošanas datus par konkrētiem reģioniem pēdējo divu gadu laikā “un datiem vajadzētu izskatīties šādi”. Tad IT nodaļa var uzrakstīt (vai izmainīt) transformāciju, lai paveiktu šo uzdevumu.

To visu vēl ērtāku padara tas, ka Microsoft un arvien vairāk citu piegādātāju sagatavo transformācijas visu veidu uzdevumiem. Pastāv iespēja, ka nākotnē varēsit lejupielādēt transformāciju, kas vai nu atbilst jūsu prasībām vai ko varat pielāgot atbilstoši jūsu vajadzībām. Tas nozīmē, ka XML izmantošana ar laiku maksās lētāk.


Ieskats XML valodā sistēmā Microsoft Office

Office profesionālajos izdevumos ir nodrošināts plašs XML atbalsts. Sākot ar 2007. gada versijas Microsoft Office sistēmu, Microsoft Office izmanto failu formātus, kam pamatā ir XML, piemēram, .docx, .xlsx un .pptx. Tā kā XML datus glabā teksta formātā, nevis iebūvētajā binārajā formātā, jūsu klienti var definēt savas shēmas un jūsu datus izmantot dažādos veidos, nemaksājot autoratlīdzību par datu izmantošanu. Papildinformāciju par jaunajiem formātiem skatiet rakstā Open XML formāti un failu nosaukumu paplašinājumi. Citas priekšrocības:

  • Mazāks faila lielums. Jaunais formāts izmanto ZIP un citas saspiešanas tehnoloģijas, lai samazinātu failu lielumu pat par 75% salīdzinājumā ar binārajiem formātiem, kas tiek izmantoti iepriekšējās Office versijās.

  • Vieglāka informācijas atkopšana un lielāka drošība. XML ir cilvēklasāma, tāpēc, ja fails tiek bojāts, varat atvērt failu programmā Microsoft Piezīmjbloks vai citā teksta lasītājā un atkopt vismaz daļu informācijas. Tāpat jaunie faili ir drošāki, jo tajos nevar būt Visual Basic for Applications (VBA) kods. Ja jauno formātu izmantojat, lai izveidotu veidnes, visas ActiveX vadīklas un VBA makro atrodas atsevišķā, drošākā faila sadaļā. Turklāt varat izmantot rīkus, piemēram, dokumentu kontrolieri, lai noņemtu personiskos datus. Papildinformāciju par dokumentu kontrolieri skatiet rakstā Slēpto datu un personiskās informācijas noņemšana no Office dokumentiem.

Tiktāl viss būtu skaidrs, bet kā rīkoties, ja jums ir XML dati, bet nav shēmas? Office programmām, kas atbalsta XML, ir sava pieeja, kā palīdzēt strādāt ar datiem. Piemēram, Excel piemēro shēmu, ja atverat XML failu, kuram shēmas nav. Excel piedāvā iespēju šos datus ielādēt XML tabulā. XML sarakstus un tabulas varat izmantot, lai datus kārtotu, filtrētu vai tiem pievienotu aprēķinus.

XML rīku iespējošana sistēmā Office

Cilne Izstrādātājs netiek rādīta pēc noklusējuma, bet, lai lietotu XML komandas sistēmā Office, jums tā ir jāpievieno lentei.

Paplašiniet savas prasmes
Iepazīties ar apmācību
Esiet pirmais, kas saņem jaunās iespējas
Pievienoties Office Insider programmai

Vai šī informācija bija noderīga?

Paldies par jūsu atsauksmēm!

Paldies par atsauksmēm! Šķiet, ka varētu būt noderīgi sazināties ar kādu no mūsu Office atbalsta aģentiem.

×