XML za početnike

Možda ste čuli za Extensible Markup Language (XML) i možda ste čuli za mnoge razloge zašto bi ga vaša tvrtka ili ustanova trebala koristiti. Ali što je zapravo XML? U ovom se članku objašnjavaju osnove XML-a – što je to i kako funkcionira.

Sadržaj članka

Kratki pregled ocjenjivanja, obilježavanja i označavanja

Što ga čini XML-om?

Ukratko o pravilno oblikovanim podacima

Kratki pregled shema

Kratki pregled pretvaranja

Kratki pregled XML-a u sustavu Microsoft Office

Kratki pregled ocjenjivanja, obilježavanja i označavanja

Da biste razumjeli XML, korisno je shvatiti ideju obilježavanja podataka. Ljudi su dokumente stvarali stoljećima i isto su ih toliko dugo obilježavali. Nastavnici, na primjer, stalno ocjenjuju radove učenika. Upućuju ih na premještanje odlomaka, pojašnjenje rečenica, ispravljanje pravopisnih pogrešaka itd. Obilježavanje dokumenta način je na koji definiramo strukturu, značenje i izgled informacija u dokumentu. Ako ste ikada koristili značajku evidentiranja promjena u programu Microsoft Office Word, koristili ste računalni oblik obilježavanja.

„Ocjenjivanje” se u računalstvu razvilo u „označavanje”. Označavanje je proces korištenja kodova koji se zovu oznake (ponekad i tokeni) radi definiranja strukture, izgleda i – u slučaju XML-a – značenja podataka.

HTML kod za ovaj članak dobar je primjer računalnog označavanja na djelu. Ako ga pregledate (u pregledniku Microsoft Internet Explorer desnom tipkom miša kliknite stranicu, a zatim kliknite Prikaži izvor), vidjet ćete kombinaciju čitljivog teksta i HTML (Hypertext Markup Language) oznaka, kao što su <p> i <h2>. Oznake u HTML i XML dokumentima jednostavno je prepoznati jer su okružene uglatim zagradama. U izvornom kodu ovog članka HTML oznake izvršavaju različite zadatke, kao što su definiranje početka i završetka svakog odlomka (<p>...</p>) i označavanje mjesta svake slike.


Što ga čini XML-om?

HTML i XML dokumenti sadrže podatke okružene oznakama, ali to je jedina sličnost između ta dva jezika. U HTML-u oznake definiraju izgled i dojam podataka – naslovi idu ovdje, odlomak počinje ovdje itd. U XML-u oznake definiraju strukturu i značenje podataka – što podaci jesu.

Kada opisujete strukturu i značenje podataka, omogućujete ponovno korištenje podataka na nebrojeno mnogo načina. Ako, na primjer, imate grupu podataka o prodaji i svaka stavka u grupi jasno je identificirana, samo stavke koje su vam potrebne možete učitati u izvješće o prodaji, a ostale u bazu programa računovodstva. Drugim riječima, jedan sustav možete koristiti za generiranje podataka i označavanje XML oznakama, a zatim ih obraditi u bilo kojem sustavu, neovisno o hardverskoj platformi ili operacijskom sustavu. Takva je prenosivost razlog zašto je XML postao jedna od najpopularnijih tehnologija razmjene podataka.

Tijekom rada imajte na umu sljedeće činjenice:

  • Ne možete koristiti HTML umjesto XML-a. No XML podatke možete umetnuti unutar HTML oznaka i prikazati i ih na web-stranici.

  • HTML je ograničen na unaprijed definirani skup oznaka koje svi korisnici zajednički koriste.

  • XML vam omogućuje stvaranje bilo koje oznake koja vam je potrebna za opisivanje podataka i strukture tih podataka. Recimo, na primjer, da morate pohraniti i omogućiti zajedničko korištenje podataka o kućnim ljubimcima. Možete stvoriti sljedeći XML kod:

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

Kao što vidite, zahvaljujući XML oznakama znate točno koju vrstu podataka pregledavate. Znate, na primjer, da se ovi podaci odnose na mačku te jednostavno možete pronaći njezino ime, starost itd. Mogućnost stvaranja oznaka koje definiraju gotovo bilo koju strukturu podataka čini XML „proširivim”.

Ali nemojte pobrkati oznake u tom primjeru koda s oznakama u HTML datoteci. Ako, na primjer, XML strukturu zalijepite u HTML datoteku i pregledavate datoteku u pregledniku, rezultati će izgledati ovako nekako:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Preglednik zanemaruje XML oznake i prikazuje samo podatke.


Ukratko o pravilno oblikovanim podacima

Možda ćete ćuti kada netko iz IT odjela kaže da je XML „pravilno oblikovan”. Pravilno oblikovana XML datoteka pridržava se skupa vrlo strogih pravila koja upravljaju XML-om. Ako datoteka nije u skladu s tim pravilima, XML će prestati funkcionirati. U prethodnom primjeru koda, na primjer, svaka lijeva oznaka ima desnu oznaku, stoga se primjer pridržava jednog od pravila pravilnog oblikovanja. Ako uklonite oznaku i pokušate otvoriti tu datoteku pomoću jednog od programa sustava Office, prikazat će se poruka o pogrešci, a program će vas zaustaviti pri korištenju datoteke.

Ne trebate nužno znati pravila stvaranja pravilno oblikovanog XML-a (iako ih je jednostavno shvatiti), ali morate imati na umu da XML podatke možete dijeliti između programa i sustava samo ako su podaci pravilno oblikovani. Ako ne možete otvoriti XML datoteku, datoteka vjerojatno nije pravilno oblikovana.

XML ne ovisi o platformi, tj. svaki program stvoren za korištenje XML-a može čitati i obrađivati XML podatke, neovisno o hardveru ili operacijskom sustavu. Odgovarajuće XML oznake omogućuju vam, na primjer, korištenje programa za računala za otvaranje podataka i rad s njima iz glavnog računala. Neovisno o tome tko stvori tijelo XML podataka, s istim podacima možete raditi u nekoliko programa sustava Office. S obzirom na to da je prenosiv, XML je postao jedna od najpopularnijih tehnologija za razmjenu podataka između baza podataka i računala korisnika.

korištenje xml-a s drugim programima

Osim označenih, pravilno oblikovanih podataka, XML obično koristi dvije dodatne komponente: sheme i pretvaranja. U sljedećim je odlomcima objašnjeno kako te dodatne komponente funkcioniraju.


Kratki pregled shema

Nemojte se prepasti pojma „shema”. Shema je samo XML datoteka koja sadrži pravila što se može, a što ne može nalaziti u podatkovnoj XML datoteci. Datoteke sheme obično koriste nastavak .xsd u nazivu datoteke, a XML podatkovne datoteke koriste nastavak. xml.

Sheme omogućuju programima provjeru valjanosti podataka. Pružaju okvir za strukturiranje podataka i jamče smislenost autoru i ostalim korisnicima. Ako, primjerice, korisnik unese podatke koji nisu valjani, na primjer tekst u polje za datum, program može korisnika obavijestiti da unese odgovarajuće podatke. Sve dok su podaci u XML datoteci usklađeni s pravilima u navedenoj shemi, svi programi koji podržavaju XML mogu koristiti tu shemu za čitanje, tumačenje i obradu podataka. Kao što se vidi na sljedećoj slici, Excel može provjeriti valjanost podataka <CAT> u odnosu na shemu MAČKA.

sheme aplikacijama omogućuju zajedničko korištenje xml podataka.

Sheme mogu postati složene, a da biste naučili kako ih stvoriti, ovaj bi članak trebao biti opsežniji (ali vjerojatno vaš IT odjel zna kako to učiniti). No korisno je znati kako shema izgleda. Sljedeća shema definira pravila za skup oznaka <MAČKA> ... </MAČKA>.

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

Ne brinite se, ne morate razumjeti sve navedeno u primjeru. Imajte na umu sljedeće:

  • stavke retka u oglednoj shemi zovu se deklaracije. Ako su vam potrebne dodatne informacije o životinji, kao što su boja ili šare, IT odjel će vjerojatno dodati deklaraciju u shemu. XML sustav možete mijenjati u skladu s razvojem poslovnih potreba.

  • deklaracije pružaju velik broj kontrola strukture podataka. Deklaracija <xsd:sequence>, na primjer, znači da se oznake, kao što su <NAME> i <BREED> , moraju prikazivati gore navedenim redoslijedom. Deklaracije mogu kontrolirati vrste podataka koje korisnici unose. Za gore navedenu shemu, na primjer, potreban je pozitivan broj za starost mačke te Booleove vrijednosti (TRUE ili FALSE) za oznake STERILIZIRANA i UKLONJENE KANDŽE.

  • kada su podaci u XML datoteci u skladu s pravilima koje navodi shema, za te se podatke kaže da su valjani. Proces provjere podatkovne XML datoteke u odnosu na shemu zove se (logično) provjera valjanosti. Glavna prednost korištenja shema jest činjenica da mogu spriječiti pojavu oštećenih podataka. Pojednostavnjuju i pronalaženje oštećenih podataka jer XML se zaustavlja kada naiđe na problem.


Kratki pregled pretvaranja

Kao što smo već spomenuli, XML nudi snažne načine korištenja ili ponovnog korištenja podataka. Mehanizam ponovnog korištenja podataka zove se XSLT (Extensible Stylesheet Language Transformation) ili, jednostavno, pretvaranje.

Vi (u redu, vaš IT odjel) možete koristiti pretvaranja radi razmjene podataka između pozadinskih sustava, kao što su baze podataka. Recimo, na primjer, da Baza podataka A pohranjuje podatke o prodaji u tablicu koja dobro funkcionira za odjel prodaje. Baza podataka B pohranjuje podatke o prihodu i troškovima u tablicu koja je prilagođena odjelu računovodstva. Baza podataka B može koristiti pretvaranje radi prihvaćanja podataka iz Baze podataka A i upisati ih u odgovarajuće tablice.

Kombinacija podatkovne datoteke, sheme i pretvaranja čini osnovni XML sustav. Sljedeća slika prikazuje uobičajeni način funkcioniranja sustava. Podatkovna je datoteka provjerena u odnosu na shemu, a zatim pomoću pretvaranja prikazana na sve praktične načine. U ovom slučaju pretvaranje implementira podatke u tablicu na web-stranici.

Osnovna struktura XML datoteke sa shemom i pretvorbom

Sljedeći primjer koda prikazuje jedan način pisanja pretvaranja. Učitava podatke za <MAČKA> u tablicu na web-stranici. Svrha primjera nije prikazati kako napisati pretvaranje, nego prikazati oblik koji pretvaranje može preuzeti.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

U ovom se primjeru prikazuje kako jedna vrsta pretvaranja može izgledati kada je kodirana, ali imajte na umu da opisati što vam je potrebno od podatka možete samo na engleskom jeziku. Možete, na primjer,od IT odjela zatražiti ispis podataka o prodaji za određena područja za zadnje dvije godine i reći „treba izgledati ovako”. IT odjel može napisati (ili promijeniti) pretvaranje koje će izvršiti taj zadatak.

A najpraktičnije je što Microsoft i sve veći broj proizvođača stvaraju pretvaranja za poslove svih vrsta. U budućnosti ćete vjerojatno moći preuzeti pretvaranje koje ili zadovoljava vaše potrebe ili koje možete prilagoditi vlastitim potrebama. To znači da će XML vremenom biti jeftiniji.


Kratki pregled XML-a u sustavu Microsoft Office

Profesionalna izdanja sustava Office nude opsežnu podršku za XML. Počevši od sustava Microsoft Office 2007, Microsoft Office koristi XML oblike datoteka, kao što su .docx, .xlsx i .pptx. S obzirom na to da XML pohranjuje podatke u tekstnom obliku, a ne binarnom, vaši korisnici mogu definirati vlastite sheme i koristiti vaše podatke na više načina, a ne moraju plaćati autorske naknade. Dodatne informacije o novim oblicima potražite u članku Otvaranje XML oblika i datotečni nastavci. Ostale prednosti obuhvaćaju sljedeće:

  • manje veličine datoteka. Novi oblik koristi ZIP i ostale tehnologije sažimanja radi smanjivanja većine datoteka do 75 posto u odnosu na binarne oblike koji se koriste u starijim verzijama sustava Office.

  • jednostavniji oporavak podataka i bolja zaštita. XML mogu čitati ljudi, stoga ako se datoteka ošteti, možete je otvoriti u Microsoftovu bloku za pisanje ili nekom drugom čitaču tekstova i oporaviti barem jedan dio podataka. Nove su datoteke i sigurnije jer ne sadrže VBA (Visual Basic for Applications) kod. Ako koristite novi oblik za stvaranje predložaka, sve ActiveX kontrole i VBA makronaredbe nalaze se u zasebnom, sigurnijem dijelu datoteke. Uz to, možete koristiti alate, kao što je kontrola dokumenata, radi uklanjanja svih osobnih podataka. Dodatne informacije o korištenju kontrole dokumenata potražite u članku Uklanjanje skrivenih i osobnih podataka iz dokumenata sustava Office.

Zasad je sve jasno, ali što ako imate XML podatke bez sheme? Programi sustava Office koji podržavaju XML imaju vlastite pristupe koji vam pojednostavnjuju rad s podacima. Excel, na primjer, naznačuje shemu ako otvorite XML datoteku koja još nema shemu. Excel vam potom nudi mogućnost učitavanja tih podataka u XML tablicu. XML popise i tablice možete koristiti za sortiranje ili dodavanje izračuna u podatke.

Omogućivanje XML podataka u sustavu Office

Kartica Programer ne prikazuje se po zadanom, no morat ćete je dodati na vrpcu kada želite koristiti XML naredbe u sustavu Office.

Proširite svoje vještine
Istražite osposobljavanje

Jesu li vam ove informacije bile korisne?

Hvala vam na povratnim informacijama!

Hvala vam na povratnim informacijama! Čini se da bi vam pomoglo kad bismo vas povezali s nekim od naših agenata podrške za Office.

×