XML cho bản chưa khởi tạo

Có thể bạn đã nghe nói về ngôn ngữ đánh dấu mở rộng (XML) và có thể bạn đã nghe thấy nhiều lý do tại sao tổ chức của bạn nên dùng nó. Nhưng XML là gì, chính xác? Bài viết này giải thích về các thông tin cơ bản về XML-nó là gì và cách thức hoạt động.

Trong bài viết này

Một cái nhìn ngắn gọn khi đánh dấu, đánh dấu và thẻ

Vì vậy, những gì làm cho nó XML?

Một từ về dữ liệu được hình thành tốt

Giao diện nhanh trong sơ đồ

Một dạng xem nhanh tại Transforms

Một peek tại XML trong hệ thống Microsoft Office

Một cái nhìn ngắn gọn khi đánh dấu, đánh dấu và thẻ

Để hiểu XML, nó sẽ giúp hiểu ý tưởng về việc đánh dấu dữ liệu. Mọi người đã tạo tài liệu trong nhiều thế kỷ, và chỉ trong thời gian dài họ đã đánh dấu các tài liệu đó. Ví dụ: giáo viên trường học đánh dấu các giấy tờ của học sinh tất cả thời gian. Họ cho phép học viên di chuyển các đoạn văn, làm rõ câu, sửa lỗi chính tả, v.v. Đánh dấu tài liệu là cách chúng tôi xác định cấu trúc, ý nghĩa và diện mạo trực quan của thông tin trong tài liệu. Nếu bạn đã từng sử dụng tính năng theo dõi thay đổi trong Microsoft Office Word, bạn đã sử dụng một biểu mẫu trên máy tính của đánh dấu.

Trong máy tính, "Mark up" cũng đã được phát triển thành "đánh dấu". Đánh dấu là quy trình sử dụng các mã có tên là thẻ (hoặc đôi khi là thẻ) để xác định cấu trúc, hình thức trực quan và — trong trường hợp XML — ý nghĩa của bất kỳ dữ liệu nào.

Mã HTML cho bài viết này là một ví dụ về đánh dấu máy tính của bạn tại nơi làm việc. Nếu bạn duyệt qua nó (trong Microsoft Internet Explorer, hãy bấm chuột phải vào trang đó, rồi bấm xem nguồn), bạn sẽ thấy kết hợp của văn bản có thể đọc và ngôn ngữ đánh dấu siêu văn bản (HTML), chẳng hạn như <p><h2>. Thẻ trong các tài liệu HTML và XML rất dễ nhận ra vì chúng được bao quanh bởi dấu ngoặc vuông góc. Trong mã nguồn cho bài viết này, các thẻ HTML sẽ thực hiện một loạt các công việc khác nhau, chẳng hạn như xác định đầu và cuối mỗi đoạn văn (<p> ... </p>) và đánh dấu vị trí của từng hình ảnh.

Vì vậy, những gì làm cho nó XML?

Tài liệu HTML và XML chứa dữ liệu được bao quanh bằng thẻ, nhưng đó là nơi điểm tương tự giữa hai ngôn ngữ kết thúc. Trong HTML, các thẻ xác định diện mạo và cảm nhận của dữ liệu của bạn-các tiêu đề sẽ đi vào đây, đoạn bắt đầu ở đó, v.v. Trong XML thẻ xác định cấu trúc và ý nghĩa của dữ liệu của bạn-dữ liệu là gì.

Khi bạn mô tả cấu trúc và ý nghĩa của dữ liệu, bạn có thể sử dụng lại dữ liệu đó trong bất kỳ số cách nào. Ví dụ, nếu bạn có một khối dữ liệu bán hàng và mỗi mục trong khối được xác định rõ ràng, bạn có thể tải chỉ các mục mà bạn cần vào một báo cáo bán hàng và tải các mục khác vào cơ sở dữ liệu kế toán. Đặt một cách khác, bạn có thể sử dụng một hệ thống để tạo dữ liệu của bạn và đánh dấu nó với thẻ XML, rồi xử lý dữ liệu đó trong bất kỳ số lượng hệ thống nào khác, bất kể nền tảng phần cứng hoặc hệ điều hành. Tính năng di chuyển đó là lý do tại sao XML đã trở thành một trong những công nghệ phổ biến nhất để trao đổi dữ liệu.

Hãy nhớ những điều này khi bạn tiếp tục:

  • Bạn không thể sử dụng HTML tại vị trí của XML. Tuy nhiên, bạn có thể quấn dữ liệu XML của bạn trong thẻ HTML và hiển thị nó trong trang web.

  • HTML được giới hạn trong một tập hợp các thẻ được xác định trước mà tất cả người dùng chia sẻ.

  • XML cho phép bạn tạo thẻ bất kỳ mà bạn cần để mô tả dữ liệu và cấu trúc của dữ liệu đó. Ví dụ, nói rằng bạn cần lưu trữ và chia sẻ thông tin về vật nuôi. Bạn có thể tạo mã XML sau đây:

    <?xml version="1.0"?>
    <CAT>
      <NAME>Izzy</NAME>
      <BREED>Siamese</BREED>
      <AGE>6</AGE>
      <ALTERED>yes</ALTERED>
      <DECLAWED>no</DECLAWED>
      <LICENSE>Izz138bod</LICENSE>
      <OWNER>Colin Wilcox</OWNER>
    </CAT>
    

Bạn có thể thấy thẻ XML đó có thể biết chính xác loại dữ liệu mà bạn đang xem. Ví dụ, bạn biết đây là dữ liệu về một con mèo và bạn có thể dễ dàng tìm thấy tên của con mèo, tuổi tác, v.v. Khả năng tạo thẻ xác định hầu như bất kỳ cấu trúc dữ liệu nào là những gì khiến cho XML "được mở rộng".

Nhưng đừng nhầm lẫn các thẻ trong mẫu mã đó bằng thẻ trong tệp HTML. Ví dụ, nếu bạn dán cấu trúc XML đó vào một tệp HTML và xem tệp trong trình duyệt của bạn, kết quả sẽ trông như thế này:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Trình duyệt bỏ qua thẻ XML của bạn và chỉ hiển thị dữ liệu.

Một từ về dữ liệu được hình thành tốt

Bạn có thể nghe thấy ai đó từ bộ phận CNTT của bạn đề cập đến "được tạo thành" được XML. Một tệp XML được hình thành tốt vào một tập hợp các quy tắc rất chặt chẽ mà việc quản XML. Nếu một tệp không phù hợp với những quy tắc đó, XML sẽ ngừng hoạt động. Ví dụ, trong mẫu mã trước đó, mỗi thẻ mở đều có thẻ đóng, để mẫu này tuân thủ vào một trong các quy tắc để được tạo thành tốt. Nếu bạn loại bỏ thẻ và thử mở tệp đó theo một trong các chương trình Office, bạn sẽ thấy thông báo lỗi và chương trình sẽ ngăn bạn sử dụng tệp.

Bạn không nhất thiết cần biết các quy tắc để tạo XML được hình thành (mặc dù chúng dễ hiểu hơn), nhưng bạn cần phải nhớ rằng bạn có thể chia sẻ dữ liệu XML giữa các chương trình và hệ thống chỉ khi dữ liệu đó được tạo thành tốt. Nếu bạn không thể mở tệp XML, rất có thể là tệp đó không được hình thành tốt.

XML cũng là nền tảng độc lập, nghĩa là bất kỳ chương trình nào được tạo để sử dụng XML có thể đọc và xử lý dữ liệu XML của bạn, bất kể phần cứng hoặc hệ điều hành. Ví dụ, với thẻ XML bên phải, bạn có thể sử dụng chương trình trên máy tính để mở và làm việc với dữ liệu từ máy tính từ xa. Và, bất kể người tạo ra một nội dung dữ liệu XML, bạn có thể làm việc với cùng một dữ liệu trong một số chương trình Office. Vì nó như vậy là xách tay, XML đã trở thành một trong những công nghệ phổ biến nhất để trao đổi dữ liệu giữa các cơ sở dữ liệu và máy tính bàn của người dùng.

XML được triển khai cho các ứng dụng tiêu thụ

Ngoài việc gắn thẻ, dữ liệu được hình thành, các hệ thống XML thường sử dụng hai cấu phần bổ sung: Sơ đồ và biến đổi. Các phần sau đây giải thích cách các cấu phần bổ sung này hoạt động.

Giao diện nhanh trong sơ đồ

Không để cho thuật ngữ "sơ đồ" đe dọa bạn. Lược đồ chỉ là một tệp XML có chứa các quy tắc cho những gì có thể và không thể nằm trong tệp dữ liệu XML. Các tệp sơ đồ thường sử dụng phần mở rộng tên tệp. xsd, trong khi tệp dữ liệu XML sử dụng phần mở rộng. xml.

Schemas cho phép các chương trình xác thực dữ liệu. Họ cung cấp khuôn khổ cho dữ liệu cấu trúc và đảm bảo rằng nó tạo cảm giác cho người tạo và bất kỳ người dùng nào khác. Ví dụ: nếu người dùng nhập dữ liệu không hợp lệ, chẳng hạn như văn bản trong trường ngày, thì chương trình sẽ có thể nhắc người dùng nhập đúng dữ liệu. Miễn là dữ liệu trong một tệp XML sẽ tuân theo các quy tắc trong sơ đồ đã cho, bất kỳ chương trình nào hỗ trợ XML có thể sử dụng lược đồ đó để đọc, diễn giải và xử lý dữ liệu. Ví dụ như thể hiện trong hình minh họa sau đây, Excel có thể xác thực dữ liệu <CAT> đối với lược đồ mèo.

Sơ đồ cho phép các ứng dụng chia sẻ dữ liệu XML.

Schemas có thể trở nên phức tạp và giảng dạy bạn cách tạo một bên ngoài phạm vi bài viết này. (Bên cạnh đó, bạn có thể có một bộ phận CNTT biết cách thức.) Tuy nhiên, điều này sẽ giúp bạn biết những điều trông như thế nào. Sơ đồ sau đây xác định các quy tắc cho> mèo <... </CAT> thẻ.

<xsd:element name="CAT">  
  <xsd:complexType>  
    <xsd:sequence>
      <xsd:element name="NAME" type="xsd:string"/>
      <xsd:element name="BREED" type="xsd:string"/>
      <xsd:element name="AGE" type="xsd:positiveInteger"/>
      <xsd:element name="ALTERED" type="xsd:boolean"/>
      <xsd:element name="DECLAWED" type="xsd:boolean"/>
      <xsd:element name="LICENSE" type="xsd:string"/>
      <xsd:element name="OWNER" type="xsd:string"/>        
    </xsd:sequence>
  </xsd:complexType>
</xsd:element>

Đừng lo lắng về việc hiểu rõ mọi thứ trong mẫu. Chỉ cần giữ các sự kiện này:

  • Các mục dòng trong sơ đồ mẫu được gọi là khai báo. Nếu bạn cần thêm thông tin về một động vật, chẳng hạn như màu hoặc dấu của nó, rất có thể là bộ phận CNTT của bạn sẽ thêm một tuyên bố vào lược đồ. Bạn có thể thay đổi hệ thống XML làm doanh nghiệp của bạn cần tiến triển.

  • Khai báo cung cấp một lượng điều khiển to lớn hơn trong cấu trúc dữ liệu. Ví dụ, bản khai báo <xsd:sequence> có nghĩa là thẻ, chẳng hạn như <NAME><BREED> , phải xảy ra theo thứ tự mà chúng được liệt kê ở trên. Việc khai báo cũng có thể kiểm soát các loại dữ liệu mà người dùng có thể nhập vào. Ví dụ: Sơ đồ trên đây đòi hỏi phải có số dương cho độ tuổi của mèo và các giá trị Boolean (TRUE hoặc FALSE) cho các thẻ được thay đổi và phân tách.

  • Khi dữ liệu trong một tệp XML sẽ được áp dụng cho các quy tắc được cung cấp bởi lược đồ, dữ liệu đó được cho là hợp lệ. Quy trình kiểm tra tệp dữ liệu XML chống lại sơ đồ có tên (đủ hợp lệ). Lợi thế lớn để sử dụng sơ đồ là họ có thể giúp ngăn ngừa dữ liệu bị lỗi. Họ cũng giúp bạn dễ dàng tìm thấy dữ liệu bị lỗi vì điểm dừng XML khi cuộc gặp sự cố.

Một dạng xem nhanh tại Transforms

Như chúng tôi đã đề cập trước đó, XML cũng cung cấp các cách thức mạnh mẽ để sử dụng hoặc tái sử dụng dữ liệu. Cơ chế sử dụng lại dữ liệu được gọi là chuyển đổi ngôn ngữ stylesheet được mở rộng (XSLT), hoặc chỉ đơn giản là biến đổi.

Bạn (được, bộ phận CNTT của bạn) cũng có thể sử dụng biến đổi sang dữ liệu Exchange giữa các hệ thống Back-end, chẳng hạn như cơ sở dữ liệu. Ví dụ, giả sử rằng cơ sở dữ liệu lưu trữ dữ liệu bán hàng trong cấu trúc bảng hoạt động tốt cho bộ phận bán hàng. Cơ sở dữ liệu B lưu trữ dữ liệu doanh thu và chi phí trong cấu trúc bảng được thiết kế cho bộ phận kế toán. Cơ sở dữ liệu B có thể sử dụng biến đổi để chấp nhận dữ liệu từ A và ghi dữ liệu đó vào bảng chính xác.

Sự kết hợp của tệp dữ liệu, sơ đồ và biến đổi cấu thành một hệ thống XML cơ bản. Minh họa sau đây cho thấy các hệ thống như vậy thường hoạt động như thế nào. Tệp dữ liệu được xác thực đối với lược đồ và sau đó kết xuất trong bất kỳ số nào có thể sử dụng bằng cách biến đổi. Trong trường hợp này, biến đổi sẽ triển khai dữ liệu thành bảng trong trang web.

Một cấu trúc tệp XML cơ bản với một sơ đồ và phần chuyển đổi.

Mẫu mã sau đây Hiển thị một cách để viết biến đổi. Nó tải dữ liệu <mèo> vào bảng trên trang web. Một lần nữa, điểm của mẫu không hiển thị cho bạn cách viết biến đổi, nhưng để cho bạn biết một biểu mẫu có thể thực hiện chuyển đổi.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0"> 
<TABLE>
  <TR>
    <TH>Name</TH>
    <TH>Breed</TH>
    <TH>Age</TH>
    <TH>Altered</TH>
    <TH>Declawed</TH>    
    <TH>License</TH>
    <TH>Owner</TH>
  </TR>
  <xsl:for-each select="CAT">
  <TR ALIGN="LEFT" VALIGN="TOP">
    <TD>
      <xsl:value-of select="NAME"/>
    </TD>
    <TD>
      <xsl:value-of select="BREED"/>
    </TD>
    <TD>
      <xsl:value-of select="AGE"/>
    </TD>
    <TD>
      <xsl:value-of select="ALTERED"/>
    </TD>
    <TD>
      <xsl:value-of select="DECLAWED"/>
    </TD>
    <TD>
      <xsl:value-of select="LICENSE"/>
    </TD>
    <TD>
      <xsl:value-of select="OWNER"/>
    </TD>
  </TR>
</xsl:for-each>
</TABLE>

Mẫu này hiển thị cách một kiểu biến đổi có thể tìm khi mã được mã hóa, nhưng hãy nhớ rằng bạn chỉ có thể mô tả những gì bạn cần từ dữ liệu bằng tiếng Anh đơn giản. Ví dụ, bạn có thể đi đến bộ phận CNTT của bạn và nói rằng bạn cần in dữ liệu bán hàng cho các khu vực cụ thể trong hai năm qua, "và tôi cần nó để tìm cách này." Bộ phận CNTT của bạn có thể viết (hoặc thay đổi) một biến đổi để thực hiện công việc đó.

Điều gì khiến tất cả những điều này thuận tiện hơn là Microsoft và một số nhà cung cấp đang phát triển khác sẽ tạo ra biến đổi cho công việc của tất cả các loại. Trong tương lai, cơ hội là bạn sẽ có thể tải xuống một biến đổi mà đáp ứng nhu cầu của bạn hoặc bạn có thể điều chỉnh để phù hợp với mục đích của bạn. Điều đó có nghĩa là XML sẽ ít tốn kém hơn khi sử dụng thời gian.

Một peek tại XML trong hệ thống Microsoft Office

Các phiên bản chuyên nghiệp của Office cung cấp hỗ trợ XML rộng rãi. Bắt đầu với hệ thống Microsoft Office 2007, Microsoft Office dùng các định dạng tệp dựa trên XML, như .docx, .xlsx và .pptx. Vì dữ liệu XML lưu trữ theo định dạng văn bản thay vì định dạng nhị phân độc quyền, khách hàng của bạn có thể xác định các lược đồ của riêng mình và sử dụng dữ liệu của bạn theo nhiều cách, tất cả mà không phải trả tiền nhuận. Để biết thêm thông tin về các định dạng mới, hãy xem mở các định dạng và phần mở rộng tên tệp. Những ưu điểm khác bao gồm:

  • Kích cỡ tệp nhỏ hơn. Định dạng mới sử dụng ZIP và các công nghệ nén khác để giảm kích cỡ tệp theo mức 75 phần trăm so với các định dạng nhị phân được dùng trong các phiên bản Office cũ hơn.

  • Khôi phục thông tin dễ dàng hơn và bảo mật lớn hơn. XML là con người có thể đọc được, vì vậy nếu tệp bị hỏng, bạn có thể mở tệp trong Microsoft Notepad hoặc một trình đọc văn bản khác và khôi phục ít nhất một số thông tin của bạn. Ngoài ra, các tệp mới được bảo mật hơn vì họ không chứa mã Visual Basic for Applications (VBA). Nếu bạn sử dụng định dạng mới để tạo mẫu, bất kỳ điều khiển ActiveX và macro VBA đều nằm trong một phần riêng biệt, an toàn của tệp. Ngoài ra, bạn có thể sử dụng các công cụ, chẳng hạn như trình kiểm tra tài liệu, để loại bỏ bất kỳ dữ liệu cá nhân nào. Để biết thêm thông tin về cách sử dụng bộ kiểm tra tài liệu, hãy xem bài viết loại bỏ dữ liệu ẩn và thông tin cá nhân bằng cách kiểm tra tài liệu.

Cho đến nay rất tốt, nhưng nếu bạn có dữ liệu XML không có lược đồ? Các chương trình Office hỗ trợ XML có các phương pháp tiếp cận của riêng mình để giúp bạn làm việc với dữ liệu. Ví dụ, Excel sẽ bật một lược đồ nếu bạn mở một tệp XML chưa có. Excel sau đó cung cấp cho bạn tùy chọn tải dữ liệu này vào bảng XML. Bạn có thể sử dụng các danh sách và bảng XML để sắp xếp, lọc hoặc thêm các phép tính vào dữ liệu.

Kích hoạt công cụ XML trong Office

Tab nhà phát triển không được hiển thị theo mặc định, nhưng bạn sẽ cần thêm nó vào Ribbon khi bạn muốn sử dụng lệnh XML trong Office.

Lưu ý:  Trang này được dịch tự động nên có thể chứa các lỗi về ngữ pháp hoặc nội dung không chính xác. Mục đích của chúng tôi là khiến nội dung này trở nên hữu ích với bạn. Cho chúng tôi biết thông tin này có hữu ích hay không? Dưới đây là bài viết bằng tiếng Anh để bạn tham khảo..​

Phát triển kỹ năng Office của bạn
Khám phá nội dung đào tạo
Sở hữu tính năng mới đầu tiên
Tham gia Người dùng nội bộ Office

Thông tin này có hữu ích không?

Cảm ơn phản hồi của bạn!

Cảm ơn bạn đã phản hồi! Để trợ giúp tốt hơn, có lẽ chúng tôi sẽ kết nối bạn với một trong những nhân viên hỗ trợ Office của chúng tôi.

×