XML 入门

重要:  本文是由机器翻译的,请参阅免责声明。请在 此处 中查找本文的英文版本以便参考。

您可能已经听说过的可扩展标记语言 (XML),并可能已经听说过组织应使用的原因有很多。但是 XML 到底是什么?这篇文章介绍 XML 的基础知识,它是什么以及其工作方式。

本文内容

向上、 标记和标记的标记简介

什么可以在 XML?

有关格式良好的数据的说明

快速查看架构

快速查看转换

透视窗口,在 Microsoft Office System 中的 XML

向上、 标记和标记的标记简介

若要了解 XML,它有助于理解标记数据的概念。世纪,以及多长时间进行标记这些文档一样人员已创建的文档。例如,学生学校教师标记白皮书所有时间。他们告诉学生移动的段落、 阐明句子、 正确拼写错误,等等。标记文档是我们如何定义文档中的结构、 含义和外观的信息。您曾在 Microsoft Office Word 中使用修订功能,如果您使用的标记的计算机化窗体。

在计算,"标记"已也发展成为"标记"。标记是使用称为标记 (或有时令牌) 来定义的结构,其外观,代码的过程和-对于 XML — 任何数据的含义。

这篇文章的 HTML 代码是一个很好计算机标记的示例。如果您通过其浏览 (Microsoft Internet Explorer 中,在页上,右键单击,然后单击查看源),您将看到可读的文本和超文本标记语言 (HTML) 标记,如<p><h2>的组合。HTML 和 XML 文档中的标记很容易识别,因为它们用方括号括起来角度。在本文的源代码,HTML 标记执行许多操作,如定义的开头和结尾的每个段落 (<p> ...</p>)并标记每个图像的位置。


因此是令 XML?

HTML 和 XML 文档包含的数据加标签,但这两种语言之间的相似点结束的位置。在 HTML 标记定义您的数据的外观-标题转到此处,段落起始位置,等。在 XML 标记定义的结构和数据的含义-什么是数据。

您描述的结构和数据的含义,您只是使其可以重复使用任意数量的方法中的数据。例如,如果您有销售的数据块和明确标识块中的每个项目,可以加载只需到销售的项目报告,并将其他项目加载到财务数据库。放入另一种方法,可以使用一个系统生成数据并将其标记与 XML 标记,然后任意数量的其他系统,而不考虑硬件平台或操作系统在处理该数据。可移植性是 XML 已成为交换数据的最常见技术之一的原因。

在操作过程中,请记住下列事实:

  • 不能使用 XML 代替 HTML。但是,可以在 HTML 标记环绕 XML 数据并显示该网页中。

  • HTML 仅限于一组预定义的标记的所有用户都共享。

  • XML 允许您创建任何需要描述您的数据和数据结构的标记。例如,假设您需要存储和共享关于宠物的信息。您可以创建以下 XML 代码︰

    <?xml version="1.0"?>
    <CAT>
    <NAME>Izzy</NAME>
    <BREED>Siamese</BREED>
    <AGE>6</AGE>
    <ALTERED>yes</ALTERED>
    <DECLAWED>no</DECLAWED>
    <LICENSE>Izz138bod</LICENSE>
    <OWNER>Colin Wilcox</OWNER>
    </CAT>

您可以看到的 XML 标记地了解完全何种您正在查看的数据。例如,你知道这是猫,有关的数据,您可以轻松地找到猫名称、 年龄,等等。创建定义几乎任何数据结构的标记的能力是什么是 XML"扩展"。

但不要将该代码示例中使用 HTML 文件中的标记标记混淆。例如,如果您粘贴 HTML 文件中的 XML 结构,并在浏览器中查看的文件,结果将如下所示︰

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

在浏览器将忽略 XML 标记和只显示数据。


有关格式良好的数据的说明

您可能听提及"良好"XML 从您的 IT 部门联系某人。良好的 XML 文件符合一组严格管理 XML 的规则。如果文件不符合这些规则,XML 停止工作。例如,在上面的代码示例中,每一个开始标记具有结束标记,因此该示例遵循一种标准格式规则。如果您删除标记,并尝试其中一个 Office 程序中打开该文件,您将看到一条错误消息,然后程序会阻止您使用的文件。

您不一定要了解创建标准格式的 XML (尽管它们是易于理解) 的规则,但您需要请记住,仅当该数据的格式是否正确,您可以共享 XML 数据在程序和系统之间。如果无法打开 XML 文件,则很可能是该文件不是标准格式。

XML 也是独立于平台,这意味着任何程序设计能够使用 XML 可以阅读和处理 XML 数据,而不考虑硬件或操作系统。例如,使用正确的 XML 标记,您可以使用桌面程序打开和处理大型机中的数据。然后,无论谁创建 XML 数据的正文,您可以处理多个 Office 程序中的相同数据。因为它是因此可移植,XML 已成为数据库和用户桌面之间交换数据的最常见技术之一。

供其他程序使用的 XML

除了标记、 良好的数据,XML 系统通常使用两个其他组件︰ 架构和转换。以下部分介绍这些其他组件的工作方式。


快速查看架构

不允许的术语"架构"望而生畏。架构是只包含可以和不能在 XML 数据文件中包含的内容的规则的 XML 文件。架构文件通常使用.xsd 文件扩展名而 XML 数据文件使用.xml 扩展名。

架构允许程序验证数据。结构化数据,并确保其有必要,创建者和任何其他用户提供框架。例如,如果用户输入无效数据,例如,在日期字段中,文本程序就会提示用户输入正确的数据。只要 XML 文件中的数据符合给定架构中的规则,支持 XML 的任何程序可以使用该架构读取、 解释和处理数据。例如下, 图中所示,Excel 可以<CAT>根据架构验证数据猫。

利用架构,应用程序可以共享 XML 数据。

架构可能非常复杂,它教您如何创建一个超出了本文的范围。(此外,您可能有知道的 IT 部门如何。)但是,它有助于了解架构的外观。下面的架构定义这些规则的 < 猫 >...</CAT > 标记集。

<xsd:element name="CAT">  
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>

不要担心了解此示例中的所有内容。只需记住下列事实︰

  • 示例架构中的行项目称为声明。如果您需要其他信息,例如其颜色或标记、 动物很可能是您的 IT 部门将添加到该架构的声明。根据您的业务发展的需要您可以更改 XML 系统。

  • 声明提供了大量控制数据结构。例如, <xsd:sequence>声明意味着标记,如<NAME><BREED> ,必须上面列出的顺序发生。声明也可以控制用户可以输入的数据的类型。例如,上面的架构猫年龄和布尔值 (TRUE 或 FALSE) 值的 ALTERED 和 DECLAWED 标记为需要正数。

  • XML 文件中的数据符合架构所提供的规则时,该数据就有效。检查根据架构 XML 数据文件的过程调用 (逻辑意义上) 验证。使用架构大优点是可以帮助防止数据损坏。它们还使您能够轻松找到损坏的数据,因为 XML 停止时遇到问题。


快速查看转换

如前所述,XML 还提供了功能强大的方法使用或重复使用的数据。重用数据的机制称为可扩展样式表语言转换 (XSLT) 或只需,转换。

您 (或您的 IT 部门) 还可以使用转换后端系统,如数据库之间交换数据。例如,假设数据库 A 适用于销售部门的表结构中存储的销售数据。数据库 B 量身定制的财务部门的表结构中存储的收入和费用数据。数据库 B 可以使用转换接受 A 中的数据,并将数据存储在相应的表。

数据文件、 架构和转换的组合构成的基本 XML 系统。下图显示了此类系统通常工作。根据架构验证数据文件,然后通过转换呈现中的任意数量的可用方式。在此例中,转换部署到网页中的表数据。

使用架构和转换的基本 XML 文件结构

下面的代码示例显示编写转换的一种方法。将 < 猫 > 数据加载到网页上的表格。再次样本的点未向您展示如何编写转换,而是显示您可以采取一些转换的一个窗体。

<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>

此示例显示如何一种类型的转换可能查看它编码,但请记住,您可以描述所需用通俗易懂的数据。例如,您可以转到您的 IT 部门联系,说,您需要在过去两年,打印特定区域的销售数据"和我需要使用它来查找这种方式。您的 IT 部门然后可以编写 (或更改) 转换可执行该任务。

使所有这些更方便的是 Microsoft 和不断增加许多其他供应商创建应用于各种任务的转换。以后,很可能是您能够下载以满足您的需求转换或您可以调整以满足您的目的。这意味着 XML 将成本较低,使用一段时间。


透视窗口,在 Microsoft Office System 中的 XML

Office 专业版提供了丰富的 XML 支持。从 2007 Microsoft Office system,Microsoft Office 使用的基于 XML 的文件格式,如.docx、.xlsx 和.pptx。XML,而不是专用的二进制格式的文本格式存储数据,因为您的客户可以定义自己的架构和所有而无需支付版税的更多方法中使用您的数据。有关新格式的详细信息,请参阅Open XML 格式和文件扩展名。其他优点包括︰

  • 更小文件大小。新格式使用邮政编码和其他压缩技术与早期版本的 Office 中使用的二进制格式相比多达 75%来减少文件大小。

  • 简化了信息恢复和更高的安全性。XML 是用户可读的因此如果文件已损坏,您可以在 Microsoft 记事本或其他文本阅读器中打开的文件和恢复至少一些信息。此外,新的文件是更安全,因为它们不能包含 Visual Basic for Applications (VBA) 代码。如果您使用的新格式创建模板,所有 ActiveX 控件和 VBA 宏都位于单独、 更安全部分中的文件。此外,您可以使用工具,如文档检查器中,若要删除任何个人数据。有关使用文档检查器的详细信息,请参阅文章删除隐藏的数据和个人信息从 Office 文档

因此为止一切非常顺利,但如果您有没有架构的 XML 数据?支持 XML 的 Office 程序具有其自己的方法帮助您使用的数据。例如,Excel 推断架构,如果您打开尚不具有一个 XML 文件。Excel 然后提供了此数据加载到 XML 表的选项。您可以使用的 XML 列表和表进行排序、 筛选或添加到数据的计算。

启用 Office 中的 XML 工具

默认情况下,不显示开发工具选项卡,但您需要将其添加到功能区中,当您想要在 Office 中使用 XML 命令。

注意: 机器翻译免责声明:本文是由无人工介入的计算机系统翻译的。Microsoft 提供机器翻译是为了帮助非英语国家/地区用户方便阅读有关 Microsoft 产品、服务和技术的内容。由于机器翻译的原因,本文可能包含词汇、语法或文法方面的错误。

扩展你的技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×