在 Office 365 中的内容搜索中的部分索引的项

注意:  我们希望能够尽快以你的语言为你提供最新的帮助内容。 本页面是自动翻译的,可能包含语法错误或不准确之处。我们的目的是使此内容能对你有所帮助。可以在本页面底部告诉我们此信息是否对你有帮助吗? 请在此处查看本文的 英文版本 以便参考。

当您运行搜索,您自动运行从Office 365 安全与合规中心内容搜索估计的搜索结果中包含部分索引的项。部分索引项是Exchange邮箱项目和SharePoint和OneDrive for Business ,由于某种原因未完全搜索索引的网站上的文档。在Exchange,部分索引的项通常包含文件-不可以编制索引的文件类型 — 附加到电子邮件。下面是某些其他原因项目无法搜索索引以及运行搜索时将返回作为部分索引项:

  • 无法识别或不受支持的索引的文件类型。

  • 邮件具有附加的文件没有有效处理程序中,例如图像文件;这是部分索引的电子邮件的最常见的原因。

  • 文件类型支持检索,但是特定文件出现检索错误。

  • 附加到电子邮件的文件过多。

  • 附加到电子邮件的文件过大。

  • 文件使用非 Microsoft 技术进行加密。

  • 文件具有密码保护。

注意: 大多数Office 365组织所具有小于 1%的内容的音量和小于 12%部分索引的大小。音量和大小之间的差异的原因是较大的文件具有较高概率为包含不完全编制索引的内容。

对于法律调查,您的组织可能需要查看部分索引的项。您还可以指定是否要包括部分索引的项,当您将搜索结果导出到本地计算机或准备Office 365 高级电子数据展示分析结果。有关详细信息,请参阅Investigating 部分索引中 Office 365 电子数据展示的项目

内容

搜索未编制索引的文件类型

邮件和文档的部分索引可以在搜索结果中返回类型的文件

在搜索结果中包含的部分索引的项

从搜索结果中排除的部分索引的项

索引的内容搜索中的邮件的限制

有关部分索引项的详细信息

文件类型未编入索引以供搜索

某些类型的文件,例如位图或 MP3 文件不包含可索引的内容。因此, Exchange和SharePoint中的搜索索引服务器不执行全文索引对这些类型的文件。这些类型的文件被视为不受支持的文件类型。也有一些文件类型的全文索引已被禁用,默认情况下或由管理员。不受支持和禁用文件类型被标记为未索引的项在内容搜索。可以搜索结果集中包括前面所述的部分索引项,当您运行搜索时,搜索结果导出到本地计算机,或准备高级电子数据展示的搜索结果。

有关支持和禁用的文件格式列表,请参阅以下主题:

返回页首

邮件和文档的部分索引可以在搜索结果中返回类型的文件

并非每个带部分索引的文件附件的电子邮件或每个部分索引的SharePoint文档将自动返回作为部分索引项。这是因为其他邮件或文档属性,例如电子邮件中的Subject属性和文档的TitleAuthor属性索引,并且方便进行搜索。例如,"财务"关键字搜索将返回部分索引的文件附件的项目,如果该关键字出现在电子邮件的主题或文件的名称或标题的文档。但是,如果该文件的正文中仅显示该关键字,邮件或文档将返回作为部分索引项。

同样,部分索引的文件类型的文档与部分索引的文件附件的邮件中包含搜索结果时其他邮件或文档的属性,它们是索引和搜索,符合搜索条件。搜索索引的消息属性包括在邮件正文中发送和接收日期、 发件人和收件人、 附件和文本的文件名。搜索索引的文档属性包括创建和修改日期。因此即使邮件附件可能部分索引的项,邮件如果将包含正则搜索结果中的其他邮件或文档属性的值匹配的搜索条件。

有关您可以使用 安全与合规中心 中的搜索功能进行搜索的邮件和文档属性的列表,请参阅Keyword queries and search conditions for Content Search

返回页首

在搜索结果中包含的部分索引的项

您的组织可能需要识别并执行部分索引项,以确定什么是、 包含的内容,以及是否是与特定调查相关的其他分析。为前面所述,搜索的内容位置中的部分索引的项将自动包括估计的搜索结果。您可以选择包含这些部分索引的项,当您导出搜索结果,或准备高级电子数据展示的搜索结果。要导出的搜索结果或准备高级电子数据展示时包括部分索引的项,请选择要包括具有不可识别的格式、 已加密,或其他原因未索引的项目的选项之一。

请记住部分索引项有关以下内容:

  • 内容搜索运行时的总数和大小 (搜索查询返回) 的部分索引项会显示在搜索统计信息的详细信息窗格中,如标记为 '未索引邮件'。

  • 当您导出搜索结果,包括部分索引的项时,部分索引的 Exchange 项目被导出到在它们位于,或作为单个邮件的每个邮箱的单独的 PST 文件,如果您选择下载作为Exchange项目的选项邮件。部分索引的SharePoint项目导出到一个名为Uncrawlable文件夹。

  • 如果要导出其结果的搜索是对组织中特定内容位置或所有内容位置的搜索,则只会导出包含与搜索条件相匹配的项目内容位置中未编制索引的项。换言之,如果在某个邮箱或站点内找不到任何搜索结果,则不会导出该邮箱或站点内任何未编制索引的项。其原因在于,从组织中每个位置导出未编制索引的项将增加导出错误的可能性,增加导出和下载搜索结果所花费的时间。

    要导出的搜索所有内容的位置部分索引的项,配置搜索返回的所有项目 (通过从搜索查询中删除任何关键字),然后您导出搜索结果时导出仅部分索引的项 (通过单击所有项目,不包括部分索引项包含这些项目从搜索下)。

  • 如果您选择在搜索结果中,包括所有邮箱项目或者未指定任何关键字或仅指定日期范围的搜索查询,部分索引的项可能不被复制到包含部分索引的项的 PST 文件。这是因为所有项目,包括任何部分索引的项,将自动都包含正则搜索结果中。

  • 部分索引的项不可用来预览。您必须导出搜索结果,以便查看搜索返回的部分索引的项。

返回页首

从搜索结果中排除的部分索引的项

如果项目已部分索引,但它不能满足搜索查询条件,它不会作为一个部分索引项的搜索结果中包括。换言之,项目是从搜索结果中排除。例如,假设您运行的搜索,不包含任何关键字或属性因为想要包括的所有内容。但是,包括日期范围条件的查询。如果部分索引的项落在该日期范围之外,它不会作为一个部分索引项包括。日期范围是从搜索结果中排除部分索引的项的有效方法。

同样,如果您选择要导出的搜索结果时包括部分索引的项,则不会导出已从搜索结果中排除的部分索引的项。

此规则的唯一例外是当您创建一个与电子数据展示事例相关联的基于查询的保留。如果您创建一个基于查询的保留,所有部分索引的项将置于保持状态。这其中包括不匹配搜索查询条件的部分索引的项和可能超出日期范围条件的部分索引的项。有关存储的有关创建基于查询的详细信息,请参阅在 Office 365 安全和合规性中心管理电子数据展示事例

索引的内容搜索中的邮件的限制

下表描述了索引限制可能会导致电子邮件作为Office 365中的内容搜索中的部分索引项返回。

索引限制SharePoint文档的列表,请参阅SharePoint online 搜索限制

索引限制

最大值

说明

最大附件大小(不包括 Excel 文件)

150 MB

将进行索引分析的电子邮件附件的最大大小。超过此限制的任何附件都不会进行索引分析,且具有该附件的邮件将被标记为未索引。

注意: 分析是这样一个过程:索引服务从附件提取文本,删除标点和空格之类的不必要字符,然后将文本划分为词汇(此过程成为词汇切分),最后将词汇存储到索引中。

Excel 文件的最大大小

4 MB

网站上或附加到电子邮件且将进行索引分析的 Excel 文件的最大大小。超过此限制的任何 Excel 文件都不会进行索引分析,且该文件或具有该文件附件的电子邮件将被标记为未索引。

最大附件数

250

附加到电子邮件且将进行索引分析的最大文件数。如果邮件的附件数超过 250 个,将分析并索引前 250 个附件,并且该邮件将被标记为部分索引,因为它还有附件未分析。

最大附件深度

30

分析的最大嵌套附件数。例如,如果电子邮件附加了另外一封邮件,且该附加邮件又附加了 Word 文档,则将同时索引该 Word 文档和附加邮件。此行为适用于嵌套附件不超过 30 个的情况。

最大附加图像数

0

分析程序会跳过且不索引附加到电子邮件的图像。

分析项目所需的最长时间

30 秒

分析项目以进行索引最长需要 30 秒。如果分析时间超过 30 秒,该项目将被标记为部分索引。

分析程序最大输出

200 万个字符

来自分析程序且已索引的最大文本输出量。例如,如果分析程序从文档中提取了 800 万个字符,则仅索引了前 200 万个字符。

最大批注令牌数

200 万

编制电子邮件索引时,每个字词采用不同的处理指令进行注释,这些说明指定对该字词编制索引的方式。每组处理指令被称为批注令牌。为保证 Office 365 的服务质量,限制为一封电子邮件最多 200 万个批注令牌。

索引中的最大正文大小

6700 万个字符

电子邮件正文及其所有附件中的字符总数。编制电子邮件索引时,邮件正文和所有附件中的所有文本将串联成单个字符串。编入索引的此字符串的最大大小为 6700 万个字符。

正文最大唯一令牌数

100 万

如上文所述,从内容中提取文本,删除标点和空格,然后将其字词(称为令牌)存储在索引中,这就形成了令牌。例如,短语 "cat, mouse, bird, dog, dog" 包含 5 个令牌。但只有 4 个是唯一令牌。每封电子邮件限制为 100 万个唯一令牌,这有助于防止因随机令牌造成索引过大。

返回页首

有关部分索引项的详细信息

  • 如上所述,因为邮件和文档属性和它们的元数据编制索引,则关键字搜索可能如果索引元数据中显示该关键字返回结果。但是,该相同的关键字搜索可能无法返回相同的项,如果关键字仅显示具有不受支持的文件类型的项目内容中。在这种情况下,该项目将返回作为部分索引项。

  • 如果部分索引的项包括在搜索结果中,因为它符合搜索查询条件 (和未排除) 然后它将不会包含为估计的搜索统计信息中的部分索引项。此外,它不会包含部分索引项时导出搜索结果。

  • 尽管文件类型和索引支持,则创建索引,但可以在索引或搜索错误导致部分索引项以返回的文件。例如,搜索非常大的 Excel 文件可能部分成功 (因为创建了索引第 4 MB),但因为超出了文件大小限制,然后将失败。在此例中,则可能与搜索结果以及部分索引项,则返回相同的文件。

  • 附加的文件与 Microsoft 技术加密创建了索引,可以搜索。与非 Microsoft 技术加密的文件部分索引。

  • 使用 S/MIME 加密的电子邮件是部分索引。这其中包括带或不带文件附件的加密的邮件。

  • 由信息权限管理 (IRM) 保护的邮件已编制索引,因此如果此类邮件匹配查询参数,将会包括在搜索结果中。

返回页首

另请参阅

调查 Office 365 电子数据展示中的部分索引的项

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×