在 Office 365 中的内容搜索未索引的项

重要:  本文是由机器翻译的,请参阅免责声明。请在 此处 中查找本文的英文版本以便参考。

当您运行搜索,您自动运行从Office 365 安全与合规中心内容搜索估计的搜索结果中包含未索引的项。 索引状态的项目是Exchange邮箱项目和,由于某种原因未搜索索引SharePoint网站上的文档。在Exchange,未索引的项通常包含文件-不可以编制索引的文件类型 — 附加到电子邮件。下面是一些原因项目无法搜索索引以及当您运行搜索未索引项以返回:

  • 文件类型不受支持或禁用检索功能。

  • 文件类型支持检索,但是特定文件出现检索错误。

  • 附加到电子邮件的文件过多。

  • 附加到电子邮件的文件过大。

  • 文件使用非 Microsoft 技术进行加密。

  • 文件具有密码保护。

法律调查可能需要您的组织审阅未编制索引的项目。当您将搜索结果导出到本地计算机,或使用 Office 365 高级电子数据展示 准备用于进一步分析的结果时,您还可以指定是否包括未编制索引的项目。

内容

搜索未编制索引的文件类型

可以在搜索结果中返回邮件和使用索引状态的文件类型的文档

包含在搜索结果中未索引的项

从搜索结果中排除的项目未编制索引

索引的内容搜索中的邮件的限制

有关未索引项的详细信息

文件类型未编入索引以供搜索

某些类型的文件,例如位图或 MP3 文件不包含可索引的内容。因此, Exchange和SharePoint中的搜索索引服务器不执行全文索引对这些类型的文件。这些类型的文件被视为不受支持的文件类型。也有一些文件类型的全文索引已被禁用,默认情况下或由管理员。不受支持和禁用文件类型被视为内容搜索的未索引的项。如上文所述,运行搜索、 搜索结果导出到本地计算机,或准备高级电子数据展示的搜索结果时,可以搜索结果集中包含未索引的项。

有关支持和禁用的文件格式列表,请参阅以下主题:

返回页首

可在搜索结果中返回未编制索引的文件类型的邮件和文档

不是每个带有未编制索引的文件附件的电子邮件或每个未编制索引的 SharePoint 文档都可以自动返回为未编制索引的项目。这是因为其他邮件或文档属性(例如电子邮件中的 Subject 属性和文档的 TitleAuthor 属性)已编入索引并可进行搜索。例如,在您搜索关键字“财务”时,如果该关键字出现在电子邮件的主题或文档的文件名或标题中,则会返回包含未编制索引的文件附件的邮件。但是如果关键字只出现在文件的正文中,则邮件或文档会作为未编制索引的项目返回。

同样地,如果邮件或文档的其他属性可以进行检索并符合搜索条件,则包含未编制索引的文件附件的邮件和未编制索引的文件类型的文档也会包括在搜索结果中。可检索的邮件属性包括发送和接收日期、发件人和收件人、附件的文件名以及邮件正文中的文本。可检索的文档属性包括创建和修改日期。因此,如果其他邮件属性的值符合搜索条件,即使邮件附件可能是未编制索引的项目,如果其他邮件或文档属性的值与搜索条件匹配,该邮件也可以包括在常规搜索结果中。

有关您可以使用 安全与合规中心 中的搜索功能进行搜索的邮件和文档属性的列表,请参阅Keyword queries and search conditions for Content Search

返回页首

搜索结果中包含的未编制索引的项目

您的组织可能需要识别并执行未索引项,以确定什么是、 包含的内容,以及是否是与特定调查相关的其他分析。为前面所述,搜索的内容位置中的未索引的项将自动包括估计的搜索结果。您可以选择要导出搜索结果或搜索结果准备高级电子数据展示时包括这些索引状态的项目。 要导出的搜索结果或准备高级电子数据展示时包括未索引的项,请选择要包括具有不可识别的格式、 已加密,或其他原因未索引的项目的选项之一。

有关未编制索引的项目,请记住以下几点:

  • 内容搜索运行时,将中搜索统计信息的详细信息窗格中显示的总数和大小 (搜索查询返回) 的未索引项。

  • 导出搜索结果并包含未编制索引的项目时,未编制索引的 Exchange 项目会被导出到每个邮箱单独的 PST 文件(Exchange 项目位于其中)中,或者,如果您选择将 Exchange 项目下载为邮件的选项,则未编制索引的 Exchange 项目会被导出为单个邮件。未编制索引的 SharePoint 项目可以导出到名为“不可爬网”的文件夹中。

  • 如果要导出其结果的搜索是对组织中特定内容位置或所有内容位置的搜索,则只会导出包含与搜索条件相匹配的项目内容位置中未编制索引的项。换言之,如果在某个邮箱或站点内找不到任何搜索结果,则不会导出该邮箱或站点内任何未编制索引的项。其原因在于,从组织中每个位置导出未编制索引的项将增加导出错误的可能性,增加导出和下载搜索结果所花费的时间。

    若要从搜索所有内容的位置导出未索引的项,配置搜索返回的所有项目 (通过从搜索查询中删除任何关键字) 和导出搜索结果,然后导出仅未索引的项 (通过单击仅包含的项目无法识别的格式、 已加密,或其他原因未索引包含这些项目从搜索下)。

  • 如果您选择将所有邮箱项目都包括在搜索结果中,或者如果搜索查询未指定任何关键字或只指定日期范围,那么未编制索引的项目可能不会复制到包含未编制索引的项目的“PST”文件夹。这是因为所有项目(包括所有未编制索引的项目)都会自动包括在常规搜索结果中。

  • 未编制索引的项目不提供预览。您必须导出搜索结果,才能查看搜索返回的未编制索引的项目。

返回页首

排除在搜索结果之外的未编制索引的项目

如果未对项目编制索引但它不满足搜索查询条件,则它不会以未编制索引的项目的形式包含在搜索结果中。换句话说,该项目会被排除在搜索结果之外。例如,假设您运行搜索且不包括任何关键字或属性,因为您想要包括所有内容。但您包括了查询的日期范围条件。如果未编制索引的项目超出了该日期范围,则它不会被包含为未编制索引的项目。日期范围是从搜索结果中排除未编制索引的项目的有效方法。

同样,如果您在导出搜索结果时选择包括未编制索引的项目,将不会导出从搜索结果中排除的未编制索引的项目。

此规则的唯一例外是当您创建一个与电子数据展示事例相关联的基于查询的保留。如果您创建一个基于查询的保留,所有未编制索引项置于保持状态。这其中包括不匹配搜索查询条件的未索引的项和索引状态可能超出日期范围条件的项目。有关存储的有关创建基于查询的详细信息,请参阅在 Office 365 安全和合规性中心管理电子数据展示事例

索引的内容搜索中的邮件的限制

下表描述了索引限制可能会导致电子邮件作为一个索引状态的项目或Office 365中的内容搜索中的部分索引的项。

索引的SharePoint文档的限制的列表,请参阅SharePoint online 搜索限制

索引限制

最大值

说明

最大附件大小(不包括 Excel 文件)

150 MB

将进行索引分析的电子邮件附件的最大大小。超过此限制的任何附件都不会进行索引分析,且具有该附件的邮件将被标记为未索引。

注意: 分析是这样一个过程:索引服务从附件提取文本,删除标点和空格之类的不必要字符,然后将文本划分为词汇(此过程成为词汇切分),最后将词汇存储到索引中。

Excel 文件的最大大小

4 MB

网站上或附加到电子邮件且将进行索引分析的 Excel 文件的最大大小。超过此限制的任何 Excel 文件都不会进行索引分析,且该文件或具有该文件附件的电子邮件将被标记为未索引。

最大附件数

250

附加到电子邮件且将进行索引分析的最大文件数。如果邮件的附件数超过 250 个,将分析并索引前 250 个附件,并且该邮件将被标记为部分索引,因为它还有附件未分析。

最大附件深度

30

分析的最大嵌套附件数。例如,如果电子邮件附加了另外一封邮件,且该附加邮件又附加了 Word 文档,则将同时索引该 Word 文档和附加邮件。此行为适用于嵌套附件不超过 30 个的情况。

最大附加图像数

0

分析程序会跳过且不索引附加到电子邮件的图像。

分析项目所需的最长时间

30 秒

分析项目以进行索引最长需要 30 秒。如果分析时间超过 30 秒,该项目将被标记为部分索引。

分析程序最大输出

200 万个字符

来自分析程序且已索引的最大文本输出量。例如,如果分析程序从文档中提取了 800 万个字符,则仅索引了前 200 万个字符。

最大批注令牌数

200 万

编制电子邮件索引时,每个字词采用不同的处理指令进行注释,这些说明指定对该字词编制索引的方式。每组处理指令被称为批注令牌。为保证 Office 365 的服务质量,限制为一封电子邮件最多 200 万个批注令牌。

索引中的最大正文大小

6700 万个字符

电子邮件正文及其所有附件中的字符总数。编制电子邮件索引时,邮件正文和所有附件中的所有文本将串联成单个字符串。编入索引的此字符串的最大大小为 6700 万个字符。

正文最大唯一令牌数

100 万

如上文所述,从内容中提取文本,删除标点和空格,然后将其字词(称为令牌)存储在索引中,这就形成了令牌。例如,短语 "cat, mouse, bird, dog, dog" 包含 5 个令牌。但只有 4 个是唯一令牌。每封电子邮件限制为 100 万个唯一令牌,这有助于防止因随机令牌造成索引过大。

返回页首

有关未编制索引的项目的详细信息

  • 如上所述,因为邮件和文档属性和它们的元数据编制索引,则关键字搜索可能如果索引元数据中显示该关键字返回结果。但是,该相同的关键字搜索可能无法返回相同的项,如果关键字仅显示具有不受支持的文件类型的项目内容中。在这种情况下,该项目将返回作为未索引项。

  • 如果未编制索引的项目因为满足了搜索查询条件(且未被排除)而被包含在搜索结果中,则它不会以未编制索引的项目的形式包含在估计的搜索统计信息中。此外,当您导出搜索结果时,它将不会包含在未编制索引的项目中。

  • 虽然文件类型和索引支持,则创建索引,可能会导致返回作为索引状态项目文件的索引或搜索错误。例如,搜索非常大的 Excel 文件可能部分成功 (因为创建了索引第 4 MB),但再将失败,因为超出了文件大小限制。在此例中,则可能与搜索结果以及未索引项,则返回相同的文件。

  • 使用 Microsoft 技术加密的文件附件已编制索引并可进行搜索。使用非 Microsoft 技术加密的文件则未编制索引。

  • 使用 S/MIME 加密的电子邮件未编制索引。这包括带有或不带文件附件的加密邮件。

  • 由信息权限管理 (IRM) 保护的邮件已编制索引,因此如果此类邮件匹配查询参数,将会包括在搜索结果中。

返回页首

注意: 机器翻译免责声明:本文是由无人工介入的计算机系统翻译的。Microsoft 提供机器翻译是为了帮助非英语国家/地区用户方便阅读有关 Microsoft 产品、服务和技术的内容。由于机器翻译的原因,本文可能包含词汇、语法或文法方面的错误。

扩展你的技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×