Investigating partially indexed items in Office 365 eDiscovery

注意:  我们希望能够尽快以你的语言为你提供最新的帮助内容。 本页面是自动翻译的,可能包含语法错误或不准确之处。我们的目的是使此内容能对你有所帮助。可以在本页面底部告诉我们此信息是否对你有帮助吗? 请在此处查看本文的 英文版本 以便参考。

当您运行搜索,您自动运行从Office 365 安全与合规中心内容搜索估计的搜索结果中包含部分索引的项。部分索引项是Exchange邮箱项目和SharePoint和OneDrive for Business ,由于某种原因未完全搜索索引的网站上的文档。因为其位于索引的 Office 365 的限制内成功索引大多数电子邮件和网站的文档。但是,某些项目可能超过这些索引限制,并且将部分索引。下面是其他原因,项目无法搜索索引以及运行内容搜索时,将返回作为部分索引项:

  • 电子邮件有不可以编制索引; 的文件类型附加的文件在大多数情况下中的文件类型是无法识别或不支持索引

  • 邮件具有附加的文件没有有效处理程序中,例如图像文件;这是部分索引的电子邮件的最常见原因

  • Too many files attached to an email message

  • A file attached to an email message is too large

  • The file type is supported for indexing but an indexing error occurred for a specific file

尽管各不相同,大多数Office 365组织客户可以通过批量和小于 12%的内容具有按部分索引的大小小于 1%的内容。与大小音量之间的差异的原因是较大的文件具有较高概率为包含不完全编制索引的内容。

部分索引的项的计数为什么更改搜索?

Office 365 安全和合规性中心中运行内容搜索后,在搜索结果统计信息显示在搜索的详细统计信息列出的总数和搜索的位置中的部分索引项的大小。请注意这些称为未索引的项中搜索统计信息。下面是会影响搜索结果中返回的部分索引项的数目的一些注意事项:

  • 如果某个项目部分索引,而匹配搜索查询,它将包括在计数 (和大小) 的搜索结果项和部分索引的项。但是,当该相同结果将被导出,项目是搜索的仅附带的搜索结果; 集不包含它作为部分索引项。

  • 如果指定的日期范围搜索查询 (包括其关键字查询中) 或使用条件,任何不匹配的日期范围的部分索引的项未列入部分索引项的计数。仅日期范围内的部分索引的项包括在部分索引项的计数。

注意:部分索引位于SharePoint和OneDrive网站显示在搜索的详细统计信息部分索引项的估计值中包含的项目。但是,当您导出内容的搜索结果,则可以导出部分索引的项。例如,如果您仅搜索网站在内容搜索,估计的数字部分索引的项将为零。

计算您的组织中的部分索引项的比率

若要了解您的组织遭受部分索引项,您可以 (通过使用空白关键字查询) 运行所有邮箱在搜索所有内容。在下面的以下示例中,有 56,208 (4,830 MB) 完全索引项和 470 (316 MB) 部分索引项。

Example of search statistics showing partially indexed items

您可以通过使用以下计算确定部分索引项的百分比。

若要计算您的组织中的部分索引项的比例:

(Total number of partially indexed items/Total number of items) x 100
(470/56,208) x 100 = 0.84%

通过使用上一示例中,从搜索结果。 部分创建的所有邮箱项目 84%了索引。

若要计算您的组织中的部分索引项的大小的百分比:

(Size of all partially indexed items/Size of all items) x 100
(316 MB/4830 MB) x 100 = 6.54%

So in the previous example, 6.54% of the total size of mailbox items are from partially indexed items. As previously stated, most Office 365 organizations customers have less than 1% of content by volume and less than 12% of content by size that is partially indexed.

使用部分索引项

情况下在当您需要检查部分项目,它们不包含相关信息,您可以导出内容的搜索报告,请验证包含有关部分索引项的信息。当您导出内容搜索报告时,请务必选择将包含部分索引的项的导出选项之一。

Choose the second or third option to export partially indexed items

当您导出内容的搜索结果或内容搜索报告,请使用以下选项之一时,导出包含名为未索引 Items.csv 的报表。此报表包含大部分 ResultsLog.csv 文件; 相同的信息但是,未索引 Items.csv 文件还包括相关的部分索引项的两个字段:错误标记错误的属性。这些字段中包含有关每个部分索引项的索引错误的信息。使用这两个字段中的信息可以帮助您确定某个特定索引的错误会影响您的调查。如果是这样,您可以执行目标的内容搜索和检索和导出特定电子邮件和SharePoint或OneDrive文档,以便您可以检查它们来确定它们是否与您的调查相关。分步说明,请参阅准备在 Office 365 中的目标的内容搜索 CSV 文件

注意:索引状态 Items.csv 文件还包含名为错误类型错误消息的域。这些是旧字段包含类似于信息中的错误标记错误属性的字段,但具有更少的详细信息的信息。您可以忽略这些旧的字段。

与部分索引项有关的错误

错误标记组成两条信息、 错误和文件类型。例如,在此错误/文件类型对:

 parseroutputsize_xls

parseroutputsize错误, xls上出现了错误的文件的文件类型。在情况下已无法识别的文件类型或文件类型被不适用于错误,您将看到值noformat代替的文件类型。

下面是原因的索引错误和可能的错误的说明的列表。

错误标记

说明

attachmentcount

电子邮件有附件太多,并且这些附件的一些未处理。

attachmentdepth

内容检索器和文档分析器找到太多级别的嵌套在其他附件的附件。不处理一些这些附件。

attachmentrms

附件失败,因为它是受保护的 RMS 解码。

attachmentsize

附加到电子邮件中的文件太大,无法对其进行处理。

indexingtruncated

When writing the processed email message to the index, one of the indexable properties was too large and was truncated. The truncated properties are listed in Error Properties field.

invalidunicode

电子邮件包含无法处理为有效 Unicode 的文本。此项目的索引可能不完整。

parserencrypted

附件或电子邮件的内容进行加密,并Office 365无法解码内容。

parsererror

在分析过程中发生未知的错误。这通常会从软件错误或服务崩溃。

parserinputsize

附件分析器处理,对于太大,该附件的分析未发生或未完成。

parsermalformed

附件格式不正确,并且无法由分析器处理。此结果从可以旧文件格式,由不兼容的软件或病毒伪装以外声明为内容创建的文件。

parseroutputsize

附件的分析的输出太大,必须将截尾取整。

parserunknowntype

附件有文件类型无法检测该Office 365 。

parserunsupportedtype

附件出现,可能会检测Office 365,但分析该文件类型不受支持的文件类型。

propertytoobig

电子邮件属性的值在 Exchange 存储太大,无法检索,无法处理该邮件。这通常仅发生到电子邮件的正文属性。

retrieverrms

The content retriever failed to decode an RMS-protected message.

wordbreakertruncated

Too many words were identified in the document during indexing. Processing of the property stopped when reaching the limit, and the property is truncated.

Error fields describe which fields are affected by the processing error listed in the Error Tags field. If you're searching a property such as subject or participants, errors in the body of the message won't impact the results of your search. This can be useful when determining exactly which partially indexed items you might need to further investigate.

使用 PowerShell 脚本来确定您的组织遭受部分索引的电子邮件

The following steps show you how to run a PowerShell script that searches for all items in all Exchange mailboxes, and then generates a report about your organization's ratio of partially indexed email items (by count and by size) and displays the number of items (and their file type) for each indexing error that occurs. Use the error tag descriptions in the previous section to identify the indexing error.

  1. 使用文件名后缀.ps1; 将以下文本保存到Windows PowerShell脚本文件例如,PartiallyIndexedItems.ps1。

    write-host "**************************************************"
    write-host "     Office 365 Security & Compliance Center      " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "   eDiscovery Partially Indexed Item Statistics   " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "**************************************************"
    " " 
    
    # Create a search with Error Tags Refinders enabled
    Remove-ComplianceSearch "RefinerTest" -Confirm:$false -ErrorAction 'SilentlyContinue'
    New-ComplianceSearch -Name "RefinerTest" -ContentMatchQuery "size>0" -RefinerNames ErrorTags -ExchangeLocation ALL
    Start-ComplianceSearch "RefinerTest"
    # Loop while search is in progress
    do{
        Write-host "Waiting for search to complete..."
        Start-Sleep -s 5
        $complianceSearch = Get-ComplianceSearch "RefinerTest"
    }while ($complianceSearch.Status -ne 'Completed')
    
    $refiners = $complianceSearch.Refiners | ConvertFrom-Json
    $errorTagProperties = $refiners.Entries | Get-Member -MemberType NoteProperty
    
    $partiallyIndexedRatio = $complianceSearch.UnindexedItems / $complianceSearch.Items
    $partiallyIndexedSizeRatio = $complianceSearch.UnindexedSize / $complianceSearch.Size
    
    " "
    "===== Partially indexed items ====="
    "         Total          Ratio"
    "Count    {0:N0}{1:P2}" -f $complianceSearch.Items.ToString("N0").PadRight(15, " "), $partiallyIndexedRatio
    "Size(GB) {0:N2}{1:P2}" -f ($complianceSearch.Size / 1GB).ToString("N2").PadRight(15, " "), $partiallyIndexedSizeRatio
    
    " "
    Write-Host ===== Reasons for partially indexed items =====
    foreach($errorTagProperty in $errorTagProperties)
    {
        $name = $refiners.Entries.($errorTagProperty.Name).Name
        $count = $refiners.Entries.($errorTagProperty.Name).TotalCount
    
        $frag = $name.Split("{_}")
    
        $errorTag = $frag[0]
        $fileType = $frag[1]
    
        if ($errorTag -ne $lastErrorTag)
        {
            $errorTag
        }
        "    " + $fileType + " => " + $count
        $lastErrorTag = $errorTag
    }
    
  2. Connect to Office 365 Security & Compliance Center PowerShell.

  3. 安全和合规性中心 PowerShell,在中,转到步骤 1 中保存脚本位置的文件夹,然后再运行脚本。例如:

    .\PartiallyIndexedItems.ps1

Here's an example fo the output returned by the script.

Example of output from script that generates a report on your organization's exposure to partially indexed email items

注意以下事项:

  1. 总行数和电子邮件的大小和您的组织比部分索引的电子邮件 (按计数和大小)

  2. A list error tags and the corresponding file types for which the error occurred.

Return to top

相关主题

在 Office 365 中的内容搜索中的部分索引的项

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×