Investigating partially indexed items in Office 365 eDiscovery

Observação:  Desejamos fornecer o conteúdo da Ajuda mais recente no seu idioma da forma mais rápida possível. Esta página foi traduzida de forma automatizada e pode conter imprecisões ou erros gramaticais. Nosso objetivo é que este conteúdo seja útil para você. As informações foram úteis? Dê sua opinião no final desta página. Aqui está o artigo em inglês para facilitar a referência.

Uma pesquisa de conteúdo que você executar o Centro de Conformidade e Segurança do Office 365 automaticamente inclui itens parcialmente indexadas nos resultados da pesquisa estimada quando você executa uma pesquisa. Parcialmente indexada itens são itens de caixa de correio de Exchange e documentos em sites SharePoint e OneDrive for Business que, por algum motivo, não foram completamente indexados para pesquisa. A maioria das mensagens de email e documentos de sites são indexados com êxito porque eles estão dentro da indexação limites do Office 365. No entanto, alguns itens podem exceder esses limites de indexação e serão indexados parcialmente. Estes são outros motivos para itens não podem ser indexadas para pesquisa e são retornados como itens indexados parcialmente quando você executa uma pesquisa de conteúdo:

  • Mensagens de email tem um arquivo anexado de um tipo de arquivo que não pode ser indexado; Na maioria dos casos, o tipo de arquivo é reconhecido ou sem suporte para indexação

  • As mensagens têm um arquivo anexado sem um manipulador válido, como arquivos de imagem; Essa é a causa mais comum de itens de email parcialmente indexada

  • Muitos arquivos anexados a uma mensagem de email

  • Um arquivo anexado a uma mensagem de email é muito grande

  • O tipo de arquivo é suportado para indexação, mas ocorreu um erro de indexação para um arquivo específico

Embora ele varia, a maioria dos clientes de organizações Office 365 ter menos de 1% de conteúdo por volume e menos de 12% de conteúdo por tamanho parcialmente indexada. O motivo para a diferença entre o volume versus tamanho é que arquivos maiores têm maior probabilidade de que contém o conteúdo que não pode ser indexado completamente.

Por que a contagem de itens parcialmente indexada altera para uma pesquisa?

Depois que você executa uma pesquisa de conteúdo no Centro de Conformidade e Segurança do Office 365, o número total e o tamanho dos itens parcialmente indexadas nos locais que foram pesquisados estão listadas nas estatísticas de resultado de pesquisa que são exibidas nas estatísticas detalhadas para a pesquisa. Observe que eles são chamados de itens não indexados nas estatísticas da pesquisa. Aqui estão algumas coisas que afetam o número de itens parcialmente indexados que são retornados nos resultados da pesquisa:

  • Se um item é parcialmente indexado e corresponde a consulta de pesquisa, ela será incluída no contagem (tanto tamanho) de itens de resultado de pesquisa e parcialmente indexada. No entanto, quando os resultados da pesquisa mesmo são exportados, o item é incluído somente com o conjunto de resultados da pesquisa; ele não será incluído como um item parcialmente indexado.

  • Se você especificar um intervalo de datas para uma consulta de pesquisa (incluindo-o na consulta de palavra-chave) ou usando uma condição, qualquer item parcialmente indexada que não corresponda o intervalo de datas não está incluída na contagem de itens parcialmente indexadas. Somente os itens parcialmente indexados que estão dentro de intervalo de datas são incluídos na contagem de itens parcialmente indexadas.

Observação: Parcialmente indexada itens localizados em SharePoint e OneDrive sites não são incluídas na estimativa de itens parcialmente indexadas que é exibida nas estatísticas detalhadas para a pesquisa. No entanto, os itens indexados parcialmente podem ser exportados quando você exporta os resultados de uma pesquisa de conteúdo. Por exemplo, se você só pesquisar sites em uma pesquisa de conteúdo, o número estimado parcialmente itens indexados será zero.

Cálculo da taxa de parcialmente indexadas itens em sua organização

Para compreender exposição da sua organização para itens parcialmente indexadas, você pode executar uma pesquisa para todo o conteúdo em todas as caixas de correio (usando uma consulta de palavra-chave em branco). No seguinte exemplo abaixo, existem 56,208 (4,830 MB) totalmente indexados itens e 470 (316 MB) parcialmente indexada itens.

Example of search statistics showing partially indexed items

Você pode determinar a porcentagem de itens indexados parcialmente usando os seguintes cálculos.

Para calcular a taxa de parcialmente indexadas itens em sua organização:

(Total number of partially indexed items/Total number of items) x 100
(470/56,208) x 100 = 0.84%

Usando os resultados da pesquisa do exemplo anterior,. 84% de todos os itens de caixas de correio são parcialmente indexada.

Para calcular a porcentagem do tamanho da parcialmente indexadas itens em sua organização:

(Size of all partially indexed items/Size of all items) x 100
(316 MB/4830 MB) x 100 = 6.54%

Portanto, no exemplo anterior, 6,54. % do tamanho total de itens de caixa de correio são de itens indexados parcialmente. Conforme anteriormente mencionado, a maioria das organizações Office 365 clientes têm menos de 1% do conteúdo por volume e menos de 12% de conteúdo por tamanho parcialmente indexada.

Trabalhando com parcialmente itens indexados

Em casos quando você precisa examinar parcialmente itens para validar que eles não contêm informações relevantes, você pode Exportar um relatório de pesquisa de conteúdo que contém informações sobre itens parcialmente indexadas. Quando você exporta um relatório de pesquisa de conteúdo, certifique-se de escolher uma das opções de exportação que inclui itens parcialmente indexadas.

Choose the second or third option to export partially indexed items

Quando você exporta os resultados de pesquisa de conteúdo ou um relatório de pesquisa de conteúdo usando uma destas opções, a exportação inclui um relatório denominado Items.csv não indexados. Este relatório inclui a maioria das mesmas informações que o arquivo de ResultsLog.csv; No entanto, o arquivo de Items.csv não indexados também inclui dois campos relacionados a itens indexados parcialmente: Marcas de erro e Propriedades de erro. Esses campos contêm informações sobre o erro de indexação para cada item parcialmente indexada. Usando as informações desses dois campos pode ajudá-lo a determinar se ou não o erro de indexação para um determinado afeta sua investigação. Em caso afirmativo, você pode realizar uma pesquisa de conteúdo de destino e recuperar e exportar mensagens de email específico e SharePoint ou OneDrive documentos para que você possa examiná-los para determinar se elas são relevantes para a investigação. Para obter instruções passo a passo, consulte preparar um arquivo CSV para uma pesquisa de conteúdo direcionada no Office 365.

Observação: O arquivo não indexados Items.csv também contém campos denominados Tipo de erro e Mensagem de erro. Estas são herdados campos que contêm informações semelhantes às informações nos campos Marcas de erro e Propriedades de erro , mas com informações menos detalhadas. Você pode ignorar com segurança esses campos herdados.

Erros relacionados a parcialmente itens indexados

Marcas de erro são compostas de duas partes de informações, o erro e o tipo de arquivo. Por exemplo, em par este erro/tipo de arquivo:

 parseroutputsize_xls

parseroutputsize é o erro e xls é o tipo de arquivo do arquivo em que o erro ocorreu. Em casos foram o tipo de arquivo não foi reconhecido ou o tipo de arquivo foi não se aplica ao erro, você verá o valor noformat no lugar do tipo de arquivo.

A seguir está uma lista de erros e uma descrição da causa do erro de indexação.

Marca de erro

Descrição

attachmentcount

Uma mensagem de email tinha muitos anexos e alguns desses anexos não foram processados.

attachmentdepth

O analisador de documento e recuperador conteúdo encontrado muitos níveis de anexos aninhados dentro de outros anexos. Alguns desses anexos não processados.

attachmentrms

Anexo falha decodificar porque ele foi protegido por RMS.

attachmentsize

Um arquivo anexado a uma mensagem de email foi muito grande e não pôde ser processado.

indexingtruncated

Ao escrever a mensagem de email processados ao índice, uma das propriedades indexáveis era muito grande e foi truncada. As propriedades truncadas são listadas no campo de propriedades de erro.

invalidunicode

Uma mensagem de email continha texto que não pôde ser processado como Unicode válida. Indexação para esse item pode estar incompleta.

parserencrypted

O conteúdo do anexo ou mensagem de email está criptografado e Office 365 não foi possível decodificar o conteúdo.

parsererror

Ocorreu um erro desconhecido durante a análise. Normalmente, isso resulta de um bug de software ou uma falha de serviço.

parserinputsize

Um anexo grande demais para o analisador tratar e a análise desse anexo não ocorreu ou não foi concluída.

parsermalformed

Um anexo foi formada incorretamente e não pôde ser controlado pelo analisador. Este resultado do arquivo antigo pode formatos, arquivos criados por um software incompatível ou vírus simula para algo diferente de solicitada.

parseroutputsize

A saída da análise de um anexo grande demais e foram truncados.

parserunknowntype

Um anexo tinha um tipo de arquivo que Office 365 não foi possível detectar.

parserunsupportedtype

Um anexo tinha um tipo de arquivo que Office 365 pode detectar, mas esse tipo de arquivo de análise não é compatíveis.

propertytoobig

O valor de uma propriedade de email no Exchange Store era muito grande para ser recuperadas e a mensagem não pôde ser processada. Isso geralmente só acontece para a propriedade de corpo de uma mensagem de email.

retrieverrms

O conteúdo recuperador Falha ao decodificar uma mensagem protegida por RMS.

wordbreakertruncated

Número excessivo de palavras foram identificado no documento durante a indexação. Processamento da propriedade interrompido quando atingir o limite e a propriedade será truncada.

Campos de erro descrevem quais campos são afetados pelo erro de processamento listado no campo marcas de erro. Se você estiver procurando uma propriedade como subject ou participants, erros no corpo da mensagem não afetam os resultados da pesquisa. Isso pode ser útil ao determinar exatamente quais parcialmente indexadas itens em que talvez você precise investigar ainda mais.

Usando um script do PowerShell para determinar exposição da sua organização para itens de email parcialmente indexada

As etapas a seguir mostram como executar um script PowerShell que procura todos os itens em todas as caixas de correio de Exchange e gera um relatório sobre a proporção da sua organização de itens de email parcialmente indexada (por contagem e por tamanho) e exibe o número de itens (e seu tipo de arquivo) para cada erro indexação que ocorre. Use as descrições de marca de erro na seção anterior para identificar o erro de indexação.

  1. Salvar o texto a seguir em um arquivo de script Windows PowerShell usando o sufixo filename. ps1; Por exemplo, PartiallyIndexedItems.ps1.

    write-host "**************************************************"
    write-host "     Office 365 Security & Compliance Center      " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "   eDiscovery Partially Indexed Item Statistics   " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "**************************************************"
    " " 
    
    # Create a search with Error Tags Refinders enabled
    Remove-ComplianceSearch "RefinerTest" -Confirm:$false -ErrorAction 'SilentlyContinue'
    New-ComplianceSearch -Name "RefinerTest" -ContentMatchQuery "size>0" -RefinerNames ErrorTags -ExchangeLocation ALL
    Start-ComplianceSearch "RefinerTest"
    # Loop while search is in progress
    do{
        Write-host "Waiting for search to complete..."
        Start-Sleep -s 5
        $complianceSearch = Get-ComplianceSearch "RefinerTest"
    }while ($complianceSearch.Status -ne 'Completed')
    
    $refiners = $complianceSearch.Refiners | ConvertFrom-Json
    $errorTagProperties = $refiners.Entries | Get-Member -MemberType NoteProperty
    
    $partiallyIndexedRatio = $complianceSearch.UnindexedItems / $complianceSearch.Items
    $partiallyIndexedSizeRatio = $complianceSearch.UnindexedSize / $complianceSearch.Size
    
    " "
    "===== Partially indexed items ====="
    "         Total          Ratio"
    "Count    {0:N0}{1:P2}" -f $complianceSearch.Items.ToString("N0").PadRight(15, " "), $partiallyIndexedRatio
    "Size(GB) {0:N2}{1:P2}" -f ($complianceSearch.Size / 1GB).ToString("N2").PadRight(15, " "), $partiallyIndexedSizeRatio
    
    " "
    Write-Host ===== Reasons for partially indexed items =====
    foreach($errorTagProperty in $errorTagProperties)
    {
        $name = $refiners.Entries.($errorTagProperty.Name).Name
        $count = $refiners.Entries.($errorTagProperty.Name).TotalCount
    
        $frag = $name.Split("{_}")
    
        $errorTag = $frag[0]
        $fileType = $frag[1]
    
        if ($errorTag -ne $lastErrorTag)
        {
            $errorTag
        }
        "    " + $fileType + " => " + $count
        $lastErrorTag = $errorTag
    }
    
  2. Conectar-se a segurança do Office 365 e PowerShell do Centro de conformidade.

  3. No Centro de Conformidade e Segurança PowerShell, vá para a pasta onde você salvou o script na etapa 1 e, em seguida, execute o script; Por exemplo:

    .\PartiallyIndexedItems.ps1

Aqui está um exemplo fo a saída retornada pelo script.

Example of output from script that generates a report on your organization's exposure to partially indexed email items

Observe o seguinte:

  1. O número total e o tamanho dos itens de email e a proporção da sua organização de itens de email parcialmente indexada (por contagem e por tamanho)

  2. Marcas de erro a lista e os tipos de arquivo correspondentes para os quais o erro ocorreu.

Retornar ao início

Tópicos Relacionados

Parcialmente indexadas itens na pesquisa de conteúdo no Office 365

Expanda suas habilidades no Office
Explore o treinamento
Obtenha novos recursos primeiro
Ingressar no Office Insider

Essas informações foram úteis?

Obrigado por seus comentários!

Agradecemos pelos seus comentários! Parece que pode ser útil conectar você a um de nossos agentes de suporte do Office.

×