Parcialmente indexadas itens na pesquisa de conteúdo no Office 365

Observação:  Desejamos fornecer o conteúdo da Ajuda mais recente no seu idioma da forma mais rápida possível. Esta página foi traduzida de forma automatizada e pode conter imprecisões ou erros gramaticais. Nosso objetivo é que este conteúdo seja útil para você. As informações foram úteis? Dê sua opinião no final desta página. Aqui está o artigo em inglês para facilitar a referência.

Uma pesquisa de conteúdo que você executar o Centro de Conformidade e Segurança do Office 365 automaticamente inclui itens parcialmente indexadas nos resultados da pesquisa estimada quando você executa uma pesquisa. Parcialmente indexada itens são itens de caixa de correio de Exchange e documentos em sites SharePoint e OneDrive for Business que, por algum motivo, não foram completamente indexados para pesquisa. Em Exchange, um item parcialmente indexado geralmente contém um arquivo — de um tipo de arquivo que não pode ser indexado — que está anexado a uma mensagem de email. Aqui estão alguns outros motivos pelos quais itens não podem ser indexadas para pesquisa e são retornados como itens indexados parcialmente quando você executa uma pesquisa:

  • O tipo de arquivo é desconhecido ou não suporte para indexação.

  • As mensagens têm um arquivo anexado sem um manipulador válido, como arquivos de imagem; Essa é a causa mais comum de itens de email parcialmente indexada.

  • O tipo de arquivo é compatível com a indexação, mas ocorreu um erro de indexação com um arquivo específico.

  • Muitos arquivos anexados a uma mensagem de email.

  • Um arquivo anexado a uma mensagem de email é muito grande.

  • Um arquivo foi criptografado com tecnologias que não são da Microsoft.

  • Um arquivo está protegido por senha.

Observação: A maioria das organizações Office 365 têm menos de 1% do conteúdo por volume e menos de 12% por tamanho parcialmente indexada. O motivo para a diferença entre o volume e tamanho é que arquivos maiores têm maior probabilidade de que contém o conteúdo que não pode ser indexado completamente.

Para investigações legais, sua organização pode ser necessária revisar itens indexados parcialmente. Você também pode especificar se deseja incluir itens indexados parcialmente quando você exporta os resultados da pesquisa para um computador local ou quando você prepara os resultados para análise com Descoberta Eletrônica Avançada do Office 365. Para obter mais informações, consulte Investigating parcialmente indexada itens na descoberta eletrônica do Office 365.

Sumário

Tipos de arquivo não indexados para pesquisa

Mensagens e documentos com parcialmente indexada arquivo tipos podem ser retornados nos resultados da pesquisa

Itens indexados parcialmente incluídos nos resultados da pesquisa

Parcialmente indexadas itens excluídos nos resultados da pesquisa

Limites de indexação para mensagens na pesquisa de conteúdo

Mais informações sobre itens parcialmente indexados

Tipos de arquivo não indexados para pesquisa

Certos tipos de arquivos, como Bitmap ou arquivos MP3, não contêm o conteúdo que pode ser indexado. Como resultado, os servidores de indexação de pesquisa no Exchange e SharePoint não executam a indexação de texto completo nesses tipos de arquivos. Esses tipos de arquivos são considerados tipos de arquivo sem suporte. Também existem tipos de arquivo para o qual a indexação de texto completo foi desativado por padrão ou por um administrador. Tipos de arquivo sem suporte e desativado são rotulados como itens não indexados nas pesquisas de conteúdo. Conforme anteriormente, parcialmente indexadas itens podem ser incluídos no conjunto de resultados de pesquisa quando você executa uma pesquisa, exportar os resultados de pesquisa para um computador local ou preparar os resultados da pesquisa para Descoberta Eletrônica Avançada.

Para obter uma lista de formatos de arquivo com suporte ou desabilitados, confira os tópicos a seguir:

Retornar ao início

Mensagens e documentos com parcialmente indexada arquivo tipos podem ser retornados nos resultados da pesquisa

Não cada mensagem de email com um anexo de arquivo parcialmente indexada ou cada documento parcialmente indexada SharePoint automaticamente é retornado como um item parcialmente indexado. Isso ocorre porque outra mensagem ou propriedades do documento, como a propriedade Subject em mensagens de email e as propriedades Title ou Author para documentos são indexados e disponível para ser pesquisado. Por exemplo, uma pesquisa de palavra-chave para "financeiro" retornarão itens com um anexo de arquivo parcialmente indexada se essa palavra aparece no assunto de uma mensagem de email ou o nome de arquivo ou o título de um documento. No entanto, se a palavra-chave aparece apenas no corpo do arquivo, a mensagem ou documento seria retornado como um item parcialmente indexado.

Da mesma forma, as mensagens com anexos de arquivo parcialmente indexada e documentos de um tipo de arquivo parcialmente indexada são incluídas nos resultados da pesquisa quando outras propriedades de mensagem ou documento, que são indexados e pesquisados, atendem aos critérios de pesquisa. Propriedades de mensagem que estão indexadas para pesquisa incluem datas enviadas e recebidas, remetente e destinatário, o nome do arquivo de um anexo e o texto no corpo da mensagem. Propriedades do documento indexadas para pesquisa incluem datas criadas e modificadas. Portanto apesar de anexo de uma mensagem pode ser um item parcialmente indexado, a mensagem será incluída nos resultados da pesquisa regular se o valor de outras propriedades de mensagem ou documento corresponde aos critérios de pesquisa.

Para obter uma lista das propriedades de email e documentos que você pode pesquisar usando o recurso Pesquisa no Centro de Conformidade e Segurança, confira Keyword queries and search conditions for Content Search.

Retornar ao início

Itens indexados parcialmente incluídos nos resultados da pesquisa

Sua organização pode ser necessária para identificar e executar análise adicional em itens indexados parcialmente para determinar quais eles são, o que eles contêm e eles estarem relevantes para uma investigação específico. Como explicado anteriormente, os itens parcialmente indexados em locais de conteúdo que são pesquisados são incluídos automaticamente com os resultados da pesquisa estimado. Você tem a opção para incluir esses itens indexados parcialmente quando você exporta os resultados da pesquisa ou preparar os resultados da pesquisa para Descoberta Eletrônica Avançada. Para incluir itens indexados parcialmente quando você estiver exportando os resultados de pesquisa ou Preparando-los para Descoberta Eletrônica Avançada, selecione uma das opções para incluir itens que têm um formato não reconhecido, são criptografados ou não foram indexados por outros motivos.

Tenha o seguinte em mente sobre itens indexados parcialmente:

  • Quando você executa uma pesquisa de conteúdo, o número total e o tamanho dos itens parcialmente indexadas (retornado pela consulta de pesquisa) são exibidas nas estatísticas de pesquisa no painel de detalhes, como rotulado como "itens não indexados".

  • Quando você exporta resultados da pesquisa e incluir itens parcialmente indexadas, parcialmente indexada Exchange itens são exportados para um arquivo PST separado para cada caixa de correio em que eles estão localizados ou como mensagens individuais se você selecionar a opção para baixar itens de Exchange como mensagens. parcialmente indexada SharePoint itens são exportados para uma pasta chamada Uncrawlable.

  • Se a pesquisa da qual você está exportando resultados for uma pesquisa de locais de conteúdo específicos ou de todos os locais de conteúdo na sua organização, somente os itens não indexados dos locais de conteúdo que contêm itens correspondentes aos critérios de pesquisa serão exportados. Em outras palavras, se nenhum resultado de pesquisa for encontrado em uma caixa de correio ou em um site, os itens não indexados nessa caixa de correio ou nesse site não serão exportados. A razão para isso é que exportar itens não indexados de muitos locais na organização pode aumentar a probabilidade de erros de exportação e o tempo necessário para exportar e baixar os resultados da pesquisa.

    Para exportar itens indexados parcial de todos os locais de conteúdo para uma pesquisa, configurar a pesquisa para retornar todos os itens (removendo palavras-chave de consulta de pesquisa) e, em seguida, exportar somente os itens parcialmente indexados quando você exporta os resultados da pesquisa (clicando em todos itens, excluindo parcialmente itens indexados em incluir estes itens da pesquisa ).

  • Se você optar por incluir todos os itens de caixa de correio nos resultados da pesquisa, ou se uma consulta de pesquisa não especifica nenhuma palavras-chave ou especifica apenas um intervalo de datas, itens indexados parcialmente não podem ser copiados para o arquivo PST que contém os itens parcialmente indexados. Isso ocorre porque todos os itens, incluindo quaisquer itens parcialmente indexadas, serão automaticamente incluídos nos resultados da pesquisa regular.

  • Itens indexados parcialmente não estão disponíveis para ser visualizado. É necessário exportar os resultados de pesquisa para exibir parcialmente indexadas itens retornados pela pesquisa.

Retornar ao início

Parcialmente indexadas itens excluídos nos resultados da pesquisa

Se um item é parcialmente indexado, mas ela não atender aos critérios de consulta de pesquisa, ela não será incluída como um item parcialmente indexado nos resultados da pesquisa. Em outras palavras, o item é excluído nos resultados da pesquisa. Por exemplo, digamos que você executa uma pesquisa e não incluir quaisquer palavras-chave ou propriedades porque você deseja incluir todo o conteúdo. Mas incluir uma condição de intervalo de data para a consulta. Se um item parcialmente indexado cai fora desse intervalo de datas, ele não será incluído como um item parcialmente indexado. Intervalos de datas são uma maneira eficiente de excluir itens indexados parcialmente dos resultados de pesquisa.

Da mesma forma, se você optar por incluir itens indexados parcialmente quando você exporta os resultados de uma pesquisa, parcialmente indexados itens que foram excluídos nos resultados da pesquisa não ser exportados.

Uma exceção a essa regra é quando você criar uma isenção baseado em consulta que está associada a um caso de descoberta eletrônica. Se você criar uma isenção baseado em consulta, todos os parcialmente itens indexados são colocados em espera. Isso inclui parcialmente indexados itens que não correspondem aos critérios de consulta de pesquisa e parcialmente indexada que talvez estejam fora uma condição de intervalo de data. Para obter mais informações sobre a criação baseada em consulta retenções, consulte gerenciar casos de descoberta eletrônica no Centro de conformidade de segurança do Office 365.

Limites de indexação para mensagens na pesquisa de conteúdo

A tabela a seguir descreve os limites de indexação que podem resultar em uma mensagem de email que está sendo retornada como um item parcialmente indexado em uma pesquisa de conteúdo no Office 365.

Para obter uma lista de indexação limites para SharePoint documentos, consulte limites de pesquisa do SharePoint Online.

Limite de indexação

Valor máximo

Descrição

Tamanho máximo de anexo (excluindo arquivos do Excel)

150 MB

O tamanho máximo de um anexo de email que será analisado para indexação. Os anexos que excedem esse limite não são analisados para indexação e a mensagem com o anexo é marcada como não indexada.

Observação: Análise é o processo pelo qual o serviço de indexação extrai texto do anexo, remove caracteres desnecessários, como pontuação e espaços, e divide o texto em palavras (em um processo chamado geração de tokens) que serão armazenadas no índice.

Tamanho máximo de arquivos do Excel

4 MB

O tamanho máximo de um arquivo do Excel localizado em um site ou anexado a uma mensagem de email que será analisado para indexação. Os arquivos do Excel que excedem esse limite não são analisados e o arquivo ou a mensagem com o anexo de arquivo é marcado como não indexado.

Número máximo de anexos

250

O número máximo de arquivos anexados a uma mensagem de email que serão analisados para indexação. Quando a mensagem tem mais de 250 anexos, os primeiros 250 são analisados e indexados e a mensagem é marcada como parcialmente indexada, porque inclui anexos adicionais que não foram analisados.

Profundidade máxima dos anexos

30

O número máximo de anexos aninhados que são analisados. Por exemplo, quando uma mensagem de email tem outra mensagem anexada a ela e a mensagem anexada tem um documento do Word anexado, o documento e a mensagem anexada são indexados. Esse comportamento continuará para até 30 anexos aninhados.

Número máximo de imagens anexadas

0

Uma imagem anexada a uma mensagem de email é ignorada pelo analisador e não é indexada.

Tempo máximo gasto durante a análise de um item

30 segundos

30 segundos é o tempo máximo gasto durante a análise de um item para indexação. Quando o tempo de análise é superior a 30 segundos, o item é marcado como parcialmente indexado.

Saída máxima do analisador

2 milhões de caracteres

A quantidade máxima de saída de texto indexado pelo analisador. Por exemplo, se o analisador extrair oito milhões de caracteres de um documento, apenas os primeiros dois milhões serão indexados.

Máximo de tokens de anotação

Dois milhões

Quando uma mensagem de email é indexada, cada palavra é anotada com instruções de processamento diferentes que especificam como essa palavra deve ser indexada. Cada conjunto de instruções de processamento é chamado de token de anotação. Para manter a qualidade do serviço no Office 365, há um limite de dois milhões de tokens de anotação para uma mensagem de email.

Tamanho máximo do corpo no índice

67 milhões de caracteres

O número total de caracteres no corpo de uma mensagem de email e todos os seus anexos. Quando uma mensagem de email é indexada, todo o texto no corpo da mensagem e em todos os anexos é concatenado em uma única cadeia de caracteres. O tamanho máximo desta cadeia de caracteres indexada é de 67 milhões de caracteres.

Máximo de tokens exclusivos no corpo

Um milhão

Como explicado anteriormente, os tokens são o resultado da extração de texto do conteúdo, da remoção da pontuação e dos espaços, e da divisão em palavras (chamadas tokens) que são armazenadas no índice. Por exemplo, a frase "cat, mouse, bird, dog, dog" contém cinco tokens. Mas somente quatro desse tokens são exclusivos. Há um limite de um milhão de tokens exclusivos por mensagem de email, o que ajuda a impedir que o índice fique muito grande com tokens aleatórios.

Retornar ao início

Mais informações sobre itens parcialmente indexados

  • Como mencionado anteriormente, como propriedades do documento e seus metadados estão indexados, uma pesquisa de palavra-chave pode retornar resultados se essa palavra aparecer nos metadados indexados. No entanto, essa mesma pesquisa de palavra-chave pode não retornar o mesmo item se a palavra-chave aparece apenas no conteúdo de um item com um tipo de arquivo sem suporte. Nesse caso, o item poderia ser retornado como um item parcialmente indexado.

  • Se um item parcialmente indexado está incluído nos resultados da pesquisa, pois ele atendido aos critérios de consulta de pesquisa (e não foi excluído), em seguida, ele não será incluído como um item parcialmente indexado nas estatísticas da pesquisa estimado. Além disso, ele não será incluído com itens indexados parcialmente quando você exporta os resultados da pesquisa.

  • Embora um tipo de arquivo tem suporte para indexação e é indexado, pode haver erros de indexação ou pesquisa que causarão um arquivo a ser retornado como um item parcialmente indexado. Por exemplo, pesquisar um arquivo muito grande do Excel pode ser parcialmente bem-sucedida (porque o primeiro MB 4 são indexados), mas depois falhará porque o limite de tamanho de arquivo é excedido. Nesse caso, é possível que o mesmo arquivo é retornado com os resultados da pesquisa e como um item parcialmente indexado.

  • Anexos de arquivos criptografados com tecnologias Microsoft são indexados e podem ser pesquisados. Arquivos criptografados com tecnologias não sejam da Microsoft estão parcialmente indexados.

  • Mensagens de email criptografadas com S/MIME estão parcialmente indexadas. Isso inclui mensagens criptografadas com ou sem anexos de arquivo.

  • As mensagens protegidas usando o Gerenciamento de Direitos de Informação (IRM) são indexadas e são incluídas nos resultados da pesquisa se corresponderem aos parâmetros de pesquisa.

Retornar ao início

Consulte Também

Investigar itens indexados parcialmente na descoberta eletrônica do Office 365

Expanda suas habilidades
Explore o treinamento
Obtenha novos recursos primeiro
Ingressar no Office Insider

Essas informações foram úteis?

Obrigado por seus comentários!

Agradecemos pelos seus comentários! Parece que pode ser útil conectar você a um de nossos agentes de suporte do Office.

×