Itens não indexados na pesquisa de conteúdo no Office 365

Importante :  Este artigo foi traduzido por um sistema de tradução automática, leia o aviso de isenção de responsabilidade. Para sua referência, veja a versão em inglês deste artigo aqui.

Uma pesquisa de conteúdo que você executar o Centro de Conformidade e Segurança do Office 365 automaticamente inclui itens não indexados nos resultados da pesquisa estimada quando você executa uma pesquisa. Itens não indexados são itens de caixa de correio de Exchange e documentos em sites de SharePoint que, por algum motivo, não foram indexados para pesquisa. Em Exchange, um item não indexado geralmente contém um arquivo — de um tipo de arquivo que não pode ser indexado — que está anexado a uma mensagem de email. Aqui estão alguns motivos para itens não podem ser indexadas para pesquisa e são retornados como itens não indexados quando você executa uma pesquisa:

  • Este arquivo não tem suporte ou está desabilitado para indexação.

  • O tipo de arquivo é compatível com a indexação, mas ocorreu um erro de indexação com um arquivo específico.

  • Muitos arquivos anexados a uma mensagem de email.

  • Um arquivo anexado a uma mensagem de email é muito grande.

  • Um arquivo foi criptografado com tecnologias que não são da Microsoft.

  • Um arquivo está protegido por senha.

Para investigações jurídicas, sua organização pode ser solicitada a revisar itens não indexados. Você também pode especificar se deseja incluir itens não indexados quando você exporta os resultados da pesquisa para um computador local ou prepara os resultados para análise posterior com o Descoberta Eletrônica Avançada do Office 365.

Sumário

Tipos de arquivo não indexados para pesquisa

Mensagens e documentos com tipos de arquivo não indexados podem ser retornados nos resultados da pesquisa

Itens não indexados incluídos nos resultados da pesquisa

Não indexados itens excluídos nos resultados da pesquisa

Limites de indexação para mensagens na pesquisa de conteúdo

Obter mais informações sobre os itens não indexados

Tipos de arquivo não indexados para pesquisa

Certos tipos de arquivos, como Bitmap ou arquivos MP3, não contêm o conteúdo que pode ser indexado. Como resultado, os servidores de indexação de pesquisa no Exchange e SharePoint não executam a indexação de texto completo nesses tipos de arquivos. Esses tipos de arquivos são considerados tipos de arquivo sem suporte. Também existem tipos de arquivo para o qual a indexação de texto completo foi desativado por padrão ou por um administrador. Tipos de arquivo sem suporte e desabilitados são considerados itens não indexados nas pesquisas de conteúdo. Declarado como anteriormente, itens não indexados podem ser incluídos no conjunto de resultados de pesquisa quando você executa uma pesquisa, exporta os resultados de pesquisa para um computador local ou preparar os resultados da pesquisa para Descoberta Eletrônica Avançada.

Para obter uma lista de formatos de arquivo com suporte ou desabilitados, confira os tópicos a seguir:

Retornar ao início

Mensagens e documentos com tipos de arquivo não indexados podem ser retornados nos resultados da pesquisa

Nem todas as mensagens de email com um anexo de arquivo não indexado ou cada documento do SharePoint não indexado é automaticamente retornado como um item não indexado. Isso acontece porque outras mensagens ou propriedades do documento, como a propriedade em mensagens de email do Subject e do Title ou propriedades do Author de documentos são indexados e disponíveis para serem pesquisados. Por exemplo, pesquisar a palavra-chave "financeiro" retornará itens com um anexo de arquivo não indexados se essa palavra-chave aparece no assunto de uma mensagem de email ou no nome do arquivo ou no título de um documento. No entanto, se a palavra-chave aparecesse apenas no corpo do arquivo, a mensagem ou o documento seriam retornados como um item não indexado.

De forma semelhante, as mensagens com anexos de arquivo não indexados e documentos de um tipo de arquivo não indexados são incluídas nos resultados da pesquisa quando outras propriedades de mensagem ou documento, que são indexadas e pesquisáveis, atenderem aos critérios de pesquisa. Propriedades de mensagem indexadas para pesquisa incluem datas enviadas e recebidas, remetente e destinatário, o nome do arquivo de um anexo e o texto no corpo da mensagem. Propriedades do documento indexadas para pesquisa incluem datas criadas e modificadas. Portanto, embora um anexo de mensagem possa ser um item não indexado, a mensagem será incluída nos resultados da pesquisa regular se o valor das outras propriedades de mensagem ou documento correspondam aos critérios de pesquisa.

Para obter uma lista das propriedades de email e documentos que você pode pesquisar usando o recurso Pesquisa no Centro de Conformidade e Segurança, confira Keyword queries and search conditions for Content Search.

Retornar ao início

Itens não indexados incluídos nos resultados da pesquisa

Sua organização pode ser necessária para identificar e executar análise adicional em itens não indexados para determinar quais eles são, o que eles contêm e eles estarem relevantes para uma investigação específico. Como explicado anteriormente, os itens não indexados em locais de conteúdo que são pesquisados são incluídos automaticamente com os resultados da pesquisa estimado. Você tem a opção para incluir esses itens não indexados quando você exporta os resultados da pesquisa ou preparar os resultados da pesquisa para Descoberta Eletrônica Avançada. Para incluir itens não indexados quando você estiver exportando os resultados de pesquisa ou Preparando-los para Descoberta Eletrônica Avançada, selecione uma das opções para incluir itens que têm um formato não reconhecido, são criptografados ou não foram indexados por outros motivos.

Lembre-se do seguinte em relação aos itens não indexados

  • Quando você executa uma pesquisa de conteúdo, o número total e o tamanho dos itens não indexados (retornado pela consulta de pesquisa) são exibidas nas estatísticas de pesquisa no painel de detalhes.

  • Quando você exporta os resultados da pesquisa e inclui itens não indexados, itens do Exchange não indexados são exportados para um arquivo PST separado para cada caixa de correio no qual eles estão localizados ou como mensagens individuais se você selecionar a opção de baixar itens do Exchange como mensagens. Itens do SharePoint não indexados serão exportados para uma pasta chamada Não rastreável.

  • Se a pesquisa da qual você está exportando resultados for uma pesquisa de locais de conteúdo específicos ou de todos os locais de conteúdo na sua organização, somente os itens não indexados dos locais de conteúdo que contêm itens correspondentes aos critérios de pesquisa serão exportados. Em outras palavras, se nenhum resultado de pesquisa for encontrado em uma caixa de correio ou em um site, os itens não indexados nessa caixa de correio ou nesse site não serão exportados. A razão para isso é que exportar itens não indexados de muitos locais na organização pode aumentar a probabilidade de erros de exportação e o tempo necessário para exportar e baixar os resultados da pesquisa.

    Para exportar itens não indexados de todos os locais de conteúdo para uma pesquisa, configurar a pesquisa para retornar todos os itens (removendo palavras-chave de consulta de pesquisa) e, em seguida, exportar somente os itens não indexados quando você exporta os resultados da pesquisa (clicando em somente os itens que possuem um não reconhecida formato, são criptografados ou não foram indexados por outros motivos em incluir estes itens da pesquisa ).

  • Se você optar por incluir todos os itens da caixa de correio nos resultados da pesquisa, ou se uma consulta de pesquisa não especifica nenhuma palavra-chave ou apenas especifica um intervalo de datas, itens não indexados não podem ser copiados para o arquivo PST que contém os itens não indexados. Isto ocorre porque todos os itens, incluindo todos os itens não indexados, serão automaticamente incluídos nos resultados da pesquisa regular.

  • Itens não indexados não estão disponíveis para ser visualizados. Você precisa exportar os resultados da pesquisa para exibir itens não indexados retornados pela pesquisa.

Retornar ao início

Itens não indexados excluídos dos resultados da pesquisa

Se um item é não indexado, mas não atende aos critérios de consulta de pesquisa, ele não será incluído como um item não indexado nos resultados da pesquisa. Em outras palavras, o item é excluído nos resultados da pesquisa. Por exemplo, digamos que você executa uma pesquisa e não inclui quaisquer palavras-chave ou propriedades porque você deseja incluir todo o conteúdo. Mas você inclui uma condição de intervalo de data para a consulta. Se um item não indexado sair desse intervalo de datas, ele não será incluído como um item não indexado. Intervalos de datas são uma maneira eficaz de excluir itens não indexados em seus resultados de pesquisa.

De forma semelhante, se você optar por incluir itens não indexados quando você exporta os resultados de uma pesquisa, itens não indexados que foram excluídos nos resultados da pesquisa não serão exportados.

Uma exceção a essa regra é quando você criar uma isenção baseado em consulta que está associada a um caso de descoberta eletrônica. Se você criar uma isenção baseado em consulta, tudo não indexados itens são colocados em espera. Isso inclui itens não indexados que não correspondem aos critérios de consulta de pesquisa e não indexados que talvez estejam fora uma condição de intervalo de data. Para obter mais informações sobre a criação baseada em consulta retenções, consulte gerenciar casos de descoberta eletrônica no Centro de conformidade de segurança do Office 365.

Limites de indexação para mensagens na pesquisa de conteúdo

A tabela a seguir descreve os limites de indexação que podem resultar em uma mensagem de email que está sendo retornada como um item não indexado ou um item parcialmente indexado em uma pesquisa de conteúdo no Office 365.

Para obter uma lista de indexação limites de documentos do SharePoint , consulte limites de pesquisa do SharePoint Online.

Limite de indexação

Valor máximo

Descrição

Tamanho máximo de anexo (excluindo arquivos do Excel)

150 MB

O tamanho máximo de um anexo de email que será analisado para indexação. Os anexos que excedem esse limite não são analisados para indexação e a mensagem com o anexo é marcada como não indexada.

Observação : Análise é o processo pelo qual o serviço de indexação extrai texto do anexo, remove caracteres desnecessários, como pontuação e espaços, e divide o texto em palavras (em um processo chamado geração de tokens) que serão armazenadas no índice.

Tamanho máximo de arquivos do Excel

4 MB

O tamanho máximo de um arquivo do Excel localizado em um site ou anexado a uma mensagem de email que será analisado para indexação. Os arquivos do Excel que excedem esse limite não são analisados e o arquivo ou a mensagem com o anexo de arquivo é marcado como não indexado.

Número máximo de anexos

250

O número máximo de arquivos anexados a uma mensagem de email que serão analisados para indexação. Quando a mensagem tem mais de 250 anexos, os primeiros 250 são analisados e indexados e a mensagem é marcada como parcialmente indexada, porque inclui anexos adicionais que não foram analisados.

Profundidade máxima dos anexos

30

O número máximo de anexos aninhados que são analisados. Por exemplo, quando uma mensagem de email tem outra mensagem anexada a ela e a mensagem anexada tem um documento do Word anexado, o documento e a mensagem anexada são indexados. Esse comportamento continuará para até 30 anexos aninhados.

Número máximo de imagens anexadas

0

Uma imagem anexada a uma mensagem de email é ignorada pelo analisador e não é indexada.

Tempo máximo gasto durante a análise de um item

30 segundos

30 segundos é o tempo máximo gasto durante a análise de um item para indexação. Quando o tempo de análise é superior a 30 segundos, o item é marcado como parcialmente indexado.

Saída máxima do analisador

2 milhões de caracteres

A quantidade máxima de saída de texto indexado pelo analisador. Por exemplo, se o analisador extrair oito milhões de caracteres de um documento, apenas os primeiros dois milhões serão indexados.

Máximo de tokens de anotação

Dois milhões

Quando uma mensagem de email é indexada, cada palavra é anotada com instruções de processamento diferentes que especificam como essa palavra deve ser indexada. Cada conjunto de instruções de processamento é chamado de token de anotação. Para manter a qualidade do serviço no Office 365, há um limite de dois milhões de tokens de anotação para uma mensagem de email.

Tamanho máximo do corpo no índice

67 milhões de caracteres

O número total de caracteres no corpo de uma mensagem de email e todos os seus anexos. Quando uma mensagem de email é indexada, todo o texto no corpo da mensagem e em todos os anexos é concatenado em uma única cadeia de caracteres. O tamanho máximo desta cadeia de caracteres indexada é de 67 milhões de caracteres.

Máximo de tokens exclusivos no corpo

Um milhão

Como explicado anteriormente, os tokens são o resultado da extração de texto do conteúdo, da remoção da pontuação e dos espaços, e da divisão em palavras (chamadas tokens) que são armazenadas no índice. Por exemplo, a frase "cat, mouse, bird, dog, dog" contém cinco tokens. Mas somente quatro desse tokens são exclusivos. Há um limite de um milhão de tokens exclusivos por mensagem de email, o que ajuda a impedir que o índice fique muito grande com tokens aleatórios.

Retornar ao início

Mais informações sobre itens não indexados

  • Como mencionado anteriormente, como propriedades do documento e seus metadados estão indexados, uma pesquisa de palavra-chave pode retornar resultados se essa palavra aparecer nos metadados indexados. No entanto, essa mesma pesquisa de palavra-chave pode não retornar o mesmo item se a palavra-chave aparece apenas no conteúdo de um item com um tipo de arquivo sem suporte. Nesse caso, o item poderia ser retornado como um item não indexado.

  • Se um item não indexado está incluído nos resultados da pesquisa porque atende aos critérios de consulta de pesquisa (e não foi excluído), ele não será incluído como um item não indexado nas estatísticas da pesquisa estimada. Além disso, ele não será incluído com itens não indexados quando você exporta os resultados da pesquisa.

  • Embora um tipo de arquivo tem suporte para indexação e é indexado, pode haver erros de indexação ou pesquisa que causarão um arquivo a ser retornado como um item não indexado. Por exemplo, pesquisar um arquivo muito grande do Excel pode ser parcialmente bem-sucedida (porque o primeiro MB 4 são indexados), mas depois falhará porque o limite de tamanho de arquivo é excedido. Nesse caso, é possível que o mesmo arquivo é retornado com os resultados de pesquisa e como um item não indexado.

  • Arquivos anexados criptografados com tecnologias da Microsoft são indexados e podem ser pesquisados. Os arquivos criptografados com tecnologias que não sejam da Microsoft não são indexados.

  • Mensagens de email criptografadas com S/MIME não são indexadas. Isto inclui mensagens criptografadas com ou sem anexos de arquivo.

  • As mensagens protegidas usando o Gerenciamento de Direitos de Informação (IRM) são indexadas e são incluídas nos resultados da pesquisa se corresponderem aos parâmetros de pesquisa.

Retornar ao início

Observação : Aviso de Isenção de Tradução Automática: Este artigo foi traduzido por computador, sem intervenção humana. A Microsoft oferece essas traduções automáticas para ajudar as pessoas que não falam inglês a aproveitar os textos escritos sobre produtos, serviços e tecnologias da Microsoft. Como este artigo foi traduzido automaticamente, é possível que contenha erros de vocabulário, sintaxe ou gramática.

Expanda suas habilidades
Explore o treinamento
Obtenha novos recursos primeiro
Ingressar no Office Insider

Essas informações foram úteis?

Obrigado por seus comentários!

Agradecemos pelos seus comentários! Parece que pode ser útil conectar você a um de nossos agentes de suporte do Office.

×