Investigating partially indexed items in Office 365 eDiscovery

Примечание:  Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы. Для удобства также приводим ссылку на оригинал (на английском языке) .

Поиск контента при запуске из Центр безопасности и соответствия требованиям Office 365 автоматически включает в себя частично индексированные элементы в результатах поиска оценки при выполнении поиска. Частично индексированные элементы являются Exchange элементов почтовых ящиков и документы на сайтах SharePoint и OneDrive для бизнеса, которые для какой-либо причине не были полностью индексирование для поиска. Большинство сообщений электронной почты и документы на сайте успешно проиндексированы, так как они входят в индексирования ограничения для Office 365. Однако некоторые элементы может превысить эти ограничения индексирования и будет частично индексировать. Ниже приведены другие причины, почему не удается индексировать для поиска элементов и возвращаются в виде частично индексированные элементы при выполнении поиска содержимого.

  • Сообщения электронной почты имеют вложенного файла тип файла, который нельзя индексировать; в большинстве случаев файл имеет Неизвестный или неподдерживаемый для индексирования

  • Сообщения имеют вложенного файла без допустимой обработчик, например файлов изображений; в данном случае наиболее распространенных элементов частично индексированные электронной почты

  • Слишком много файлов, вложенных в сообщения электронной почты

  • Слишком большой файл, вложенный в сообщение электронной почты

  • Тип файла поддерживается для индексирования, но индексирования ошибка для конкретного файла

Несмотря на то, что это зависит Большинство организаций клиенты Office 365 имеют меньше 1% содержимого по громкость и менее 12% содержимое по размеру, который частично проиндексирован. Причина разницу между громкости сравнении размер является то, что большие файлы выше вероятность того, содержащий данные, которые нельзя индексировать полностью.

Почему число частично индексированных элементов изменить для поиска.

После выполнения поиска содержимого в Центр безопасности и соответствия требованиям Office 365 общее число и размер частично индексированные элементы в расположениях, которые были поиск будут включены в Статистика результатов поиска, которые отображаются в подробную статистику для поиска. Обратите внимание, что они называются неиндексированных элементов Статистика поиска. Вот несколько моментов, которые влияют на количество частично индексированные элементы, которые возвращаются в результатах поиска.

  • Если элемент частично индексированных и соответствует поисковый запрос, она включается в count (и размер) элементы результатов поиска и частично индексированные элементы. Однако при экспорте результатов поиска этой же элемент учитываются только с набором результатов поиска; не входит в частично индексированные элемент.

  • Если задать диапазон дат для запроса поиска (в том числе его в запрос ключевого слова) или используя условие, любой частично индексированных элементов, которые не соответствуют диапазон дат не включен в подсчет частично индексированные элементы. Только частично индексированные элементы, которые входят в определенный диапазон дат включаются в подсчет частично индексированные элементы.

Примечание: Частично индексированные элементы, расположенные в SharePoint и OneDrive сайты , не включенные в оценке частично индексированных элементов, отображаемых в подробную статистику для поиска. Тем не менее можно экспортировать частично индексированные элементы при экспорте результатов поиска содержимого. Например если только поиск сайты в поиск контента расчетное число частично индексированные элементы будет равен нулю.

Вычисление отношение частично индексированные элементы в вашей организации

Чтобы разобраться в вашей организации риск частично индексированные элементы, можно выполнить поиск все содержимое все почтовые ящики (с ключевое слово пустой запрос). В следующем примере существует 56,208 (4,830 МБ) полностью индексированные элементы и 470 (316 МБ) частично индексированных элементов.

Example of search statistics showing partially indexed items

Вы можете определить процент частично индексированные элементы с помощью следующих вычислений.

Чтобы выполнить расчет отношение частично индексированные элементы в вашей организации:

(Total number of partially indexed items/Total number of items) x 100
(470/56,208) x 100 = 0.84%

С помощью результатов поиска из предыдущего примера. частично проиндексированы 84% всех элементов почтовых ящиков.

Вычисление процента от размера частично индексированных элементов в своей организации:

(Size of all partially indexed items/Size of all items) x 100
(316 MB/4830 MB) x 100 = 6.54%

Поэтому в предыдущем примере 6,54. % от общего объема элементов почтовых ящиков из частично индексированные элементы. В соответствии с ранее указано, большинство организаций Office 365 клиентов по громкость и менее 12% контента не менее 1% содержимое по размеру, который частично проиндексирован.

Работа с частично индексированных элементов

В случаях, когда нужно проверить частично элементов, чтобы проверить, что они не содержат необходимую информацию, вы можете экспортировать отчет поиск контента , который содержит сведения о частично индексированные элементы. При экспорте отчета поиск контента, обязательно выберите один из вариантов экспорта, включая частично индексированные элементы.

Choose the second or third option to export partially indexed items

При экспорте результатов поиска контента или поиск контента, используя один из следующих параметров экспорта включает отчета с именем неиндексированных Items.csv. Этот отчет содержит большую часть ту же информацию в файле ResultsLog.csv; Тем не менее, файл неиндексированных Items.csv также содержит два поля, связанные с частично индексированные элементы: Ошибка теги и Свойства ошибки. Эти поля содержат сведения об ошибке для каждого элемента частично индексированные индексирования. Эти два поля с использованием сведений помогут вам определить, независимо от наличия индексирования ошибка для определенного влияет расследования. В этом случае можно выполнять почтовой поиска содержимого и извлечения и экспорт определенные сообщения и SharePoint или OneDrive документов, чтобы вы их можно проверить, чтобы определить, если они важны для расследования. Для получения пошаговых инструкций см в CSV-файл для целевых поиск содержимого в Office 365.

Примечание: Файл неиндексированных Items.csv также содержит полей с именами Типа ошибок и Сообщения об ошибке. Здесь представлены устаревшие поля, которые содержат информацию, которая похожа на сведения в полях Ошибки теги и Свойства ошибки , но с более подробными сведениями. Эти устаревшие поля можно не обращать внимания.

Ошибки, связанные с частично индексированные элементы

Ошибка теги состоят из двух частей информации, ошибка и тип файла. Например в этой ошибки и типфайла пары:

 parseroutputsize_xls

parseroutputsize — сообщение об ошибке, а xls — тип файла, возникла ошибка. В случае были тип файла не распознан или был тип файла не относится к ошибке появляется следующее значение noformat вместо тип файла.

Ниже приведен список индексирования ошибок и описание возможных причин ошибки.

Ошибка тега

Описание

attachmentcount

Сообщение электронной почты было слишком много вложений, а некоторые из этих вложений не были обработки.

attachmentdepth

Анализатор содержимого документа и получатель найти слишком много уровней вложения вложено в другие вложения. Некоторые из этих вложений не обрабатывались.

attachmentrms

Вложение не удалось декодирования, так как она была защищенных.

attachmentsize

Файл, вложенный в сообщение электронной почты слишком велик и не удалось обработать.

indexingtruncated

При написании сообщения электронной почты обработанных к индексу, одним из индексируемых свойств слишком велик и усечены. В поле свойства ошибки перечислены усеченные свойства.

invalidunicode

Сообщение электронной почты содержится текст, который не удалось обработать как допустимые Юникода. Индексирование для этого элемента может быть неполным.

parserencrypted

Содержимое вложения или сообщение электронной почты шифруется и Office 365 не удалось декодировать содержимое.

parsererror

Во время анализе Неизвестная ошибка. Это обычно происходит при программное обеспечение ошибка или сбой службы.

parserinputsize

Вложения слишком велико для средство синтаксического анализа для обработки и анализа, вложение не произошла или не был завершен.

parsermalformed

Вложение имеет неправильный формат и не удалось обрабатываться средство синтаксического анализа. Этот результат из старый файл может форматов, файлы, созданные несовместимые программное обеспечение или пытаться выдать что-то, отличного от взимается вирусов.

parseroutputsize

Вывод с анализом вложения слишком велик и пришлось быть усечены.

parserunknowntype

Вложение имеет тип файла, Office 365 не удается обнаружить.

parserunsupportedtype

Вложение имеет тип файла Office 365 может обнаружить, что при анализе этот тип файла не поддерживается.

propertytoobig

Значение свойства электронной почты в Exchange хранилище слишком велик извлекаемых и не удалось обработать сообщение. Это обычно происходит только к свойству тело сообщения электронной почты.

retrieverrms

Не удалось декодировать сообщений, защищенных содержимого об изменениях.

wordbreakertruncated

Слишком много слов во время индексирования обнаружены в документе. При достигнут предел остановки обработки свойства, а свойство усекается.

Ошибка поля описывают поля, которые распространяются обработки ошибок, указанным в поле теги ошибки. Если вы выполняете поиск свойства, например subject или participants, ошибок в тело сообщения не повлиять на результаты поиска. Это может быть полезен при определении точно какие частично индексированные элементы, при необходимости для дальнейшего изучения.

С помощью сценариев PowerShell для определения риск элементов частично индексированные электронной почты организации

Ниже показано, как выполнить сценарий PowerShell, который выполняет поиск всех элементов в все почтовые ящики Exchange создает отчет об организации отношение элементов частично индексированные электронной почты (по количеству и по размеру) и отображает число элементов (и их тип файла) для каждой ошибки индексирования, которое должно состояться. Использование тегов описания ошибок в предыдущем разделе для определения индексирования ошибки.

  1. Сохранить файл сценария Windows PowerShell следующий текст с помощью суффикса имени файла .ps1; Например, PartiallyIndexedItems.ps1.

    write-host "**************************************************"
    write-host "     Office 365 Security & Compliance Center      " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "   eDiscovery Partially Indexed Item Statistics   " -foregroundColor yellow -backgroundcolor darkgreen
    write-host "**************************************************"
    " " 
    
    # Create a search with Error Tags Refinders enabled
    Remove-ComplianceSearch "RefinerTest" -Confirm:$false -ErrorAction 'SilentlyContinue'
    New-ComplianceSearch -Name "RefinerTest" -ContentMatchQuery "size>0" -RefinerNames ErrorTags -ExchangeLocation ALL
    Start-ComplianceSearch "RefinerTest"
    # Loop while search is in progress
    do{
        Write-host "Waiting for search to complete..."
        Start-Sleep -s 5
        $complianceSearch = Get-ComplianceSearch "RefinerTest"
    }while ($complianceSearch.Status -ne 'Completed')
    
    $refiners = $complianceSearch.Refiners | ConvertFrom-Json
    $errorTagProperties = $refiners.Entries | Get-Member -MemberType NoteProperty
    
    $partiallyIndexedRatio = $complianceSearch.UnindexedItems / $complianceSearch.Items
    $partiallyIndexedSizeRatio = $complianceSearch.UnindexedSize / $complianceSearch.Size
    
    " "
    "===== Partially indexed items ====="
    "         Total          Ratio"
    "Count    {0:N0}{1:P2}" -f $complianceSearch.Items.ToString("N0").PadRight(15, " "), $partiallyIndexedRatio
    "Size(GB) {0:N2}{1:P2}" -f ($complianceSearch.Size / 1GB).ToString("N2").PadRight(15, " "), $partiallyIndexedSizeRatio
    
    " "
    Write-Host ===== Reasons for partially indexed items =====
    foreach($errorTagProperty in $errorTagProperties)
    {
        $name = $refiners.Entries.($errorTagProperty.Name).Name
        $count = $refiners.Entries.($errorTagProperty.Name).TotalCount
    
        $frag = $name.Split("{_}")
    
        $errorTag = $frag[0]
        $fileType = $frag[1]
    
        if ($errorTag -ne $lastErrorTag)
        {
            $errorTag
        }
        "    " + $fileType + " => " + $count
        $lastErrorTag = $errorTag
    }
    
  2. Подключение к безопасности Office 365 и центр соответствия PowerShell.

  3. В Центр безопасности и соответствия требованиям PowerShell перейдите в папку, в которой вы сохранили скрипт в действии 1, а затем запустите сценарии; Например:

    .\PartiallyIndexedItems.ps1

Вот пример fo выходные данные, возвращаемые сценария.

Example of output from script that generates a report on your organization's exposure to partially indexed email items

Примите к сведению следующее.

  1. Общее число и размер элементов электронной почты и отношение вашей организации элементов частично индексированные электронной почты (по количеству и размер)

  2. В списке ошибки теги и соответствующие типы файлов, для которых возникла ошибка.

К началу

См. также:

Частично индексированные элементы в поиск содержимого в Office 365

Совершенствование навыков работы с Office
Перейти к обучению
Первоочередный доступ к новым возможностям
Присоединиться к программе предварительной оценки Office

Были ли сведения полезными?

Спасибо за ваш отзыв!

Благодарим за отзыв! Возможно, будет полезно связать вас с одним из наших специалистов службы поддержки Office.

×