Неиндексированных элементов в поиск содержимого в Office 365

Важно :  Данная статья переведена с помощью машинного перевода, см. Отказ от ответственности. Используйте английский вариант этой статьи, который находится здесь, в качестве справочного материала.

Поиск контента при запуске из Центр безопасности и соответствия требованиям Office 365 автоматически включает в себя неиндексированных элементов в результатах поиска оценки при выполнении поиска. Неиндексированных элементы, Exchange элементов почтовых ящиков и документы на сайтах SharePoint, которые для какой-либо причине не были индексирование для поиска. В Exchange неиндексированных элемент обычно содержит файл — тип файла, который нельзя индексировать —, вложенный в сообщение электронной почты. Ниже приведены причины, почему не удается индексировать для поиска элементов и возвращаются в виде неиндексированных элементов при выполнении поиска:

  • Тип файла не поддерживается, или для него отключено индексирование.

  • Тип файла поддерживает индексирование, но произошла ошибка индексирования определенного файла.

  • В сообщение вложено слишком много файлов.

  • Размер файла, вложенного в сообщение, превышает допустимый.

  • Файл зашифрован с помощью технологий, разработанных не корпорацией Майкрософт.

  • Файл защищен паролем.

Для судебных разбирательств организации может потребоваться просмотреть неиндексируемые элементы. Вы также можете указать, следует ли включать неиндексированные элементы в результаты поиска, экспортируемые на локальный компьютер, или использовать их при подготовке данных к дальнейшему анализу с помощью Office 365 Advanced eDiscovery.

Содержание

Типы файлов, не индексирование для поиска

Сообщения и документы с типами файлов неиндексированных могут быть возвращены в результатах поиска

Неиндексированных элементов, включенных в результатах поиска

Неиндексированных элементы, исключенные из результатов поиска

Ограничения для сообщений в поиск контента индексирования

Дополнительные сведения о неиндексированных элементов

Типы файлов, которые не поддерживают индексирование

Файлы определенных типов, например файлы точечных рисунков или MP3-файлы, содержат контент, не подходящий для индексирования. В результате серверы индексирования поиска в Exchange и SharePoint не выполняют полнотекстовое индексирование файлов этих типов. Файлы таких типов считаются неподдерживаемыми. Кроме того, бывают типы файлов, для которых полнотекстовое индексирование отключено (по умолчанию или администратором). При поиске контента файлы неподдерживаемых и отключенных типов считаются неиндексированными элементами. Как уже упоминалось, неиндексированные элементы можно включать в набор результатов при поиске, экспорте результатов поиска на локальный компьютер или их подготовке для Advanced eDiscovery.

Список поддерживаемых и отключенных форматов файлов см. в следующих статьях:

  • ExchangeФорматы файлов, индексируемое поиска Exchangehttps://go.microsoft.com/fwlink/p/?LinkID=386618    

  • ExchangeGet-SearchDocumentFormat    

  • SharePointРасширения имен файлов для обхода и анализируемые типы файлов в SharePoint по умолчанию https://go.microsoft.com/fwlink/p/?LinkID=404033    

К началу

Возврат сообщений с файлами и документов и неиндексируемых типов в результатах поиска

Не все сообщения электронной почты с неиндексируемыми вложениями и не все неиндексированные документы SharePoint автоматически возвращаются как неиндексированные элементы. Это вызвано тем, что другие свойства сообщений или документов, например свойство Subject в сообщениях электронной почты или свойства Title и Author для документов, индексируются и доступны для поиска. Например, при поиске по ключевому слову "финансы" будут возвращены элементы, в которые вложены неиндексируемые файлы, если это ключевое слово содержится в теме сообщения, имени файла или заголовке документа. Но если ключевое слово встречается только в основном тексте, то файлы, сообщения и документы возвращаются как неиндексированные элементы.

Аналогичным образом сообщения с неиндексируемыми вложенными файлами и документы неиндексируемых типов включаются в результаты поиска, если другие свойства сообщения или документа, которые поддерживают индексирование и поиск, соответствуют условиям. К свойствам сообщений, индексируемым для поиска, относятся даты отправки и получения, отправитель и получатель, имя файла вложения и текст сообщения. К свойствам документов, индексируемым для поиска, относятся даты создания и изменения. Поэтому даже если вложение в сообщении не индексируется для поиска, сообщение будет включено в обычные результаты поиска, если значения других свойств сообщения или документа соответствуют условиям.

Список свойств электронной почты и документов, которые можно искать через Центр безопасности и соответствия требованиям, см. в статье Запросы ключевых слов и условия поиска контента.

К началу

Неиндексированные элементы, включаемые в результаты поиска

Ваша организация может потребоваться определение и выполнить дополнительный анализ неиндексированных элементов для определения они являются, они содержат и ли относящиеся к определенной расследования. Как описано выше неиндексированных элементов в содержимого ячейки, которые проверяются автоматически входят в состав оценки результатов. У вас есть возможность включить эти элементы неиндексированных при экспорте результатов поиска или Подготовка Advanced eDiscovery результатов поиска. Чтобы включить неиндексированных элементы при подготовке Advanced eDiscovery или экспорт результатов поиска, выберите один из вариантов, чтобы включить элементы, которые имеют неизвестный формат, зашифрованы или не были проиндексированы по другим причинам.

Помните следующее:

  • При выполнении поиска содержимого в Статистика поиска в области сведений отображаются общее число и размер неиндексированных элементов (возвращаемые запросом поиска).

  • При экспорте результатов поиска, включающих неиндексированные элементы Exchange, эти элементы экспортируются в отдельные PST-файлы для каждого почтового ящика, в котором они присутствуют, или как отдельные сообщения, если выбрано скачивание элементов Exchange в виде сообщений. Неиндексированные элементы SharePoint экспортируются в папку Uncrawlable.

  • Если вы экспортируете результаты поиска из всех или из каких-либо конкретных расположений контента в вашей организации, экспортируются только неиндексированные элементы из расположений контента, которые подходят условиям поиска. Другими словами, если отсутствуют результаты поиска в почтовом ящике или на сайте, из этих расположений не будут экспортированы никакие неиндексированные элементы. Это связано с тем, что экспорт неиндексированных элементов из множества расположений в организации может повысить вероятность ошибок экспорта и увеличить время, необходимое на экспорт и скачивание результатов поиска.

    Чтобы экспортировать неиндексированных элементов из всех расположений содержимого для поиска, Настройка поиска для возвращения все элементы (по удаление ключевых слов из запроса поиска), а затем экспортируйте только неиндексированных элементов при экспорте результатов поиска (нажав только элементы, которые содержат Неизвестный формат, зашифрованные или не были проиндексированы по другим причинам в разделе Включить эти элементы из поиска ).

  • Если вы решите включить все элементы почтовых ящиков в результаты поиска или если в поисковом запросе не указаны ключевые слова либо задан только диапазон дат, то неиндексированные элементы могут не скопироваться в соответствующий PST-файл. Это связано с тем, что все неиндексированные элементы будут автоматически включены в обычные результаты поиска.

  • Неиндексированные элементы недоступны для предварительного просмотра. Чтобы просматривать неиндексированные элементы, необходимо экспортировать результаты поиска.

К началу

Неиндексированные элементы, исключаемые из результатов поиска

Если элемент не был индексирован, но не соответствует условиям поискового запроса, то он не будет включен в результаты поиска как неиндексированный элемент. Другими словами, элемент исключается из результатов поиска. Допустим, вы выполняете поиск, не указывая никаких ключевых слов и свойств, чтобы просмотреть весь контент, но задаете в качестве условия диапазон дат. Если неиндексированный элемент выходит за пределы этого диапазона, он не будет включен в результаты. Диапазоны дат — эффективный способ исключить неиндексированные элементы из результатов поиска.

Аналогичным образом, если включить неиндексированные элементы при экспорте результатов поиска, то неиндексированные элементы, исключенные из результатов поиска, не будут экспортированы.

Это правило единственным исключением является при создании удержания на основе запроса, связанный с обращение eDiscovery. При создании удержания на основе запроса, все неиндексированных элементов помещаются на удержание. Эта группа включает неиндексированных элементы, которые не соответствуют условиям поиска запрос и неиндексированных элементы, которые могут выходящих условие по диапазону дат. Для содержит дополнительные сведения о создании на основе запроса, читайте в статье Управление досье eDiscovery в безопасности Office 365 и поместить в центре соответствия.

Ограничения для сообщений в поиск контента индексирования

В следующей таблице описаны ограничения индексирования, которые могут привести к в сообщении электронной почты возвращаемое как неиндексированных элемента или частично индексированные элемента в поиск содержимого в Office 365.

Список индексирования ограничения для документов SharePoint читайте в статье ограничения поиска в SharePoint Online.

Ограничение для индексирования

Максимальное значение

Описание

Максимальный размер вложения (за исключением файлов Excel)

150 МБ

Максимальный размер вложения электронной почты, которое анализируется для индексации. Любое вложение, которое превышает это ограничение, не будет анализироваться для индексации, и сообщение со вложением будет отмечено как неиндексированное.

Примечание : Анализ — это процесс, при котором служба индексации извлекает текст из вложения, удаляет ненужные символы, такие как пунктуация и пробелы, а затем делит текст на слова (в ходе процедуры под названием токенизация), которые сохраняются в индексе.

Максимальный размер файлов Excel

4 МБ

Максимальный размер файла Excel, размещенного на сайте или вложенного в сообщение электронной почты, который анализируется для индексации. Любое файл Excel, которое превышает это ограничение, не будет анализироваться, и файл или сообщение электронной почты со вложением будет отмечено как неиндексированное.

Максимальное количество вложений

250

Максимальное количество файлов, вложенных в сообщение электронной почты, которые анализируются для индексации. Если в сообщении более 250 вложений, первые 250 вложений анализируются и индексируются, а сообщение отмечается как частично индексированное, поскольку в нем есть дополнительные вложения, которые не прошли анализ.

Максимальная глубина вложений

30

Максимальное количество вставленных вложений, которые анализируются. Например, если в сообщение электронной почты вложено другое сообщение, и во вложенном сообщении есть вложенный документ Word, индексацию пройдут документ Word и вложенное сообщение. Это поведение продолжится до 30 вставленных вложений.

Максимальное количество вложенных изображений

0

Изображение, вложенное в сообщение электронной почты, пропускается средством анализа и не индексируется.

Максимальное количество времени, затрачиваемое на анализ элемента

30 секунд

Индексация при анализе элемента длится максимум 30 секунд. Если время анализа превышает 30 секунд, элемент отмечается как частично индексированный.

Максимальный вывод средства анализа

2 миллиона символов

Максимальное количество вывода текста из средства анализа, который индексируется. Например, если средство анализа извлекло 8 миллионов символов из документа, индексируются только первые 2 миллиона символов.

Максимальное количество маркеров заметок

2 миллиона

При индексации сообщения электронной почты каждое слово помечается различными командами обработки, которые определяют способ его индексации. Каждый набор команд обработки называется маркером заметки. С целью обеспечения высокого качества обслуживания в Office 365 количество маркеров заметок для одного сообщения электронной почты не должно превышать 2 миллиона.

Максимальный размер текста в индексе

67 миллионов символов

Общее количество символов в тексте сообщения электронной почты и всех его вложений. При индексации сообщения электронной почты весь его текст и текст всех вложений объединяются в одну строку. Максимальный размер такой индексируемой строки составляет 67 миллионов символов.

Максимальное количество уникальных маркеров в тексте

1 миллион

Как было сказано ранее, маркеры являются результатом извлечения текста из содержимого, удаления знаков препинания и пробелов и последующего разделения его на слова (маркеры), сохраняемые в индексе. Например, выражение "cat, mouse, bird, dog, dog" содержит 5 маркеров. Но только 4 из них являются уникальными. Количество уникальных маркеров для каждого сообщения электронной почты не должно превышать 1 миллион, чтобы индекс имел не слишком большой размер из-за случайных маркеров.

К началу

Дополнительные сведения о неиндексированных элементах

  • Как описанным так как индексированные свойства документа и сообщений и их метаданные, ключевое слово поиска может возвращать результаты при появлении этого ключевого слова в индексированных метаданных. Тем не менее этой же ключевое слово поиска не могут быть возвращены того же элемента, если ключевое слово отображается только в содержимом элемента с неподдерживаемый тип файла. В этом случае элемент возвращаются в виде неиндексированных элемента.

  • Если неиндексированный элемент включен в результаты поиска, потому что он соответствует условиям поиска (и не был исключен), то он не будет включен в предполагаемую статистику поиска как неиндексированный элемент. Кроме того, он не будет экспортироваться вместе с неиндексированными элементами.

  • Несмотря на то, что тип файла поддерживается для индексирования и индексируется, может быть индексирования или поиска ошибок, которые будет инициировать файла должны быть возвращены в неиндексированных элемент. Например, поиск очень большой файл Excel может быть частично успешно (поскольку проиндексированы первых 4 МБ), а затем не удастся превышен максимальный размер файла. В этом случае это возможно, что в результатах поиска и как неиндексированных элемент возвращается одного файла.

  • Вложенные файлы, зашифрованные с помощью технологий Майкрософт, индексируются и включаются в поиск. Файлы, зашифрованные с помощью сторонних технологий, возвращаются как неиндексированные.

  • Сообщения электронной почты, зашифрованные с помощью S/MIME, не индексируются. Это касается зашифрованных сообщений с вложенными файлами и без них.

  • Сообщения, защищенные службой управления правами на доступ к данным (IRM), индексируются и включаются в результаты поиска, если они соответствуют поисковому запросу.

К началу

Примечание : Отказ от ответственности относительно машинного перевода. Данная статья была переведена с помощью компьютерной системы без участия человека. Microsoft предлагает эти машинные переводы, чтобы помочь пользователям, которые не знают английского языка, ознакомиться с материалами о продуктах, услугах и технологиях Microsoft. Поскольку статья была переведена с использованием машинного перевода, она может содержать лексические,синтаксические и грамматические ошибки.

Совершенствование навыков
Перейти к обучению
Первоочередный доступ к новым возможностям
Присоединиться к программе предварительной оценки Office

Были ли сведения полезными?

Спасибо за ваш отзыв!

Благодарим за отзыв! Возможно, будет полезно связать вас с одним из наших специалистов службы поддержки Office.

×