Éléments non indexés dans recherche de contenu dans Office 365

Important :  Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Une recherche de contenu que vous exécutez automatiquement à partir de la Centre de sécurité et conformité Office 365 inclut les éléments non indexés dans les résultats de recherche estimée lorsque vous exécutez une recherche. Éléments non indexés sont les éléments de boîte aux lettres Exchange et des documents sur des sites SharePoint qui n’ont pas été indexés pour la recherche pour une raison quelconque. Dans Exchange, un élément non indexé contient généralement un fichier, d’un type de fichier qui ne peuvent pas être indexé, qui est joint à un message électronique. Voici quelques raisons pour lesquelles les éléments ne peuvent pas être indexées pour la recherche et sont retournés sous forme d’éléments non indexés lorsque vous exécutez une recherche :

  • Le type de fichier n’est pas pris en charge ou est désactivé pour l’indexation.

  • Le type de fichier est pris en charge pour l’indexation, mais une erreur d’indexation s’est produite pour un fichier spécifique.

  • Le nombre de fichiers joints à un message électronique est trop important.

  • Un fichier joint à un message électronique est trop volumineux.

  • Un fichier est chiffré avec des technologies autres que Microsoft.

  • Un fichier est protégé par mot de passe.

Pour les enquêtes légales, votre organisation peut être amenée à devoir vérifier les éléments non indexés. Vous pouvez également indiquer si les éléments non indexés doivent être inclus lorsque vous exportez des résultats de recherche sur un ordinateur local ou lorsque vous préparez les résultats pour une analyse ultérieure avec Office 365 Advanced eDiscovery.

Contenu

Types de fichiers non indexés pour la recherche

Messages et des documents avec les types de fichiers non indexés peuvent être renvoyées dans les résultats de recherche

Éléments non indexés inclus dans les résultats de recherche

Éléments non indexés exclus les résultats de recherche

Limites pour les messages de recherche de contenu de l’indexation

Plus d’informations sur les éléments non indexés

Types de fichier non indexés pour la recherche

Certains types de fichiers, tels que Bitmap ou les fichiers MP3 ne contiennent pas le contenu pouvant être indexées. Par conséquent, les serveurs d’indexation de la recherche dans Exchange et SharePoint n’effectuez pas l’indexation de texte intégral sur ces types de fichiers. Ces types de fichiers sont considérées comme des types de fichiers non pris en charge. Il existe également des types de fichiers pour lesquels l’indexation en texte intégral a été désactivé, par défaut ou par un administrateur. Types de fichiers non pris en charge et désactivé sont considérées comme des éléments non indexés dans les recherches de contenu. Comme indiqué plus haut, éléments non indexés peuvent être incluses dans le jeu de résultats de recherche lorsque vous exécutez une recherche, exportez les résultats de recherche sur un ordinateur local ou préparez les résultats de recherche pour Advanced eDiscovery.

Pour obtenir une liste de formats de fichier pris en charge et désactivés, consultez les rubriques suivantes :

  • ExchangeFormats de fichiers indexés par Exchange Searchhttps://go.microsoft.com/fwlink/p/?LinkID=386618    

  • ExchangeGet-SearchDocumentFormat    

  • SharePointExtensions de nom de fichier analysées et types de fichiers dans SharePoint analysés par défaut https://go.microsoft.com/fwlink/p/?LinkID=404033    

Revenir au début

Les messages et les documents comportant des types de fichier non indexés peuvent être renvoyés dans les résultats de recherche

Tous les messages électroniques comportant une pièce jointe non indexée ou tous les documents SharePoint non indexés ne sont pas automatiquement renvoyés en tant qu’éléments non indexés. En effet, d’autres propriétés de document ou de message, telles que la propriété Subject dans les messages électroniques, et les propriétés Title ou Author pour les documents sont indexées et peuvent faire l’objet d’une recherche. Par exemple, une recherche par mot clé sur « financier » renverra des éléments comportant une pièce jointe non indexée si ce mot clé apparaît dans l’objet d’un message électronique, dans le nom du fichier ou dans le titre d’un document. Toutefois, si le mot clé apparaît uniquement dans le corps du fichier, le message ou le document sera renvoyé en tant qu’élément non indexé.

De même, les messages comportant des pièces jointes non indexées et des documents avec des types de fichier non indexés sont inclus dans les résultats de la recherche lorsque d’autres propriétés de document ou de message, qui sont indexées et qui peuvent faire l’objet d’une recherche, répondent aux critères de recherche. Les propriétés des messages qui sont indexées pour la recherche comprennent les dates d’envoi et de réception, l’expéditeur et le destinataire, le nom de fichier d’une pièce jointe et le texte dans le corps du message. Les propriétés de document indexées pour la recherche comprennent les dates de création et de modification. Ainsi, même si la pièce jointe d’un message est un élément non indexé, le message sera inclus dans les résultats de la recherche ordinaire si la valeur d’autres propriétés du document ou du message correspond aux critères de recherche.

Pour obtenir une liste des propriétés de document et de messagerie que vous pouvez rechercher à l’aide de la fonctionnalité de recherche dans le Centre de sécurité et conformité, voir Keyword queries and search conditions for Content Search.

Revenir au début

Éléments non indexés inclus dans les résultats de recherche

Votre organisation peut-être être nécessaire pour identifier et effectuer une analyse plus approfondie sur des éléments non indexés pour déterminer qu’il s’agit, ce qu’ils contiennent et qu’ils soient pertinents à une enquête spécifique. Comme expliqué précédemment, les éléments non indexés dans les emplacements de contenu sont recherchés sont automatiquement inclus dans les résultats de recherche estimée. Vous avez la possibilité d’inclure ces éléments non indexés lorsque vous exportez des résultats de recherche ou préparez les résultats de recherche pour Advanced eDiscovery. Pour inclure des éléments non indexés lorsque vous préparez en vue de Advanced eDiscovery ou l’exportation de résultats de recherche, sélectionnez une des options pour inclure les éléments qui ont un format non reconnu, qui sont chiffrés ou n’ont pas été indexées pour d’autres raisons.

Gardez les points suivants à l’esprit concernant les éléments non indexés :

  • Lorsque vous exécutez une recherche de contenu, le nombre total et la taille des éléments non indexés (renvoyées par la requête de recherche) sont affichent dans les statistiques de recherche dans le volet détails.

  • Lorsque vous exportez des résultats de recherche et incluez des éléments non indexés, les éléments Exchange non indexés sont exportés vers un fichier PST distinct pour chaque boîte aux lettres dans laquelle ils se trouvent ou en tant que messages individuels si vous sélectionnez l’option permettant de télécharger les éléments Exchange en tant que messages. Les éléments SharePoint non indexés sont exportés vers un dossier nommé Non analysable.

  • Si la recherche dont vous exportez les résultats portait sur des emplacements de contenu spécifiques ou sur tous les emplacements de contenu au sein de votre organisation, seuls les éléments non indexés au sein des emplacements incluant des éléments correspondant aux critères de recherche seront exportés. En d’autres termes, si la recherche ne renvoie aucun résultat pour une boîte aux lettres ou un site, les éléments non indexés dans cette boîte aux lettres ou ce site ne seront pas exportés. En effet, l’exportation d’éléments non indexés au sein de beaucoup d’emplacements différents dans l’organisation pourrait augmenter les risques d’erreurs d’exportation et allongerait le délai nécessaire à l’exportation et au téléchargement des résultats de recherche.

    Pour exporter des éléments non indexés à partir de tous les emplacements de contenu pour une recherche, configurer la recherche pour renvoyer tous les éléments (en supprimant les mots clés de la requête de recherche), puis exporter uniquement les éléments non indexés lorsque vous exportez les résultats de recherche (en cliquant sur uniquement les éléments ayant un non reconnu format, sont chiffrés ou n’ont pas été indexées pour d’autres raisons sous inclure ces éléments à partir de la recherche ).

  • Si vous choisissez d’inclure tous les éléments de boîtes aux lettres dans les résultats de la recherche ou si une requête de recherche n’indique aucun mot clé ou seulement une plage de dates, les éléments non indexés peuvent ne pas être copiés vers le fichier PST contenant les éléments non indexés. En effet, tous les éléments, y compris les éléments non indexables, seront automatiquement inclus dans les résultats de la recherche ordinaire.

  • Les éléments non indexés ne peuvent pas être affichés en aperçu. Vous devez exporter les résultats de recherche pour afficher les éléments non indexés renvoyés par la recherche.

Revenir au début

Éléments non indexés exclus des résultats de recherche

Si un élément non indexé ne répond pas aux critères de la requête de recherche, il ne sera pas inclus dans les résultats de recherche en tant qu’élément non indexé. En d’autres termes, l’élément est exclu des résultats de recherche. Par exemple, supposons que vous exécutez une recherche et que vous n’incluez aucun mot clé ou propriété parce que vous souhaitez inclure l’ensemble du contenu. Vous incluez toutefois une condition de plage de dates pour la requête. Si un élément non indexé est en dehors de cette plage de dates, il ne sera pas inclus en tant qu’élément non indexé. Les plages de dates sont un moyen efficace d’exclure des éléments non indexés de vos résultats de recherche.

De même, si vous choisissez d’inclure des éléments non indexés lorsque vous exportez les résultats d’une recherche, les éléments non indexés qui ont été exclus des résultats de la recherche ne seront pas exportés.

Une exception à cette règle est lorsque vous créez un blocage de requête associée à un cas eDiscovery. Si vous créez un blocage de requête, tous les non indexés éléments sont placés en attente. Cela inclut les éléments non indexés qui ne correspondent pas les critères de requête de recherche et des éléments non indexés qui peuvent se trouvent en dehors d’une condition de plage de dates. Pour plus d’informations sur la création de requête basée blocages, voir gérer des cas de découverte électronique dans le centre de conformité Office 365 sécurité.

Limites pour les messages de recherche de contenu de l’indexation

Le tableau suivant décrit les limites d’indexation qui peuvent survenir dans un message électronique retourné comme un élément non indexé ou un élément dans une recherche de contenu dans Office 365partiellement indexé.

Pour obtenir la liste de l’indexation de limites de documents SharePoint , voir limites de recherche pour SharePoint Online.

Limite d’indexation

Valeur maximale

Description

Taille maximale des pièces jointes (à l’exception des fichiers Excel)

150 Mo

La taille maximale d’une pièce jointe à un e-mail qui sera analysée pour l’indexation. Toute pièce jointe dont la taille est supérieure à cette limite ne sera pas être analysée pour l’indexation. Le message avec la pièce jointe sera marqué comme non indexé.

Remarque : L’analyse est le processus par lequel le service d’indexation extrait le texte de la pièce jointe, supprime les caractères superflus, tels que les signes de ponctuation et les espaces, puis divise le texte en mots (dans le cadre d’un processus dit de segmentation), qui sont ensuite stockés dans l’index.

Taille maximale des fichiers Excel

4 Mo

La taille maximale d’un fichier Excel situé sur un site ou joint à un e-mail qui sera analysé pour l’indexation. Tout fichier Excel dont la taille est supérieure à cette limite ne sera pas être analysé. Le fichier ou l’e-mail avec la pièce jointe sera marqué comme non indexé.

Nombre maximal de pièces jointes

250

Le nombre maximal de fichiers joints à un e-mail qui seront analysés pour l’indexation. Si un message comprend plus de 250 pièces jointes, les 250 premières sont analysées et indexées. Le message est marqué comme partiellement indexé, car il comptait des pièces jointes supplémentaires qui n’ont pas été analysées.

Nombre maximale de pièces jointes imbriquées

30

Le nombre maximal de pièces jointes imbriquées qui sont analysées. Par exemple, si un e-mail a un autre message joint auquel un document Word est joint, le document Word et le message joint seront indexés. Ce comportement continuera pour un maximum de 30 pièces jointes imbriquées.

Nombre maximal d’images jointes

0

Une image qui est jointe à un e-mail est ignorée par l’analyseur et n’est pas indexée.

Durée maximale passée l’analyse d’un élément

30 secondes

Un maximum de 30 secondes est consacré à l’analyse d’un élément pour l’indexation. Si la durée d’analyse dépasse 30 secondes, l’élément est marqué comme partiellement indexé.

Sortie maximale de l’analyseur

2 millions de caractères

La quantité maximale de texte en sortie de l’analyseur qui est indexée. Par exemple, si l’analyseur a extrait 8 millions de caractères d’un document, seuls les 2 premiers millions de caractères sont indexés.

Nombre maximal de jetons d’annotation

2 millions

Lors de l’indexation d’un courrier, chaque mot est annoté avec différentes instructions de traitement qui spécifient la manière dont ce mot doit être indexé. Chaque ensemble d’instructions de traitement est appelé un jeton d’annotation. Pour conserver une qualité de service élevée dans Office 365, une limite de 2 millions de jetons d’annotation a été fixée pour un courrier.

Taille maximale du corps dans l’index

67 millions de caractères

Nombre total de caractères dans le corps d’un courrier et dans toutes ses pièces jointes. Lors de l’indexation d’un courrier, l’ensemble du texte figurant dans le corps du message et dans toutes ses pièces jointes est concaténé en une seule chaîne. La taille maximale de cette chaîne indexée est fixée à 67 millions de caractères.

Nombre maximal de jetons uniques dans le corps

1 million

Comme expliqué précédemment, les jetons sont le résultat de l’extraction du texte à partir du contenu, de la suppression des signes de ponctuation et des espaces, et de sa division en mots (appelés jetons) qui sont alors stockés dans l’index. Par exemple, l’expression "cat, mouse, bird, dog, dog" contient 5 jetons. Seuls 4 d’entre-eux sont des jetons uniques. Chaque courrier est limité à 1 million de jetons uniques, ce qui permet d’éviter que l’index soit trop volumineux et ne contienne des jetons aléatoires.

Revenir au début

Plus d’informations sur les éléments non indexés

  • Comme indiqué auparavant, car les propriétés de documents et des messages et leurs métadonnées sont indexés, une recherche par mots-clés peut retourner des résultats si ce mot clé s’affiche dans les métadonnées indexées. Toutefois, cette même recherche par mots clés peut ne pas retourne le même élément si le mot clé s’affiche uniquement dans le contenu d’un élément avec un type de fichier non pris en charge. Dans ce cas, l’élément seront retourné comme éléments non indexés.

  • Si un élément non indexé est inclus dans les résultats de recherche, car il répond aux critères de la requête de recherche (et n’a pas été exclu), il ne sera pas inclus en tant qu’élément non indexé dans les statistiques de recherche estimées. En outre, il ne sera pas inclus dans les éléments non indexés lorsque vous exporterez les résultats de recherche.

  • Bien qu’un type de fichier est pris en charge pour l’indexation et est indexé, il peut y avoir des erreurs l’indexation ou de recherche qui va entraîner un fichier à renvoyer comme éléments non indexés. Par exemple, recherchez un fichier Excel très grand peut-être être partiellement réussie (4 premiers Mo sont indexés), mais ne pourra pas puis car la limite de taille de fichier est dépassée. Dans ce cas, il est possible que le même fichier est renvoyé avec les résultats de recherche et un élément non indexé.

  • Les fichiers joints chiffrés à l’aide des technologies Microsoft sont indexés et peuvent faire l’objet d’une recherche. Les fichiers chiffrés avec les technologies autres que Microsoft ne sont pas indexés.

  • Les messages électroniques chiffrés avec S/MIME ne sont pas indexés. Il s’agit des messages chiffrés avec ou sans pièces jointes.

  • Les messages protégés par la Gestion des droits relatifs à l’information (IRM) sont indexés et seront inclus dans les résultats de la recherche s’ils correspondent à la requête de recherche.

Revenir au début

Remarque : Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

Développez vos compétences
Découvrez des formations
Accédez aux nouvelles fonctionnalités en avant-première
Rejoignez le programme Office Insider

Ces informations vous ont-elles été utiles ?

Nous vous remercions pour vos commentaires.

Merci pour vos commentaires. Il serait vraisemblablement utile pour vous de contacter l’un de nos agents du support Office.

×