Suppression des doublons dans les résultats de recherche eDiscovery

Important :  Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Cet article décrit comment la suppression des doublons de résultats de la recherche eDiscovery fonctionnement et explique les limites de l’algorithme de suppression des doublons.

Lorsque vous utilisez Office 365 eDiscovery outils pour exporter les résultats d’une recherche eDiscovery, vous avez la possibilité de suppression des doublons les résultats sont exportés. Que cela signifie ? Lorsque vous activez la suppression des doublons (par défaut, suppression des doublons n’est pas activée), qu’une seule copie d’un message électronique est exportée même si plusieurs instances du même message peuvent avoir été trouvées dans les boîtes aux lettres ont été recherchés. Suppression des doublons vous permet de gagner du temps en réduisant le nombre d’éléments que vous devrez examiner et analyser une fois que les résultats de recherche sont exportés. Mais il est important de comprendre le fonctionnement de la suppression des doublons et n’oubliez pas qu’il existe des limites à l’algorithme susceptibles de causer un élément unique à être signalé comme doublon pendant le processus d’exportation.

Content (Contenu)

Comment les messages en double sont identifiés

Limitations de l’algorithme de suppression des doublons

Plus d’informations

Comment les messages en double sont identifiés

outils de découverte électronique Office 365 utilisent une combinaison des propriétés de messagerie suivantes pour déterminer si un message est un doublon :

  • InternetMessageId    Cette propriété spécifie l’identificateur de message Internet d’un message électronique, qui est un identificateur unique qui fait référence à une version spécifique d’un message spécifique. Cette ID est généré par le programme client de messagerie de l’expéditeur ou de système de messagerie hôte qui envoie le message. Si une personne envoie un message à plusieurs destinataires, l’ID du message Internet sera la même pour chaque instance du message. Les versions ultérieures au message d’origine recevront un identificateur autre message.

  • ConversationTopic    Cette propriété spécifie le sujet de la conversation d’un message. La valeur de la propriété ConversationTopic est la chaîne qui décrit le sujet global de la conversation. Une conservation comprend un message initial et tous les messages envoyés en réponse au message initial. Messages au sein de la même conversation ont la même valeur pour la propriété ConversationTopic . La valeur de cette propriété est généralement la ligne d’objet du message initial qui généré la conversation.

  • BodyTagInfo    Il s’agit d’une propriété de magasin interne Exchange. La valeur de cette propriété est calculée en vérifiant divers attributs dans le corps du message. Cette propriété est utilisée pour identifier les différences dans le corps du message.

Pendant le processus d’exportation eDiscovery, ces trois propriétés sont comparées pour chaque message répondant aux critères de recherche. Si ces propriétés sont identiques pour les messages deux (ou plus), ces messages sont déterminées à des doublons et le résultat est qu’une seule copie du message est exportée si la suppression des doublons sont activée. Le message est exporté est appelé l’élément « source ». Informations sur les messages en double sont incluses dans les rapports Results.csv et Manifest.xml qui sont inclus dans les résultats de recherche exporté. Dans le fichier Results.csv , un message en double est identifié par ayant une valeur dans la colonne en double à l’élément. La valeur dans cette colonne correspond à la valeur dans la colonne Identité de l’élément pour le message qui a été exporté.

Les graphiques suivants illustrent comment les doublons messages sont affichés dans les rapports Results.csv et Manifest.xml qui sont exportés avec les résultats de recherche. Ces rapports ne contiennent pas les propriétés de messagerie décrites précédemment, qui sont utilisées dans l’algorithme de suppression des doublons. À la place, les rapports incluent la propriété Identité d’un article affectée aux articles par le magasinExchange.

Rapport Results.csv (affiché dans Excel)

Affichage des informations sur les éléments en double dans le rapport Results.csv

Rapport manifest.XML (affiché dans Excel)

Affichage des informations sur les éléments en double dans le rapport Manifest.xml

En outre, d’autres propriétés des messages en double sont incluses dans les rapports d’exportation. Cela inclut la boîte aux lettres que se trouve le message en double, si le message a été envoyé à un groupe de distribution, et si le message a été serait Cc ou Cci séparées par un autre utilisateur.

Revenir au début

Limitations de l’algorithme de suppression des doublons

Il existe certaines limitations connues de l’algorithme de suppression des doublons qui peuvent provoquer des éléments uniques prise marqués comme des doublons. Il est important de comprendre ces limitations afin que vous puissiez décider d’utiliser la fonctionnalité de suppression des doublons facultatif ou non.

Il existe une situation où la fonctionnalité de suppression des doublons peut identifier par erreur un message comme un doublon et pas l’exporter (mais toujours le citer comme doublon dans les rapports d’exportation). Il s’agit des messages d’un utilisateur modifie, mais n’envoie aucune. Supposons par exemple, un utilisateur sélectionne un message dans Outlook, copie le contenu du message et colle dans un nouveau message. L’utilisateur modifie ensuite l’une des copies en supprimant ou en ajoutant une pièce jointe ou en modifiant la ligne d’objet ou le corps de lui-même. Si les deux messages correspondent à la requête d’une recherche eDiscovery, seul des messages est exporté si la suppression des doublons sont activée lorsque les résultats de recherche sont exportés. Donc même si le message d’origine ou le message copié a été modifié, aucun des messages révisés ont été envoyés et par conséquent, les valeurs de propriétés InternetMessageId, ConversationTopic et BodyTagInfo n’ont pas été mis à jour. Mais comme expliqué précédemment, les deux messages apparaîtront dans les rapports d’exportation

Notez que des messages uniques peuvent également être marqués comme des doublons lorsque la fonctionnalité de protection de copie à l’écriture page est activée, comme dans le cas d’une boîte aux lettres en cours sur Mettre en attente de litige ou inaltérable. La fonctionnalité de copie à l’écriture copie le message d’origine (et l’enregistrer dans le dossier des Versions du dossier éléments récupérables de l’utilisateur) avant la révision à l’élément d’origine est enregistrée. Dans ce cas, la copie révisée et le message d’origine (dans le dossier éléments récupérables) peuvent être considérées comme des messages en double et par conséquent seul d'entre eux est exporté.

Important : Si les limites de l’algorithme de suppression des doublons peuvent avoir un impact sur la qualité de vos résultats de recherche, vous ne devez pas activer suppression des doublons lorsque vous exportez des éléments. Si les situations décrites dans cette section sont probablement pas un facteur dans vos résultats de recherche, et que vous souhaitez réduire le nombre d’éléments plus susceptibles d’être des doublons, vous devez envisager l’activation de suppression des doublons.

Revenir au début

Informations complémentaires

Revenir au début

Remarque : Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

Développez vos compétences
Découvrez des formations
Accédez aux nouvelles fonctionnalités en avant-première
Rejoignez le programme Office Insider

Ces informations vous ont-elles été utiles ?

Nous vous remercions pour vos commentaires.

Merci pour vos commentaires. Il serait vraisemblablement utile pour vous de contacter l’un de nos agents du support Office.

×