電子情報開示検索結果での重複除去

この記事では、電子情報開示の検索結果での重複除去の動作方法、および重複除去アルゴリズムの制限事項について説明します。

Office 365 の電子情報開示ツールを使って電子情報開示の検索結果をエクスポートするときに、エクスポートされる結果の重複を除去できます。つまり、重複除去を有効にすると (既定では無効)、検索したメールボックスで同じメール メッセージの複数のインスタンスが見つかった場合でも、メッセージの 1 つのコピーだけがエクスポートされます。重複除去を有効にすると、検索結果をエクスポートした後でレビューおよび分析する必要があるアイテムの数が減るので、時間を節約できます。ただし、重複除去がどのように動作するかを理解し、エクスポート プロセス中に重複していないアイテムが重複としてマークされる可能性があるアルゴリズムの制限事項を認識しておくことが重要です。

目次

重複メッセージの識別方法

重複除去アルゴリズムの制限事項

詳細情報

重複メッセージの識別方法

Office 365 の電子情報開示ツールは、次のメール プロパティの組み合わせを使って、メッセージが重複しているかどうかを特定します。

  • InternetMessageId    このプロパティは、メール メッセージのインターネット メッセージ ID を指定します。これは、特定のメッセージの特定のバージョンを参照するグローバル一意識別子です。この ID は、送信者のメール クライアント プログラムまたはメッセージを送信するホストのメール システムによって生成されます。送信者が複数の受信者にメッセージを送信する場合、インターネット メッセージ ID はすべてのメッセージ インスタンスで同じです。元のメッセージの以降のリビジョンには、異なるメッセージ ID が割り当てられます。

  • ConversationTopic    このプロパティは、メッセージの会話スレッドの件名を指定します。ConversationTopic プロパティの値は、スレッドの全体的なトピックを説明する文字列です。スレッドは、最初のメッセージと、最初のメッセージへの返信で送信されたすべてのメッセージで構成されます。同じスレッド内のすべてのメッセージは、ConversationTopic プロパティの値が同じです。このプロパティの値は、通常、スレッドを生成した最初のメッセージの件名行です。

  • BodyTagInfo    これは、内部的な Exchange 保存プロパティです。このプロパティの値は、メッセージ本文のさまざまな属性を調べることによって計算されます。このプロパティは、メッセージ本文の相違を識別するために使われます。

電子情報開示のエクスポート処理中に、検索条件に一致するすべてのメッセージについて、これら 3 つのプロパティが比較されます。これらのプロパティが一致する複数のメッセージは重複と見なされ、重複除去が有効になっている場合は、メッセージの 1 つのコピーだけがエクスポートされます。エクスポートされるメッセージは、"ソース アイテム" と呼ばれます。エクスポートされる検索結果に含まれる Results.csv レポートと Manifest.xml レポートには、重複メッセージに関する情報が含まれます。Results.csv ファイルでは、重複するメッセージは [項目の重複] 列の値によって識別されます。この列の値は、エクスポートされたメッセージの [項目 ID] 列の値と一致します。

次の図は、検索結果でエクスポートされる Results.csv および Manifest.xml レポートでの重複メッセージの表示方法を示したものです。これらのレポートには、前に説明したメール プロパティは含まれません。これらのプロパティは重複除去アルゴリズムで使用されます。代わりに、レポートには Exchange ストアによってアイテムに割り当てられた [項目 ID] プロパティが含まれます。 

Results.csv レポート (Excel で表示)

Results.csv レポートの重複アイテムについての情報の表示

Manifest.xml レポート (Excel で表示)

Manifest.xml レポートの重複アイテムについての情報の表示

さらに、重複メッセージの他のプロパティもエクスポート レポートに含まれます。これには、重複メッセージが存在するメールボックス、メッセージが配布グループに送信されたかどうか、およびメッセージが別のユーザーに CC または BCC されたかどうかが含まれます。

先頭に戻る

重複除去アルゴリズムの制限事項

重複除去アルゴリズムには、重複していない項目が重複としてマークされる可能性のあるいくつかの既知の制限があります。省略可能な重複除去機能を使うかどうかを決定できるように、これらの制限事項を理解しておくことが重要です。

重複除去機能がメッセージを誤って重複として識別し、エクスポートしない (しかし、エクスポート レポートでは重複として示す) 可能性がある 1 つの状況があります。それは、ユーザーが編集したが送信していないメッセージです。たとえば、ユーザーが Outlook でメッセージを選択し、メッセージの内容をコピーして、新しいメッセージに貼り付けたものとします。その後、ユーザーは、添付ファイルを追加または削除したり、件名行または本文自体を変更したりして、コピーの 1 つを変更します。これら 2 つのメッセージが電子情報開示検索のクエリと一致する場合、検索結果がエクスポートされるときに重複除去が有効になっていると、メッセージの 1 つだけがエクスポートされます。したがって、元のメッセージまたはコピーされたメッセージが変更された場合でも、改訂されたメッセージはどちらも送信されず、InternetMessageIdConversationTopicBodyTagInfo プロパティの値は更新されません。しかし、前に説明したように、エクスポート レポートには両方のメッセージが表示されます。

メールボックスが訴訟ホールドまたはインプレース ホールドにある場合と同じように、コピー オン ライト ページ保護機能が有効になっているときも、一意のメッセージが重複としてマークされる可能性があることにご注意ください。コピー オン ライト機能は、元のアイテムに対する改訂が保存される前に、元のメッセージをコピーします (そして、ユーザーの [回復可能なアイテム] フォルダーの [バージョン] フォルダーに保存します)。この場合は、改訂されたコピーと ([回復可能なアイテム] フォルダーの) 元のメッセージは重複したメッセージと見なされて、そのうちの 1 つだけがエクスポートされる可能性があります。

重要: 重複除去アルゴリズムの制限事項が検索結果の品質に影響を与える可能性がある場合は、アイテムをエクスポートするときに重複除去を有効にしないようにする必要があります。このセクションで説明した状況が検索結果に影響する可能性がなく、重複する可能性が高いアイテムの数を減らしたい場合は、重複除去を有効にすることを検討します。

先頭に戻る

詳細情報

先頭に戻る

スキルを磨く
トレーニングの探索
新機能を最初に入手
Office Insider に参加する

この情報は役に立ちましたか?

ご意見をいただきありがとうございます。

フィードバックをお寄せいただき、ありがとうございます。Office サポートの担当者におつなぎいたします。

×