Office 365 Advanced eDiscovery でドキュメントの類似性を理解する

注: Advanced eDiscovery を使用するには、お客様の組織で、Advanced Compliance アドオンが含まれている Office 365 E3、または E5 のサブスクリプションが必要です。このプランを利用しておらず、Advanced eDiscovery をお試しになりたい場合は、Office 365 Enterprise E5 の試用版にサインアップしてください

Advanced eDiscovery では、ドキュメントの類似性は、2 つの文書を準重複であると見なすために必要な最小限の類似レベルです。

ヒント: ほとんどのビジネス アプリケーションで、60%-75% の類似値の使用が推奨されています。OCR (光学式文字認識) 資料の認識率がとても乏しいときには、低い類似値を適用できます。

注: 類似値は特定のケースに設定し、実行した後に変更することはできません。

ND (準重複) セットには、類似レベルが類似性しきい値を下回る文書が存在することもあります。文書を ND セットに入れるには、ND セットの 1 件以上の文書で類似レベルが類似値を超えている必要があります。

たとえば、類似値が 80% に設定されているとき、文書 F1 は文書 F2 に 85% のレベルで類似しており、文書 F2 は文書 F3 に 90% のレベルで類似しているとします。

文書 F1 と文書 F3 の類似レベルは 70% にとどまるとすれば、しきい値を下回ることになります。このようにしきい値を下回ることがあっても、この例では、文書 F1、F2、F3 はすべて 1 つの ND セットに表示されます。同じように類似値を 80% として、2 つのセットを作成します。EquiSet-1 と EquiSet-2 です。EquiSet-1 には、文書 E1 と文書 E2 が含まれます。EquiSet-2 には、文書 F1、F2、F3 が含まれます。

類似レベルは次の図のようになります。

ドキュメントの類似性

別の文書 X1 を挿入します。X1 と E3 の類似度は 87% です。同じように、X1 と F1 の類似度は 92% です。結果として、EquiSet-1、EquiSet-2、X1 が 1 つの ND セットに入ります。

ドキュメントの類似性

注: 2 つの文書が 1 つの ND セットに割り当てられているとき、文書がそのセットに追加されたり、セットが結合されたりしても、その 2 つは同じ ND セットにとどまります。

セットの結合後、新しい文書がセットに追加されたとき、コア ドキュメントが変更されることがあります。

関連項目

Office 365 Advanced eDiscovery

分析オプションの設定

テキスト無視の設定

分析の詳細設定の設定

分析結果の表示

スキルを磨く
トレーニングの探索
新機能を最初に入手
Office Insider に参加する

この情報は役に立ちましたか?

ご意見をいただきありがとうございます。

フィードバックをお寄せいただき、ありがとうございます。Office サポートの担当者におつなぎいたします。

×