Office 365 Advanced eDiscovery で関連度の分析を追跡する

注: Advanced eDiscovery を使用するには、お客様の組織で Office 365 E5 サブスクリプションが必要です。このプランを利用しておらず、Advanced eDiscovery をお試しになりたい場合は、Office 365 Enterprise E5 の試用版にサインアップしてください

Advanced eDiscovery では、[関連度追跡] タブに、[タグ] タブで実行された関連度トレーニングの有効性 (計算後) が表示され、関連度の繰り返しトレーニング プロセスで取るべき次の手順が示されます。

関連度トレーニングの状態を追跡記録する

  1. 下の [問題の名前] ダイアログの例のように、ケースの問題について、[関連度追跡] に次の詳細が表示されます。

    • 評価:この進行状況インジケーターは、この時点までに実行された関連度トレーニングが、誤差範囲の観点から、どの程度まで評価目標を達成しているかを示します。関連度トレーニングの結果のリッチ度も表示されます。

    • トレーニング:この色分けされた進行状況インジケーターとツール ヒントのディスプレイは、関連度トレーニングの結果の安定性と数字目盛り (問題ごとにタグが付けられている関連度トレーニング サンプルの数) を示します。エキスパートが繰り返し関連度トレーニング プロセスの進行状況を監視します。

    • バッチ計算:この進捗インジケーターは、バッチ計算の完了に関する情報を提供します。

    • 次のステップ: 実行するべき次の手順が推奨されます。

    この例では、ある問題点の評価が完了していることが進捗インジケーターの色とチェックマークで示されています。タグ付けが進行中ですが、このケースは依然として不安定であると見なされています (ツール ヒントに安定性の状態も表示されています)。次の推奨手順は "トレーニング" です。

    関連度追跡トレーニングの手順 1

    ビューを展開すると、追加の情報とオプションが表示されます。表示されている現在の許容誤差は、評価の現在の状態における、リコールの許容誤差です。既存の (既にタグ付けされている) 評価ファイルを所与とします。

    注記: 

    • [評価] チェック ボックスを評価ごとに選択解除し、それから “すべての懸案事項” に対して選択解除すると、評価段階が回避されます。ただし、結果として、その問題に統計が与えられません。

    • [評価] チェック ボックスの選択を解除するのは、評価の実行前に限られます。1 つのケースに複数の問題が存在するとき、問題ごとにチェック ボックスを選択解除した場合にのみ、評価が回避されます。

    最初のサンプル ファイル セットで評価が完了しないとき、評価が次の手順になり、さらに多くのファイルにタグが付けられる場合があります。

    [関連度]、[トラック] の順に選択すると、トレーニングの進行状況インジケーターとツール ヒントに、安定に必要な追加サンプルの見積もり数が示されます。この見積もりは、必要な追加トレーニングの指針になります。

    関連度追跡トレーニング
  2. タグ付けが完了し、トレーニングを続行する場合、[トレーニング] をクリックします。別のサンプル ファイル セットが、追加トレーニングのために設定され、読み込まれたファイルから生成されます。その後、[タグ] タブに移動します。さらに多くのファイルにタグを付け、トレーニングします。

安定したトレーニング レベルに到達する

評価ファイルが安定したトレーニング レベルを得たら、Advanced eDiscovery はバッチ計算できます。

注: 通常、3 つの安定したトレーニング サンプルの後、次の手順が “バッチ計算” となります。例外もあります。たとえば、最初のサンプルからのファイルのタグ付けを変更したときやシード ファイルが追加されたときです。

バッチ計算を実行する

トレーニングの完了後、次の手順としてバッチ計算が実行されます (安定したトレーニングの状態が進行状況バー、チェックマーク、ツール ヒントの安定状態で表示されたとき)。バッチ計算では、ファイルの関連度を評価し、関連度スコアを割り当てる目的で、関連度トレーニングで得られた知識がファイルの作成全体に適用されます。

問題が複数存在するとき、バッチ計算は問題ごとに行われます。バッチ計算中、すべてのファイルが処理される間、進捗が監視されます。

ここで、推奨される次の手順は "なし" です。"なし" は、この時点では、追加の繰り返し関連度トレーニングが必要ないことを示します。次の段階のために、[関連度]、[決定] タブの順に移動します。

バッチ計算後、新しいファイルをインポートする場合、監理者はインポートしたファイルを新しい読み込みに追加できます。

注: バッチ計算中に [キャンセル] をクリックすると、実行済みの内容が保存されます。バッチ計算をもう一度実行すると、前回の実行時点から続行します。

タグ付けの整合性を評価する

ファイルのタグ付けに整合性がない場合、分析が影響を受ける可能性があります。結果が最適ではないとき、あるいは整合性に疑問があるとき、Advanced eDiscovery のタグ付け整合性プロセスを利用できます。タグ付けに整合性がない可能性があるファイルの一覧が返されます。確認し、必要に応じてタグを付け直すことができます。

注: 評価後、7 回以上トレーニングを行ったら、[関連度]、[トラック]、[問題]、[詳細結果]、[トレーニングの進行状況] でタグ付けの整合性を表示できます。この確認は、一度に 1 つの問題に対して行います。

  1. [関連度]、[トラック] の順に選択し、問題の行を展開します。

  2. [次のステップ] の右にある [変更] をクリックします。

  3. 7 つのトレーニング サンプルの後、[次のステップ] オプションとして [タグの不整合] を選択し、[OK] をクリックします。

  4. [タグの不整合] を選択します。[タグ] タブが開き、不整合の一覧が表示されます。必要に応じて、タグを付け直します。

  5. [計算] をクリックし、変更を送信します。タグ付け不整合の後の次のステップは、“トレーニング” です。

関連度結果を表示し、利用する

[関連度]、[トラック] の順に選択し、問題の行を展開し、[詳細結果] の隣にある [表示] をクリックします。下の画像のような [詳細結果] ウィンドウが表示されます。

関連度トレーニングの詳細結果

タグ付けの概要

下の例のように、[タグ付けの概要] に、評価、トレーニング、キャッチアップのそれぞれを対象に、ファイルタグ付けプロセスの合計が表示されます。

関連度追跡のタグ付けの概要

キーワード

キーワードとは、ファイル内の固有の文字列、単語、語句、言葉の連続であり、ファイルの関連度を示す大きな要素として Advanced eDiscovery が識別します。"含む" 列には、ファイル内に存在し、関連ありとしてタグ付けされるキーワードや重みが列挙されます。"除外" には、関連度なしとしてタグ付けされるものが列挙されます。

Advanced eDiscovery では、マイナスまたはプラスのキーワード加重値が割り当てられます。加重値が高ければ、バッチ計算中に、キーワードが表示されたファイルに高い関連度スコアが割り当てられる可能性がそれだけ高くなります。

Advanced eDiscovery のキーワード リストは、エキスパートが作成したリストの補足に利用したり、ファイル レビュー プロセスの任意の時点で間接的なサニティ チェックとして利用したりできます。

トレーニングの進行状況

[トレーニングの進行状況] ウィンドウには、下の例のように、トレーニングの進捗グラフや品質インジケーターが含まれます。

関連度追跡トレーニングの進行状況

トレーニングの品質インジケーター:タグ付けの整合性評価を次のように表示します。

  • :ファイルのタグ付けに整合性があります。(緑色のライトが表示されます)

  • :一部のファイルのタグ付けに整合性がありません。(黄色のライトが表示されます)

  • 警告: 多くのファイルのタグ付けに整合性がありません。(赤色のライトが表示されます)

トレーニングの進行状況グラフ:たくさんの関連度トレーニングを繰り返した後、関連度トレーニングの安定性を F 値との比較で表示します。グラフを左から右に進むにつれ、信頼区間が狭くなります。Advanced eDiscovery では、この区間を F 値と共に利用し、関連度トレーニングの結果が最適になるときの安定性が決定されます。

注: 関連度では F2 が利用されます。F2 は、リコールの加重値が精度の 2 倍になる F 値指標です。リッチ度の高いケースの場合 (25% 超)、関連度では F1 が利用されます (1:1 の比率)。F 値の比率は [関連度の設定]、[詳細設定] で設定できます。

バッチ計算の結果

[バッチ計算の結果] ウィンドウには、次のように、関連度のスコアが付けられたファイル数が含まれます。

  • 成功

  • :テキストが含まれません。たとえば、スペースまたはタブだけです。

  • 失敗:サイズが大きすぎたか、読み込めなかったことが原因です。

  • 無視:サイズが大きすぎたことが原因です。

  • 不明瞭:意味のないテキストが含まれるか、問題に関連するものがありません。

注: 空、失敗、無視、不明瞭の場合、関連度のスコアとして -1 が与えられます。

トレーニングの統計

[トレーニングの統計] ウィンドウには、Advanced eDiscovery 関連度トレーニングの結果に基づき、統計とグラフが表示されます。

関連度追跡トレーニングの統計

このビューには、次が表示されます。

  • レビュー リコール率:仮説的リニア レビューで、関連度のスコアに基づき、結果を比較します。レビュー セットにサイズ セットが与えられ、リコールが見積もられます。

  • パラメーター:ケース全体を対象にファイルの作成との関連で計算された、レビュー セットに関係する累積統計。

  • レビュー:このカットオフを基準とする、レビューするファイルの割合。

  • リコール:レビュー セット内の関連ファイルの割合。

  • 関連度スコア別分布:左の濃い灰色で表示されているファイルは、カットオフ スコアを下回ります。ツール ヒントには、関連度スコアと、合計ファイルに対する、レビュー ファイル セット内のファイルの関連割合が表示されます。

関連項目

Office 365 Advanced eDiscovery

関連度の評価を理解する

評価を実行し、レビューする

関連度トレーニングを実行する

結果に基づいて決定する

関連度分析のテスト

スキルを磨く
トレーニングの探索
新機能を最初に入手
Office Insider に参加する

この情報は役に立ちましたか?

ご意見をいただきありがとうございます。

フィードバックをお寄せいただき、ありがとうございます。Office サポートの担当者におつなぎいたします。

×