Erstellen eines Schlüsselwörterbuchs

Mithilfe der Verhinderung von Datenverlust (Data loss prevention, DLP) in Office 365 können Ihre vertraulichen Informationen erkannt, überwacht und geschützt werden. Das Identifizieren von vertraulichen Informationen erfordert manchmal die Suche nach Schlüsselwörtern, insbesondere beim Erkennen von allgemeinen Inhalten (etwa bei Kommunikation im Gesundheitswesen) oder unangemessener oder unflätiger Sprache. Zwar lassen sich Schlüsselwortlisten in vertraulichen Informationstypen erstellen, ihre Größe ist jedoch beschränkt und erfordert zu ihrer Erstellung oder Bearbeitung das Bearbeiten von XML. Schlüsselwörterbücher bieten eine einfachere Verwaltung von Schlüsselwörtern in einem viel größeren Maßstab und unterstützen bis zu 100.000 Ausdrücke pro Wörterbuch.

Grundlegende Schritte zum Erstellen eines Schlüsselwörterbuchs

Die Schlüsselwörter für Ihr Wörterbuch können aus einer Vielzahl von Quellen stammen, am häufigsten wohl aus einer Datei (etwa einer CSL- oder TXT-Liste), aus einer Liste, die Sie direkt im Cmdlet eingeben oder aus einem vorhandenen Wörterbuch. Beim Erstellen eines Schlüsselwörterbuchs befolgen Sie die gleichen einfachen Schritte:

  1. Stellen Sie eine Verbindung mit PowerShell im Security & Compliance Center her – mehr dazu finden Sie in diesem Thema.

  2. Definieren Sie Ihre Schlüsselwörter, oder laden Sie sie aus der vorgesehenen Quelle – das Cmdlet zum Erstellen eines Schlüsselwörterbuchs akzeptiert eine durch Trennzeichen getrennte Liste der Schlüsselwörter, daher unterscheidet sich dieser Schritt jeweils geringfügig je nach der Herkunft Ihrer Schlüsselwörter.

  3. Codieren Sie Ihre Schlüsselwörter – nach dem Laden werden sie vor dem Importieren in ein Bytearray konvertiert.

  4. Erstellen Sie Ihr Wörterbuch – wählen Sie einen Namen und eine Beschreibung aus, und erstellen Sie Ihr Wörterbuch.

Erstellen eines Schlüsselwörterbuchs aus einer durch Trennzeichen getrennten Liste

Sie können Ihre Schlüsselwortliste auch Inline im Cmdlet definieren. Zur Veranschaulichung wird in diesem Beispiel ein Schlüsselwörterbuch mit medizinischen Ausdrücken erstellt. Zuerst müssen Sie eine Verbindung mit PowerShell im Security & Compliance Center herstellen.. Als Nächstes definieren Sie die Liste der Schlüsselwörter, indem Sie diesen Befehl ausführen:

$keywords = "Aarskog's syndrome, Abandonment, Abasia, Abderhalden-Kaufmann-Lignac, Abdominalgia, Abduction contracture, Abetalipo proteinemia, Abiotrophy, Ablatio, ablation, Ablepharia, Abocclusion, Abolition, Aborter, Abortion, Abortus, Aboulomania, Abrami's disease, Abramo"

Vor dem Erstellen des Wörterbuchs müssen Sie die Schlüsselwörter als Bytearray codieren, indem Sie diesen Befehl ausführen:

$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)

Nun können Sie das Schlüsselwörterbuch erstellen, indem Sie diesen Befehl ausführen:

New-DlpKeywordDictionary -Name "Diseases" -Description "Names of diseases and injuries from ICD-10-CM lexicon" -FileData $encodedKeywords 

Das Wörterbuch wurde jetzt erstellt und ist zum Gebrauch in Richtlinien oder benutzerdefinierten Typen von vertraulichen Informationen bereit. Führen Sie diesen Befehl aus, um seinen Inhalt anzuzeigen:

Get-DlpKeywordDictionary -Name "Diseases"

Die Ausgabe des Befehls sieht wie folgt aus:

RunspaceId        : d9a79cc1-66d7-4735-978f-af212b80b2bc
Identity          : 84d97c1a-2d7a-4589-9092-940ac037cb15
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture,
                    abetalipoproteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus,
                    aboulomania, abrami's disease
IsValid           : True
ObjectState       : Unchanged

Erstellen eines Schlüsselwörterbuchs aus einer Datei

Beim Erstellen eines umfangreichen Wörterbuchs sollen in vielen Fällen Schlüsselwörter aus einer Datei oder einer aus einer anderen Quelle exportierten Liste verwendet werden. In diesem Fall erstellen Sie ein Schlüsselwörterbuch, das eine Liste unangemessener Ausdrücke enthält, um von außen eingehende E-Mail-Nachrichten zu durchsuchen. Sie müssen zunächst wiederum eine Verbindung mit PowerShell im Security & Compliance Center herstellen..

Jetzt importieren Sie die Datei mithilfe des Cmdlets Get-Content (Sie verwenden Get-Content, da Import-CSV die erste Zeile als Spaltenköpfe ansehen würde)

$csv = get-Content "C:\my path\InappropriateTerms.csv"

Jetzt verbinden Sie die einzelnen Schlüsselwörter durch Kommas und verwandeln sie in ein Bytearray, das zum Erstellen des Schlüsselwörterbuchs verwendet wird. Führen Sie dazu diese Befehle aus:

$keywords = $csv -Join ","
$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)
New-DlpKeywordDictionary -Name "Inappropriate Language" -Description "Unprofessional and inappropriate terminology" -FileData $encodedKeywords

Ändern eines vorhandenen Schlüsselwörterbuchs

Möglicherweise müssen Sie einmal Schlüsselwörter in einem Ihrer Schlüsselwörterbücher oder in einem der integrierten Wörterbücher ändern. In diesem Beispiel ändern wir einige Ausdrücke in PowerShell, speichern die Ausdrücke lokal, wo Sie sie in einem Editor bearbeiten können, und aktualisieren anschließend die vorherigen Ausdrücke an Ort und Stelle. Rufen Sie zuerst das Wörterbuchobjekt ab:

$dict = Get-DlpKeywordDictionary -Name "Diseases"

Beim Ausgeben von $dict werden die verschiedenen Variablen angezeigt. Die eigentlichen Schlüsselwörter sind in einem Objekt auf dem Back-End gespeichert, doch enthält $dict.KeywordDictionary sie in Form einer Zeichenfolgendarstellung, die Sie zum Ändern des Wörterbuchs verwenden. Bevor Sie das Wörterbuch ändern, müssen Sie die Folge der Ausdrücke mithilfe der Methode .split(‘,’) wieder in ein Array umwandeln. Anschließend beseitigen Sie die unerwünschten Leerzeichen zwischen den Schlüsselwörtern mit der Methode .trim(), sodass nur die Schlüsselwörter zur Bearbeitung übrig bleiben.

$terms = $dict.KeywordDictionary.split(',').trim()

Jetzt entfernen Sie einige Ausdrücke aus dem Wörterbuch. Da das Beispielwörterbuch nur über einige Schlüsselwörter verfügt, könnten Sie hier auch einfach vorwärts springen, das Wörterbuch exportieren und es im Editor bearbeiten, doch im Allgemeinen enthalten Wörterbücher große Textmengen – daher lernen Sie zuerst dieses Verfahren kennen, mit dem Sie sie einfach in PowerShell bearbeiten können.

Im letzten Schritt hatten Sie die Schlüsselwörter in einem Array gespeichert. Es gibt verschiedene Verfahren zum Entfernen von Elementen aus einem Array, ein geradliniger Ansatz wäre aber, ein Array der Ausdrücke zu erstellen, die Sie aus dem Wörterbuch entfernen möchten, und anschließend nur die Wörterbuchausdrücke in das Array zu kopieren, die nicht in der Liste der zu entfernenden Ausdrücke vorkommen.

Führen Sie den Befehl $terms aus, um die aktuelle Liste der Ausdrücke anzuzeigen. Die Ausgabe des Befehls sieht wie folgt aus:

aarskog's syndrome
abandonment
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipoproteinemia
abiotrophy
ablatio
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Führen Sie diesen Befehl aus, um die Ausdrücke anzugeben, die Sie entfernen möchten:

$termsToRemove = @('abandonment', 'ablatio')

Führen Sie diesen Befehl aus, um die Ausdrücke tatsächlich aus der Liste zu entfernen:

$updatedTerms = $terms | Where-Object{ $_ -notin $termsToRemove }

Führen Sie den Befehl $updatedTerms aus, um die aktualisierte Liste der Ausdrücke anzuzeigen. Die Ausgabe des Befehls sieht so aus (die angegebenen Ausdrücke wurden entfernt):

aarskog's syndrome
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipo proteinemia
abiotrophy
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Speichern Sie das Wörterbuch jetzt lokal, und fügen Sie einige weitere Ausdrücke hinzu. Sie könnten die Ausdrücke direkt hier in PowerShell hinzufügen, trotzdem müssen Sie die Datei lokal exportieren, um sicherzustellen, dass es in Unicode-Codierung gespeichert wurde und die BOM enthält.

Speichern Sie das Wörterbuch lokal, indem Sie dies ausführen:

Set-Content $updatedTerms -Path "C:\myPath\terms.txt"

Öffnen Sie jetzt einfach die Datei, fügen Sie Ihre zusätzlichen Ausdrücke hinzu, und speichern Sie sie in Unicode-Codierung (UTF-16). Jetzt laden Sie die aktualisierten Ausdrücke hoch und aktualisieren das Wörterbuch an Ort und Stelle.

PS> Set-DlpKeywordDictionary -Identity "Diseases" -FileData (Get-Content -Path "C:myPath\terms.txt" -Encoding Byte -ReadCount 0)

Jetzt wurde das Wörterbuch an Ort und Stelle aktualisiert. Beachten Sie, dass das Feld Identity den Namen des Wörterbuchs annimmt. Wenn Sie mithilfe des set--Cmdlets auch den Namen Ihres Wörterbuchs ändern wollten, müssten Sie lediglich der Zeile oben den Parameter -Name mit dem neuen Namen des Wörterbuchs hinzufügen.

Verwenden von Schlüsselwörterbüchern in benutzerdefinierten Typen vertraulicher Informationen und DLP-Richtlinien

Schlüsselwörterbücher können als Bestandteil der Übereinstimmungsanforderungen für einen benutzerdefinierten Typ von vertraulichen Informationen oder selbst als Typ von vertraulichen Informationen verwendet werden. In beiden Fällen ist das Erstellen eines benutzerdefinierten Typs von vertraulichen Informationen erforderlich. Befolgen Sie die Anweisungen im verknüpften Artikel um einen Typ vertraulicher Informationen zu erstellen. Sobald Sie über den XML-Code verfügen, benötigen Sie den GUID-Bezeichner für das Wörterbuch, um es zu verwenden.

<Entity id="9e5382d0-1b6a-42fd-820e-44e0d3b15b6e" patternsProximity="300" recommendedConfidence="75">
	<Pattern confidenceLevel="75">
		<IdMatch idRef=". . ."/>
	</Pattern>
</Entity>

Um die Identität Ihres Wörterbuchs abzurufen, führen Sie diesen Befehl aus, und kopieren Sie den Wert der Identity-Eigenschaft:

Get-DlpKeywordDictionary -Name "Diseases"

Die Ausgabe des Befehls sieht wie folgt aus:

RunspaceId        : 138e55e7-ea1e-4f7a-b824-79f2c4252255
Identity          : 8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture, abetalipo
                    proteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus, aboulomania,
                    abrami's disease, abramo
IsValid           : True
ObjectState       : Unchanged

Fügen Sie die Identität in den XML-Code Ihres benutzerdefinierten Typs vertraulicher Informationen ein, und laden Sie ihn hoch. Jetzt wird das Wörterbuch in Ihrer Liste der Typen vertraulicher Informationen angezeigt, und Sie können es direkt in Ihrer Richtlinie verwenden und festlegen, bei wie vielen Schlüsselwörtern eine Übereinstimmung festgestellt werden muss.

<Entity id="d333c6c2-5f4c-4131-9433-db3ef72a89e8" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f" />
      </Pattern>
    </Entity>
    <LocalizedStrings>
      <Resource idRef="d333c6c2-5f4c-4131-9433-db3ef72a89e8">
        <Name default="true" langcode="en-us">Diseases</Name>
        <Description default="true" langcode="en-us">Detects various diseases</Description>
      </Resource>
    </LocalizedStrings>
Ihre Fähigkeiten erweitern
Schulung erkunden
Neue Funktionen als Erster erhalten
An Office Insider teilnehmen

War diese Information hilfreich?

Vielen Dank für Ihr Feedback!

Vielen Dank für Ihr Feedback. Es klingt, als ob es hilfreich sein könnte, Sie mit einem unserer Office-Supportmitarbeiter zu verbinden.

×