Créer un dictionnaire de mots clés

Important :  Cet article a été traduit automatiquement, voir l’avertissement. Vous pouvez consulter la version en anglais de cet article ici.

Prévention de perte de données (DLP) dans Office 365 peut identifier, surveiller et protéger vos informations sensibles. Identification des informations sensibles parfois nécessite vous recherchez des mots clés, en particulier lors de l’identification contenu générique (par exemple, la communication liés à la santé) ou la langue inappropriée ou explicite. Pendant que vous pouvez créer des listes de mots clés dans des types d’informations sensibles, listes de mots clés sont limités en taille et requièrent la modification XML pour créer ou modifier. Dictionnaires de mot clé fournissent simplification de la gestion des mots clés et en une quantité plus grande échelle, prenant en charge jusqu'à 100 000 termes par dictionnaire.

Étapes de base pour la création d’un dictionnaire de mots clés

Les mots clés de votre dictionnaire pourraient provenir d’une variété de sources, généralement à partir d’un fichier (par exemple, une liste fichier .csv ou .txt), dans la liste que vous entrez directement dans l’applet de commande ou à partir d’un dictionnaire existant. Lorsque vous créez un dictionnaire de mots clés, vous suivez les mêmes étapes principales :

  1. Se connecter à la sécurité et conformité centre PowerShell - voir cette rubrique.

  2. Définir ou charger vos mots clés à partir de votre source initial -l’applet de commande pour créer un dictionnaire de mots clés accepte une liste de mots clés, séparées par des virgules donc cette étape varie légèrement en fonction de d'où proviennent vos mots clés.

  3. Coder vos mots clés - une fois chargé, qu'ils sont convertis en un tableau d’octets avant qu’elles sont importées.

  4. Créer votre dictionnaire - choisir un nom et une description et créez votre dictionnaire.

Créer un dictionnaire de mots clés à partir d’une liste séparée par des virgules

Vous pouvez également définir votre liste de mots clés intraligne dans l’applet de commande. Pour illustrer cela, cet exemple crée un dictionnaire de mots clés de termes médicales. Vous devez tout d’abord se connecter à la sécurité et conformité centre PowerShell.. Ensuite, vous devez définir la liste des mots clés en exécutant cette commande :

$keywords = "Aarskog's syndrome, Abandonment, Abasia, Abderhalden-Kaufmann-Lignac, Abdominalgia, Abduction contracture, Abetalipo proteinemia, Abiotrophy, Ablatio, ablation, Ablepharia, Abocclusion, Abolition, Aborter, Abortion, Abortus, Aboulomania, Abrami's disease, Abramo"

Avant de pouvoir créer le dictionnaire, vous devez coder les mots clés en tant que tableau d’octets en exécutant cette commande :

$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)

Vous pouvez maintenant créer le dictionnaire de mots clés en exécutant cette commande :

New-DlpKeywordDictionary -Name "Diseases" -Description "Names of diseases and injuries from ICD-10-CM lexicon" -FileData $encodedKeywords 

Le dictionnaire est maintenant créé et prêt à être utilisé dans notre stratégies ou types d’informations sensibles personnalisé. Pour afficher le contenu, exécutez la commande suivante :

Get-DlpKeywordDictionary -Name "Diseases"

Le résultat de la commande ressemble à ceci :

RunspaceId        : d9a79cc1-66d7-4735-978f-af212b80b2bc
Identity          : 84d97c1a-2d7a-4589-9092-940ac037cb15
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture,
                    abetalipoproteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus,
                    aboulomania, abrami's disease
IsValid           : True
ObjectState       : Unchanged

Créer un dictionnaire de mots clés à partir d’un fichier

Souvent lorsque vous avez besoin créer un dictionnaire de grande taille, elle consiste à utiliser des mots clés à partir d’un fichier ou une liste exportée à partir d’une autre source. Dans ce cas, vous devez créer un dictionnaire de mots clés contenant une liste de langage inapproprié à l’écran dans un courrier électronique externe. Vous devez au préalable se connecter à la sécurité et conformité centre PowerShell..

À présent, vous allez importer le fichier, à l’aide de l’applet de commande Get-Content (vous utilisez Get-Content , car Import-CSV traite la première ligne comme en-têtes de colonne)

$csv = get-Content "C:\my path\InappropriateTerms.csv"

Vous allez maintenant rejoindre les mots clés par des virgules et convertir en tableau d’octets à utiliser lors de la création du dictionnaire de mot clé en exécutant ces commandes :

$keywords = $csv -Join ","
$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)
New-DlpKeywordDictionary -Name "Inappropriate Language" -Description "Unprofessional and inappropriate terminology" -FileData $encodedKeywords

Modification d’un dictionnaire de mots clés existants

Vous devrez peut-être modifier des mots clés dans un de vos dictionnaires de mot clé, ou modifiez l’un des dictionnaires intégrés. Dans cet exemple, nous allons modifier certains des termes dans PowerShell, enregistrer les termes localement dans laquelle vous pouvez les modifier dans un éditeur et puis mettez à jour les termes précédents en place. Tout d’abord, récupérer l’objet de dictionnaire :

$dict = Get-DlpKeywordDictionary -Name "Diseases"

L’impression $dict vous montrent les variables différentes. Les mots clés eux-mêmes sont stockées dans un objet sur le serveur principal, mais $dict.KeywordDictionary contient une représentation de chaîne d'entre eux, que vous utiliserez pour modifier le dictionnaire. Avant de modifier le dictionnaire, vous devez reconvertir la chaîne de termes dans un tableau en utilisant la méthode .split(‘,’) . Puis vous allez nettoyer les espaces entre les mots clés avec la méthode .trim() , laissez simplement les mots clés pour l’utiliser avec indésirables.

$terms = $dict.KeywordDictionary.split(',').trim()

Vous allez maintenant supprimer certaines conditions du dictionnaire. Étant donné que le dictionnaire exemple comporte uniquement quelques mots clés, vous pouvez ignorer tout aussi bien l’exportation du dictionnaire et de modification dans le bloc-notes, mais dictionnaires contiennent généralement une quantité importante de texte, donc vous allez découvrir tout d’abord ce possible de les modifier facilement dans PowerShell.

Dans la dernière étape, vous avez enregistré les mots clés dans un tableau. Il existe plusieurs manières de Supprimer des éléments à partir d’un tableau, mais une approche simple, vous allez créer un tableau des termes que vous voulez supprimer du dictionnaire et copier uniquement les termes du dictionnaire, qui ne sont pas dans la liste des termes à supprimer.

Exécuter la commande $terms pour afficher la liste actuelle de termes. Le résultat de la commande ressemble à ceci :

aarskog's syndrome
abandonment
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipoproteinemia
abiotrophy
ablatio
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Exécutez cette commande pour spécifier les conditions que vous voulez supprimer :

$termsToRemove = @('abandonment', 'ablatio')

Exécutez cette commande pour supprimer les termes dans la liste :

$updatedTerms = $terms | Where-Object{ $_ -notin $termsToRemove }

Exécuter la commande $updatedTerms pour afficher la liste des mises à jour de termes. Le résultat de la commande ressemble à ceci (les conditions spécifiées ont été supprimées) :

aarskog's syndrome
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipo proteinemia
abiotrophy
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Maintenant, enregistrez le dictionnaire en local et ajouter des termes quelques. Vous pouvez ajouter les termes ici dans PowerShell, mais vous devez toujours exporter le fichier localement pour vous assurer qu’il a enregistré avec le codage Unicode et qui contient la nomenclature.

Enregistrer le dictionnaire localement en exécutant la commande suivante :

Set-Content $updatedTerms -Path "C:\myPath\terms.txt"

Maintenant simplement ouvrir le fichier, ajoutez vos conditions supplémentaires et enregistrez avec Unicode (UTF-16) le codage. À présent que vous allez télécharger les termes mis à jour et mettre à jour le dictionnaire en place.

PS> Set-DlpKeywordDictionary -Identity "Diseases" -FileData (Get-Content -Path "C:myPath\terms.txt" -Encoding Byte -ReadCount 0)

À présent le dictionnaire a été mis à jour en place. Notez que le champ Identity prend le nom du dictionnaire. Si vous souhaitez également modifier le nom de votre dictionnaire à l’aide de l’applet de commande set- , vous devrez simplement ajouter le paramètre -Name à ce qui est au-dessus avec votre nom du nouveau dictionnaire.

À l’aide des dictionnaires de mots clés dans les types d’informations sensibles personnalisé et stratégies DLP

Dictionnaires de mot clé peuvent être utilisées dans le cadre de la configuration requise de correspondance pour un type d’informations sensibles personnalisé ou comme une catégorie d’informations sensible tapez eux-mêmes. Création d’un type d’informations sensibles personnaliséesrequièrent. Suivez les instructions de l’article lié pour créer un type d’informations sensibles. Une fois que le code XML, vous devez l’identificateur GUID pour le dictionnaire pour l’utiliser.

<Entity id="9e5382d0-1b6a-42fd-820e-44e0d3b15b6e" patternsProximity="300" recommendedConfidence="75">
	<Pattern confidenceLevel="75">
		<IdMatch idRef=". . ."/>
	</Pattern>
</Entity>

Pour obtenir l’identité de votre dictionnaire, exécutez la commande suivante, puis copiez la valeur de propriété Identity :

Get-DlpKeywordDictionary -Name "Diseases"

Le résultat de la commande ressemble à ceci :

RunspaceId        : 138e55e7-ea1e-4f7a-b824-79f2c4252255
Identity          : 8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture, abetalipo
                    proteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus, aboulomania,
                    abrami's disease, abramo
IsValid           : True
ObjectState       : Unchanged

Coller l’identité XML de votre type d’informations sensibles personnalisé et chargez-le. Maintenant votre dictionnaire s’affichent dans la liste des types d’informations sensibles et vous pouvez utiliser approprié dans votre stratégie, spécifier le nombre de mots clés sont requis pour correspondre.

<Entity id="d333c6c2-5f4c-4131-9433-db3ef72a89e8" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f" />
      </Pattern>
    </Entity>
    <LocalizedStrings>
      <Resource idRef="d333c6c2-5f4c-4131-9433-db3ef72a89e8">
        <Name default="true" langcode="en-us">Diseases</Name>
        <Description default="true" langcode="en-us">Detects various diseases</Description>
      </Resource>
    </LocalizedStrings>

Remarque : Avertissement traduction automatique : cet article a été traduit par un ordinateur, sans intervention humaine. Microsoft propose cette traduction automatique pour offrir aux personnes ne maîtrisant pas l’anglais l’accès au contenu relatif aux produits, services et technologies Microsoft. Comme cet article a été traduit automatiquement, il risque de contenir des erreurs de grammaire, de syntaxe ou de terminologie.

Développez vos compétences
Découvrez des formations
Accédez aux nouvelles fonctionnalités en avant-première
Rejoignez le programme Office Insider

Ces informations vous ont-elles été utiles ?

Nous vous remercions pour vos commentaires.

Merci pour vos commentaires. Il serait vraisemblablement utile pour vous de contacter l’un de nos agents du support Office.

×