Criar um dicionário de palavra-chave

Importante :  Este artigo foi traduzido por um sistema de tradução automática, leia o aviso de isenção de responsabilidade. Para sua referência, veja a versão em inglês deste artigo aqui.

Prevenção de perda de dados (DLP) no Office 365 pode identificar, monitorar e proteger suas informações confidenciais. Identificar informações confidenciais às vezes requer procurando palavras-chave, especialmente quando identificando conteúdo genérico (como comunicações relacionadas a saúde) ou o idioma inadequado ou explícito. Embora você possa criar listas de palavra-chave em tipos de informações confidenciais, listas de palavra-chave são limitadas em tamanho e exigem modificando XML para criar ou editá-los. Dicionários de palavra-chave fornecem gerenciamento mais simples de palavras-chave e em uma escala muito maior, até 100.000 termos por dicionário de suporte.

Etapas básicas para criar um dicionário de palavra-chave

As palavras-chave para o seu dicionário podem vir de uma variedade de fontes, mais comumente a partir de um arquivo (como um arquivo. csv ou. txt lista), a partir de uma lista que você inserir diretamente no cmdlet ou um dicionário existente. Quando você cria um dicionário de palavra-chave, você siga as mesmas etapas principais:

  1. Conectar-se ao PowerShell do Centro de conformidade e segurança - consulte Este tópico.

  2. Definir ou carregar suas palavras-chave de sua fonte pretendido -o cmdlet para criar um dicionário de palavra-chave aceita uma lista separada por vírgulas de palavras-chave, para que esta etapa variam ligeiramente, dependendo de onde vêm suas palavras-chave.

  3. Codificar suas palavras-chave - uma vez carregado, que elas estiverem convertidas em uma matriz de bytes antes da importação.

  4. Criar seu dicionário - escolha um nome e descrição e crie seu dicionário.

Criar um dicionário de palavra-chave de uma lista separada por vírgulas

Você também pode definir sua lista de palavra-chave embutida no cmdlet. Para ilustrar isso, este exemplo cria um dicionário de palavra-chave de termos médicos. Primeiro, você precisa conectar ao PowerShell do Centro de conformidade e segurança.. Em seguida, você deverá definir a lista de palavras-chave executando este comando:

$keywords = "Aarskog's syndrome, Abandonment, Abasia, Abderhalden-Kaufmann-Lignac, Abdominalgia, Abduction contracture, Abetalipo proteinemia, Abiotrophy, Ablatio, ablation, Ablepharia, Abocclusion, Abolition, Aborter, Abortion, Abortus, Aboulomania, Abrami's disease, Abramo"

Antes de criar o dicionário, você precisa codificar as palavras-chave como uma matriz de bytes executando este comando:

$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)

Agora você pode criar o dicionário de palavra-chave executando este comando:

New-DlpKeywordDictionary -Name "Diseases" -Description "Names of diseases and injuries from ICD-10-CM lexicon" -FileData $encodedKeywords 

O dicionário agora é criado e está pronto para uso em nosso políticas ou tipos de informações confidenciais personalizadas. Para ver o conteúdo, execute este comando:

Get-DlpKeywordDictionary -Name "Diseases"

A saída do comando será parecida com o seguinte:

RunspaceId        : d9a79cc1-66d7-4735-978f-af212b80b2bc
Identity          : 84d97c1a-2d7a-4589-9092-940ac037cb15
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture,
                    abetalipoproteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus,
                    aboulomania, abrami's disease
IsValid           : True
ObjectState       : Unchanged

Criar um dicionário de palavra-chave de um arquivo

Muitas vezes, quando você precisa criar um dicionário grande, é para usar palavras-chave de um arquivo ou uma lista exportada de alguma outra fonte. Nesse caso, você vai criar um dicionário de palavra-chave contendo uma lista de linguagem inadequada à tela em emails externos. Você precisa primeiro Conectar do PowerShell do Centro de conformidade e segurança..

Agora você vai importar o arquivo, usando o cmdlet Get-Content (use Get-Content porque Import-CSV tratará a primeira linha como cabeçalhos de coluna)

$csv = get-Content "C:\my path\InappropriateTerms.csv"

Agora você vai ingressar as palavras-chave por vírgulas e convertê-la em uma matriz de bytes para usar ao criar o dicionário de palavra-chave executando esses comandos:

$keywords = $csv -Join ","
$encodedKeywords = [system.Text.Encoding]::UTF8.GetBytes($keywords)
New-DlpKeywordDictionary -Name "Inappropriate Language" -Description "Unprofessional and inappropriate terminology" -FileData $encodedKeywords

Modificando um dicionário de palavra-chave existente

Talvez seja necessário modificar palavras-chave em um dos seus dicionários de palavra-chave ou modificar um dos dicionários internos. Neste exemplo, podemos vai modificar alguns termos no PowerShell, salvar os termos localmente onde você pode modificá-los em um editor e, em seguida, atualize os termos anteriores no lugar. Primeiro, recupere o objeto de dicionário:

$dict = Get-DlpKeywordDictionary -Name "Diseases"

Impressão $dict mostrará as várias variáveis. As palavras-chave próprios são armazenadas em um objeto no back-end, mas $dict.KeywordDictionary contém uma representação de cadeia de caracteres deles, que você usará para modificar o dicionário. Antes de modificar o dicionário, você precisa ativar a cadeia de caracteres de termos de volta em uma matriz usando o método .split(‘,’) . Em seguida, você vai limpar os espaços indesejados entre as palavras-chave com o método .trim() , deixando apenas as palavras-chave para trabalhar com.

$terms = $dict.KeywordDictionary.split(',').trim()

Agora você removerá alguns termos do dicionário. Porque o dicionário de exemplo tem apenas algumas palavras-chave, você poderia facilmente ignorar exportando o dicionário e editá-lo no bloco de notas, mas dicionários geralmente contêm uma grande quantidade de texto, portanto você primeiro aprenderá dessa maneira editá-los facilmente no PowerShell.

Na última etapa, você salvou as palavras-chave para uma matriz. Há várias maneiras de Remover itens de uma matriz, mas como uma abordagem simples, você vai criar uma matriz dos termos que você deseja remover do dicionário e copie somente os termos de dicionário que não estão na lista de termos para removê-lo.

Execute o comando $terms para mostrar a lista atual de termos. A saída do comando tem esta aparência:

aarskog's syndrome
abandonment
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipoproteinemia
abiotrophy
ablatio
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Execute este comando para especificar as condições que você deseja remover:

$termsToRemove = @('abandonment', 'ablatio')

Execute este comando para realmente remover os termos da lista:

$updatedTerms = $terms | Where-Object{ $_ -notin $termsToRemove }

Execute o comando $updatedTerms para mostrar a lista atualizada de termos. A saída do comando tem esta aparência (os termos especificados foram removidos):

aarskog's syndrome
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipo proteinemia
abiotrophy
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

Agora, salve o dicionário localmente e adicione alguns termos mais. Você pode adicionar os termos aqui no PowerShell, mas ainda será necessário exportar o arquivo localmente para garantir que ele foi salvo com a codificação Unicode e contém BOM.

Salve o dicionário localmente ao executar o seguinte:

Set-Content $updatedTerms -Path "C:\myPath\terms.txt"

Agora simplesmente abrir o arquivo, adicione seus termos adicionais e salvar com codificação (UTF-16) Unicode. Agora você vai carregar os termos atualizados e atualizar o dicionário no lugar.

PS> Set-DlpKeywordDictionary -Identity "Diseases" -FileData (Get-Content -Path "C:myPath\terms.txt" -Encoding Byte -ReadCount 0)

Agora o dicionário foi atualizado no lugar. Observe que o campo Identity obtém o nome do dicionário. Se você quisesse também alterar o nome do seu dicionário usando o cmdlet set- , você precisaria apenas adicionar o parâmetro -Name para o que está acima com seu novo nome do dicionário.

Usando dicionários de palavra-chave em tipos de informações confidenciais personalizadas e políticas DLP

Dicionários de palavra-chave podem ser usados como parte dos requisitos de correspondência para um tipo de informações confidenciais personalizadas ou como uma informações confidenciais digite próprios. Ambas exigem Criando um tipo de informações confidenciais personalizadas. Siga as instruções no artigo vinculada para criar um tipo de informações confidenciais. Quando você tiver o XML, você precisará o identificador GUID para o dicionário usá-lo.

<Entity id="9e5382d0-1b6a-42fd-820e-44e0d3b15b6e" patternsProximity="300" recommendedConfidence="75">
	<Pattern confidenceLevel="75">
		<IdMatch idRef=". . ."/>
	</Pattern>
</Entity>

Para obter a identidade do seu dicionário, execute este comando e copie o valor da propriedade Identity :

Get-DlpKeywordDictionary -Name "Diseases"

A saída do comando será parecida com o seguinte:

RunspaceId        : 138e55e7-ea1e-4f7a-b824-79f2c4252255
Identity          : 8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture, abetalipo
                    proteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus, aboulomania,
                    abrami's disease, abramo
IsValid           : True
ObjectState       : Unchanged

Cole a identidade XML do seu tipo de informações confidenciais personalizado e carregue-o. Agora seu dicionário será exibido na sua lista de tipos de informações confidenciais e você pode usá-lo à direita na sua política, especificando quantos palavras-chave são necessárias para fazer a correspondência.

<Entity id="d333c6c2-5f4c-4131-9433-db3ef72a89e8" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f" />
      </Pattern>
    </Entity>
    <LocalizedStrings>
      <Resource idRef="d333c6c2-5f4c-4131-9433-db3ef72a89e8">
        <Name default="true" langcode="en-us">Diseases</Name>
        <Description default="true" langcode="en-us">Detects various diseases</Description>
      </Resource>
    </LocalizedStrings>

Observação : Aviso de Isenção de Tradução Automática: Este artigo foi traduzido por computador, sem intervenção humana. A Microsoft oferece essas traduções automáticas para ajudar as pessoas que não falam inglês a aproveitar os textos escritos sobre produtos, serviços e tecnologias da Microsoft. Como este artigo foi traduzido automaticamente, é possível que contenha erros de vocabulário, sintaxe ou gramática.

Expanda suas habilidades
Explore o treinamento
Obtenha novos recursos primeiro
Ingressar no Office Insider

Essas informações foram úteis?

Obrigado por seus comentários!

Agradecemos pelos seus comentários! Parece que pode ser útil conectar você a um de nossos agentes de suporte do Office.

×