自定义内置的敏感信息类型

重要:  本文是由机器翻译的,请参阅免责声明。请在 此处 中查找本文的英文版本以便参考。

查找有关内容中的敏感信息,当您需要描述该信息在所谓的规则。数据丢失保护 (DLP) 中包含的最常见的敏感信息类型,您可以立即使用的规则。若要使用这些规则,您必须将其包含在策略。您可能会发现您想要调整这些内置的规则,以满足您的组织特定的需要,并执行该操作通过创建自定义的敏感信息类型。本主题演示如何自定义 XML 文件包含现有的规则集,以检测广泛的潜在的信用卡信息。

您可以采取本例中,并将其应用于其他内置的敏感信息类型。默认敏感信息类型和 XML 定义的列表,请参阅查找敏感信息类型

本主题将指导您完成 XML 规则自定义的下列过程:

要了解有哪些不同的规则部分以及它们的功能,请参阅本主题结尾的Term glossary

导出当前规则的 XML 文件

若要导出 XML,您需要向连接到的安全和合规性中心通过远程 PowerShell。

  1. 在 PowerShell 中,键入以下命令以在屏幕上显示您所在组织的规则。如果尚未创建您自己,则只能看到默认、 内置的规则,标记为"Microsoft 规则程序包"。

    Get-DlpSensitiveInformationTypeRulePackage

  2. 将您的组织中的规则存储在变量中,键入以下内容。将内容存储在变量更为轻松地提供更高版本中适合远程 PowerShell 命令的格式。

    $ruleCollections = Get-DlpSensitiveInformationTypeRulePackage

  3. 请通过键入下列格式的 XML 文件包含的所有数据。(Set-content是将 XML 文件写入 cmdlet 的部分)。

    Set-Content -path "C:\custompath\exportedRules.xml" -Encoding Byte -Value $ruleCollections.SerializedClassificationRuleCollection

    重要: 请确保您使用的实际存储规则包文件位置。C:\custompath\是占位符。

查找您想在 XML 中修改的规则

在上述 cmdlet 导出整个规则集,其中包括我们提供了默认规则。下一步,您需要查找专门针对您想要修改的信用卡号规则。

  1. 使用文本编辑器打开您在前一节中导出的 XML 文件。

  2. 向下滚动到<Rules>标记,这是包含 DLP 规则的分区的开头。(此 XML 文件包含的信息的整个规则集,因为它包含您需要向下滚动过去的可访问这些规则顶部的其他信息。

  3. 查找Func_credit_card若要查找的信用卡号规则定义。(XML 中, 规则名称不能包含空格,以便空格通常替换下划线,并将有时缩写规则的名称。例如,这是美国社会保险号码规则,这是缩写"SSN"。信用卡号规则 XML 应类似下面的代码示例。

    <Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085"
           patternsProximity="300" recommendedConfidence="85">
          <Pattern confidenceLevel="85">
           <IdMatch idRef="Func_credit_card" />
            <Any minMatches="1">
              <Match idRef="Keyword_cc_verification" />
              <Match idRef="Keyword_cc_name" />
              <Match idRef="Func_expiration_date" />
            </Any>
          </Pattern>
        </Entity>

现在您已在 XML 中找到信用卡号规则定义,您可以自定义规则的 XML 以满足您的需求。(要刷新 XML 定义,请参阅本主题结尾的Term glossary。)

修改 XML 并创建新的敏感信息类型

首先,您需要创建新的敏感信息类型,因为不能直接修改默认的规则。自定义的敏感信息类型,创建一种类型的自定义的敏感信息所述,您可以执行各种操作。对于此示例中,我们将使其保持简单,仅删除 corroborative 证据并将关键字添加到信用卡号规则。

所有 XML 规则定义基于以下通用模板构建。您需要在模板中复制和粘贴信用卡号定义,修改某些值(请注意以下示例中的“.. .” 占位符),然后将修改后的 XML 作为可用于策略的新规则进行上载。

<?xml version="1.0" encoding="utf-16"?>
<RulePackage xmlns="http://schemas.microsoft.com/office/2011/mce">
  <RulePack id=". . .">
    <Version major="1" minor="0" build="0" revision="0" />
    <Publisher id=". . ." /> 
    <Details defaultLangCode=". . .">
      <LocalizedDetails langcode=" . . . ">
         <PublisherName>. . .</PublisherName>
         <Name>. . .</Name>
         <Description>. . .</Description>
      </LocalizedDetails>
    </Details>
  </RulePack>
  
 <Rules>
   <!-- Paste the Credit Card Number rule definition here.--> 

      <LocalizedStrings>
         <Resource idRef=". . .">
           <Name default="true" langcode=" . . . ">. . .</Name>
           <Description default="true" langcode=". . ."> . . .</Description>
         </Resource>
      </LocalizedStrings>

   </Rules>
</RulePackage>

现在,您的 XML 应该如下所示。因为规则包和规则使用它们的唯一 GUID 表示,您需要生成两个 GUID:一个用于规则包,一个用于替换信用卡号规则的 GUID。(以下代码示例中实体 ID 的 GUID 用于我们的内置规则定义,您需将其替换为新的 GUID。)有多种方法可以生成 GUID,但您可以通过键入 [guid]::NewGuid(),在 PowerShell 中轻松生成 GUID。

<?xml version="1.0" encoding="utf-16"?>
<RulePackage xmlns="http://schemas.microsoft.com/office/2011/mce">
  <RulePack id="8aac8390-e99f-4487-8d16-7f0cdee8defc">
    <Version major="1" minor="0" build="0" revision="0" />
    <Publisher id="8d34806e-cd65-4178-ba0e-5d7d712e5b66" />
    <Details defaultLangCode="en">
      <LocalizedDetails langcode="en">
        <PublisherName>Contoso Ltd.</PublisherName>
        <Name>Financial Information</Name>
        <Description>Modified versions of the Microsoft rule package</Description>
      </LocalizedDetails>
    </Details>
  </RulePack>
  
 <Rules>
    <Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f"
       patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
      </Pattern>
    </Entity>

      <LocalizedStrings>
         <Resource idRef="db80b3da-0056-436e-b0ca-1f4cf7080d1f"> 
<!-- This is the GUID for the preceding Credit Card Number entity because the following text is for that Entity. -->
           <Name default="true" langcode="en-us">Modified Credit Card Number</Name>
           <Description default="true" langcode="en-us">Credit Card Number that looks for additional keywords, and another version of Credit Card Number that doesn’t require keywords (but has a lower confidence level)</Description>
         </Resource>
      </LocalizedStrings>

   </Rules>
</RulePackage>

从敏感信息类型中删除确定证据要求

现在,您有新的敏感信息类型,你无法上载到安全和合规性中心下, 一步是让更具体的规则。修改规则,以便它仅查找传递校验和而不需要更多 (corroborative) 证据 (例如关键字) 16 位数字。若要执行此操作,您需要删除的条件查找 corroborative 证据的 XML 的一部分。Corroborative 证据是因为通常有某些关键字或信用卡号附近的过期日期减少误报很有帮助。如果您删除该证据,您应调整把握您是通过降低confidenceLevel,这 85 的示例中找到的信用卡号。

<Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f" patternsProximity="300"
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
      </Pattern>
    </Entity>

查找特定于您的组织的关键字

您可能希望需要 corroborative 证据,但希望其他关键字和也许您想要更改在哪里查找该证据。您可以调整patternsProximity扩展或收缩周围的 16 位数字 corroborative 证据的窗口。若要添加您自己的关键字,您需要定义关键字列表并在规则中引用它。下面的 XML 添加关键字"公司卡片"和"Contoso 卡",以便包含这些短语内的信用卡号 150 个字符的任何邮件会被标识为信用卡号。

<Rules>
<! -- Modify the patternsProximity to be "150" rather than "300." -->
    <Entity id="db80b3da-0056-436e-b0ca-1f4cf7080d1f" patternsProximity="150" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
<!-- Add the following XML, which references the keywords at the end of the XML sample. -->
          <Match idRef="My_Additional_Keywords" />
          <Match idRef="Func_expiration_date" />
        </Any>
      </Pattern>
    </Entity>
<!-- Add the following XML, and update the information inside the <Term> tags with the keywords that you want to detect. -->
    <Keyword id="My_Additional_Keywords">
      <Group matchStyle="word">
        <Term caseSensitive="false">company card</Term>
        <Term caseSensitive="false">Contoso card</Term>
      </Group>
    </Keyword>

上载您的规则

要上载您的规则,需执行以下操作:

  1. 使用 Unicode 编码将其另存为 .xml 文件。这一点很重要,因为如果文件使用其他编码保存,将无法正常运行。

  2. 连接到的安全和合规性中心通过远程 PowerShell。

  3. 在 PowerShell 中,键入以下命令。

    New-DlpSensitiveInformationTypeRulePackage -FileData (Get-Content -Path "C:\custompath\MyNewRulePack.xml" -Encoding Byte.

    重要: 请确保您使用的实际存储规则包文件位置。C:\custompath\是占位符。

  4. 若要确认,键入Y,然后按Enter

  5. 验证您的新规则已上载通过键入Get-DlpSensitiveInformationType,现在显示的规则的名称。

若要开始使用新规则检测敏感信息,您需要向 DLP 策略添加规则。若要了解如何向策略添加规则,请参阅创建 DLP 策略从模板

术语表

下面您在此过程中遇到的术语的定义。

术语

定义

实体

实体是我们称为敏感信息类型的项目,例如信用卡号。每个实体都有一个唯一的 GUID 作为其 ID。如果您复制 GUID 并在 XML 中搜索它,您将找到 XML 规则定义以及该 XML 规则的所有本地化翻译。您也可以通过查找翻译的 GUID 并搜索该 GUID 来查找此定义。

功能

XML 文件引用Func_credit_card,这是不支持经过编译的代码中的函数。函数用于运行复杂 regexes 并验证校验和与我们内置规则的匹配。)在代码发生这种情况,因为一些变量不会显示在 XML 文件。

IdMatch

这是图案是尝试匹配的标识符 — 例如,信用卡号。您可以阅读有关此和Match标记在实体规则的详细信息。

关键字列表

XML 文件还引用keyword_cc_verificationkeyword_cc_name,这是从中我们寻求实体内patternsProximity匹配的关键字的列表。这些当前未显示在 XML。

模式

模式包含敏感类型所查找内容的列表。这包括关键字、regex 和内部函数(执行验证校验和之类的任务)。敏感信息类型可能具有多个模式,每个模式均具有唯一的可信度。这在创建敏感信息类型时非常有用:当它找到确定证据时,返回高可信度;当未找到确定证据时,则返回较低的可信度。

模式可信度

这是指 DLP 引擎找到匹配的可信度。如果满足模式的要求,则可信度与模式匹配有关。这是当您使用 Exchange 传输规则 (ETR) 时应考虑的可信度衡量标准。

patternsProximity

我们发现如下所示信用卡号码模式, patternsProximity时,该数字周围附近我们将了解 corroborative 证据。

recommendedConfidence

这是我们建议您为此规则的可信度级别。推荐的 confidence 适用于实体和关联。对于实体,针对模式confidenceLevel永远不会计算此号码。它是只是以帮助您选择可信度级别,如果您想要应用的其中一个建议。关联,必须高于recommendedConfidence数 ETR 操作来调用图案confidenceLevelrecommendedConfidence是默认可信度级别中 ETRs 使用调用操作。如果需要,您可以手动更改要调用 ETR 基于图案的可信度,关闭。

详细信息

注意: 机器翻译免责声明:本文是由无人工介入的计算机系统翻译的。Microsoft 提供机器翻译是为了帮助非英语国家/地区用户方便阅读有关 Microsoft 产品、服务和技术的内容。由于机器翻译的原因,本文可能包含词汇、语法或文法方面的错误。

扩展你的技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×