Что позволяют искать типы конфиденциальной информации

Важно :  Данная статья переведена с помощью машинного перевода, см. Отказ от ответственности. Используйте английский вариант этой статьи, который находится здесь, в качестве справочного материала.

Защита от потери данных (DLP) в Центр безопасности и соответствия требованиям Office 365 включает в себя множество типов конфиденциальной информации, все готово для использования в вашей политики защиты от потери данных. В этой статье перечислены все типы конфиденциальной информации и показан политики защиты от потери данных при обнаружении каждого типа. Шаблон, который можно определить по регулярных выражений или функции определяется типом конфиденциальной информации. Кроме того corroborative свидетельство например ключевых слов и контрольные может использоваться для определения типа конфиденциальной информации. Уровень надежности и расположение также используются в процессе вычислений.

Формат

9 цифр по форматированному или неформатированному шаблону

Шаблон

Форматированный:

  • четыре цифры, начиная с 0, 1, 2, 3, 6, 7 или 8;

  • дефис;

  • четыре цифры;

  • дефис;

  • цифра.

Неформатированный:

  • 9 цифр без разделителей, начиная с 0, 1, 2, 3, 6, 7 или 8.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_aba_routing находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_ABA_Routing.

<!-- ABA Routing Number -->
<Entity id="cb353f78-2b72-4c3c-8827-92ebe4f69fdf" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_aba_routing" />
        <Match idRef="Keyword_ABA_Routing" />
      </Pattern>
 </Entity>

Ключевые слова

Keyword_ABA_Routing

aba

aba #

aba routing #

aba routing number

aba#

abarouting#

aba number

abaroutingnumber

american bank association routing #

american bank association routing number

americanbankassociationrouting#

americanbankassociationroutingnumber

bank routing number

bankrouting#

bankroutingnumber

routing transit number

RTN

Формат

Восемь цифр, разделенных точками.

Шаблон

Восемь цифр:

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_argentina_national_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_argentina_national_id.

<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_argentina_national_id

Argentina National Identity number

Identity

Identification National Identity Card

DNI

NIC National Registry of Persons

Documento Nacional de Identidad

Registro Nacional de las Personas

Identidad

Identificación

Формат

6–10 цифр с номером отделения банка в штате или без него.

Шаблон

Номер счета состоит из 6–10 цифр.

Номер филиала банка в штате:

  • три цифры;

  • дефис;

  • три цифры.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_australia_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_australia_bank_account_number;

  • регулярное выражение Regex_australia_bank_account_number_bsb находит содержимое, соответствующее шаблону.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_australia_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_australia_bank_account_number.

<!-- Australia Bank Account Number -->
<Entity id="74a54de9-2a30-4aa0-a8aa-3d9327fc07c7" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
        <Match idRef="Regex_australia_bank_account_number_bsb" />
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_bank_account_number" />
        <Match idRef="Keyword_australia_bank_account_number" />
  </Pattern>
 </Entity>

Ключевые слова

Keyword_australia_bank_account_number

swift bank code

correspondent bank

base currency

usa account

holder address

bank address

information account

fund transfers

bank charges

bank details

banking information

full names

iaea

Формат

Девять букв и цифр.

Шаблон

Девять букв и цифр:

  • две цифры или буквы (без учета регистра);

  • две цифры;

  • пять цифр или букв (без учета регистра);

  • ИЛИ

  • 1–2 необязательные буквы (без учета регистра);

  • от 4 до 9 цифр;

  • ИЛИ

  • девять цифр или букв (без учета регистра).

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_australia_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_australia_drivers_license_number;

  • не обнаруживается ни одного ключевого слова из списка Keyword_australia_drivers_license_number_exclusions.

<!-- Australia Drivers License Number -->
<Entity id="1cbbc8f5-9216-4392-9eb5-5ac2298d1356" patternsProximity="300" recommendedConfidence="75">
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_drivers_license_number" />
        <Match idRef="Keyword_australia_drivers_license_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_australia_drivers_license_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_australia_drivers_license_number

Keyword_australia_drivers_license_number_exclusions

international driving permits

australian automobile association

sydney nsw

international driving permit

DriverLicence

DriverLicences

Driver Lic

Driver Licence

Driver Licences

DriversLic

DriversLicence

DriversLicences

Drivers Lic

Drivers Lics

Drivers Licence

Drivers Licences

Driver'Lic

Driver'Lics

Driver'Licence

Driver'Licences

Driver' Lic

Driver' Lics

Driver' Licence

Driver' Licences

Driver'sLic

Driver'sLics

Driver'sLicence

Driver'sLicences

Driver's Lic

Driver's Lics

Driver's Licence

Driver's Licences

DriverLic#

DriverLics#

DriverLicence#

DriverLicences#

Driver Lic#

Driver Lics#

Driver Licence#

Driver Licences#

DriversLic#

DriversLics#

DriversLicence#

DriversLicences#

Drivers Lic#

Drivers Lics#

Drivers Licence#

Drivers Licences#

Driver'Lic#

Driver'Lics#

Driver'Licence#

Driver'Licences#

Driver' Lic#

Driver' Lics#

Driver' Licence#

Driver' Licences#

Driver'sLic#

Driver'sLics#

Driver'sLicence#

Driver'sLicences#

Driver's Lic#

Driver's Lics#

Driver's Licence#

Driver's Licences#

aaa

DriverLicense

DriverLicenses

Driver License

Driver Licenses

DriversLicense

DriversLicenses

Drivers License

Drivers Licenses

Driver'License

Driver'Licenses

Driver' License

Driver' Licenses

Driver'sLicense

Driver'sLicenses

Driver's License

Driver's Licenses

DriverLicense#

DriverLicenses#

Driver License#

Driver Licenses#

DriversLicense#

DriversLicenses#

Drivers License#

Drivers Licenses#

Driver'License#

Driver'Licenses#

Driver' License#

Driver' Licenses#

Driver'sLicense#

Driver'sLicenses#

Driver's License#

Driver's Licenses#

Формат

10–11 цифр.

Шаблон

10–11 цифр:

  • первая цифра — число из диапазона 2–6;

  • девятая цифра — контрольная;

  • десятая цифра — номер серии;

  • одиннадцатая цифра (необязательно) — индивидуальный номер.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 95 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_australian_medical_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_Australia_Medical_Account_Number;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_australian_medical_account_number находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

  <!-- Australia Medical Account Number -->
<Entity id="104a99a0-3d3b-4542-a40d-ab0b9e1efe63" recommendedConfidence="85" patternsProximity="300">
    <Pattern confidenceLevel="95">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="1">
     <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
<Pattern confidenceLevel="85">
     <IdMatch idRef="Func_australian_medical_account_number"/>
     <Any minMatches="0" maxMatches="0">
  <Match idRef="Keyword_Australia_Medical_Account_Number"/>
     </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_Australia_Medical_Account_Number

bank account details

medicare payments

mortgage account

bank payments

information branch

credit card loan

department of human services

local service

medicare

Формат

Буква и семь цифр.

Шаблон

Буква (без учета регистра) и семь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_australia_passport_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_passport или Keyword_australia_passport_number.

<!-- Australia Passport Number -->
<Entity id="29869db6-602d-4853-ab93-3484f905df50" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_australia_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_australia_passport_number" />
        </Any>
   </Pattern>
</Entity>

Ключевые слова

Keyword_passport

Keyword_australia_passport_number

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート #

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

passport

passport details

immigration and citizenship

commonwealth of australia

department of immigration

residential address

department of immigration and citizenship

visa

national identity card

passport number

travel document

issuing authority

Формат

8–9 цифр.

Шаблон

8–9 цифр, которые обычно записываются через пробелы следующим образом:

  • три цифры;

  • пробел (необязательно);

  • три цифры;

  • пробел (необязательно);

  • 2–3 цифры, последняя из которых — контрольная.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 95 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_australian_tax_file_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_Australia_Tax_File_Number;

  • не обнаруживается ни одного ключевого слова из списка Keyword_number_exclusions;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_australian_tax_file_number находит содержимое, соответствующее шаблону;

  • не обнаруживается ни одного ключевого слова из списка Keyword_Australia_Tax_File_Number или Keyword_number_exclusions;

  • проверка контрольной суммы проходит успешно.

    <!-- Australia Tax File Number -->
<Entity id="e29bc95f-ff70-4a37-aa01-04d17360a4c5" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
        </Any>
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_australian_tax_file_number" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_Australia_Tax_File_Number" />
          <Match idRef="Keyword_number_exclusions" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_Australia_Tax_File_Number

Keyword_number_exclusions

australian business number

marginal tax rate

medicare levy

portfolio number

service veterans

withholding tax

individual tax return

tax file number

00000000

11111111

22222222

33333333

44444444

55555555

66666666

77777777

88888888

99999999

000000000

111111111

222222222

333333333

444444444

555555555

666666666

777777777

888888888

999999999

0000000000

1111111111

2222222222

3333333333

4444444444

5555555555

6666666666

7777777777

8888888888

9999999999

Формат

11 цифр с разделителями.

Шаблон

11 цифр с разделителями:

  • шесть цифр, разделенные двумя точками — дата рождения в формате ГГ.ММ.ДД;

  • дефис;

  • три цифры без разделителей (нечетные — для мужчин, четные — для женщин);

  • точка;

  • две контрольные цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_belgium_national_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_belgium_national_number;

  • проверка контрольной суммы проходит успешно.

<!-- Belgium National Number -->
  <Entity id="fb969c9e-0fd1-4b18-8091-a2123c5e6a54" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_belgium_national_number"/>
     <Match idRef="Keyword_belgium_national_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_belgium_national_number

Identity

Registration

Identification

ID

Identiteitskaart

Registratie nummer

Identificatie nummer

Identiteit

Registratie

Identificatie

Carte d’identité

numéro d'immatriculation

numéro d'identification

identité

inscription

Identifikation

Identifizierung

Identifikationsnummer

Personalausweis

Registrierung

Registrationsnummer

Формат

11 цифр (включая контрольную) по форматированному или неформатированному шаблону.

Шаблон

Форматированный:

  • три цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • дефис;

  • две контрольные цифры.

Неформатированный:

  • 11 цифр, две последние из которых — контрольные.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_brazil_cpf находит содержимое, которое соответствует шаблону;

  • находится ключевое слово из Keyword_brazil_cpf;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_brazil_cpf находит содержимое, которое соответствует шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Brazil CPF Number -->
<Entity id="78e09124-f2c3-4656-b32a-c1a132cd2711" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cpf"/>
     <Match idRef="Keyword_brazil_cpf"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cpf"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_brazil_cpf

CPF

Identification

Registration

Revenue

Cadastro de Pessoas Físicas

Imposto

Identificação

Inscrição

Receita

Формат

14 цифр с разделителями: регистрационный номер, номер филиала и контрольные цифры.

Шаблон

14 цифр с разделителями:

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры (эти первые восемь цифр — регистрационный номер);

  • косая черта;

  • четыре цифры — номер филиала;

  • дефис;

  • две контрольные цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_brazil_cnpj находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_brazil_cnpj;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_brazil_cnpj находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Brazil Legal Entity Number (CNPJ) -->
<Entity id="9b58b5cd-5e90-4df6-b34f-1ebcc88ceae4" recommendedConfidence="85" patternsProximity="300">
   <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_cnpj"/>
     <Match idRef="Keyword_brazil_cnpj"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_cnpj"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_brazil_cnpj

CNPJ

CNPJ/MF

CNPJ-MF

National Registry of Legal Entities

Taxpayers Registry

Legal entity

Legal entities

Registration Status

Business

Company

CNPJ

Cadastro Nacional da Pessoa Jurídica

Cadastro Geral de Contribuintes

CGC

Pessoa jurídica

Pessoas jurídicas

Situação cadastral

Inscrição

Empresa

Формат

Registro Geral (старый формат):

девять цифр.

Registro de Identidade (RIC, новый формат):

11 цифр.

Шаблон

Registro Geral (старый формат):

  • две цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • дефис;

  • контрольная цифра.

Registro de Identidade (RIC, новый формат):

  • 10 цифр;

  • дефис;

  • контрольная цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_brazil_rg находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_brazil_rg;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_brazil_rg находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Brazil National ID Card (RG) -->
<Entity id="486de900-db70-41b3-a886-abdf25af119c" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_brazil_rg"/>
     <Match idRef="Keyword_brazil_rg"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_brazil_rg"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_brazil_rg

Cédula de identidade

identity card

national id

número de rregistro

registro de Iidentidade

registro geral

RG (с учетом регистра)

RIC (с учетом регистра)

Формат

Семь или двенадцать цифр.

Шаблон

Номер банковского счета в Канаде состоит из семи или двенадцати цифр.

Номер транзитного счета в Канаде записывается в следующем формате:

  • пять цифр;

  • дефис;

  • три цифры;

    ИЛИ

  • ноль (0);

    восемь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_canada_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_canada_bank_account_number;

  • регулярное выражение Regex_canada_bank_account_transit_number находит содержимое, соответствующее шаблону.

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_canada_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_canada_bank_account_number.

<!-- Canada Bank Account Number -->
<Entity id="552e814c-cb50-4d94-bbaa-bb1d1ffb34de" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
        <Match idRef="Regex_canada_bank_account_transit_number" />
   </Pattern>
   <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_bank_account_number" />
        <Match idRef="Keyword_canada_bank_account_number" />
   </Pattern>
</Entity>

Ключевые слова

Keyword_canada_bank_account_number

canada savings bonds

canada revenue agency

canadian financial institution

direct deposit form

canadian citizen

legal representative

notary public

commissioner for oaths

child care benefit

universal child care

canada child tax benefit

income tax benefit

harmonized sales tax

social insurance number

income tax refund

child tax benefit

territorial payments

institution number

deposit request

banking information

direct deposit

Формат

Зависит от провинции.

Шаблон

Различные шаблоны, соответствующие провинциям Альберта, Британская Колумбия, Квебек, Манитоба, Нью-Брансуик, Ньюфаундленд и Лабрадор, Новая Шотландия, Онтарио, Остров Принца Эдуарда и Саскачеван.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_[province_name]_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_[province_name]_drivers_license_name;

  • обнаруживается ключевое слово из списка Keyword_canada_drivers_license.

<!-- Canada Driver's License Number -->
    <Entity id="37186abb-8e48-4800-ad3c-e3d1610b3db0" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_alberta_drivers_license_number" />
        <Match idRef="Keyword_alberta_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_british_columbia_drivers_license_number" />
        <Match idRef="Keyword_british_columbia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_manitoba_drivers_license_number" />
        <Match idRef="Keyword_manitoba_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_brunswick_drivers_license_number" />
        <Match idRef="Keyword_new_brunswick_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_newfoundland_labrador_drivers_license_number" />
        <Match idRef="Keyword_newfoundland_labrador_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_nova_scotia_drivers_license_number" />
        <Match idRef="Keyword_nova_scotia_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_ontario_drivers_license_number" />
        <Match idRef="Keyword_ontario_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_prince_edward_island_drivers_license_number" />
        <Match idRef="Keyword_prince_edward_island_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_quebec_drivers_license_number" />
        <Match idRef="Keyword_quebec_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_saskatchewan_drivers_license_number" />
        <Match idRef="Keyword_saskatchewan_drivers_license_name" />
        <Match idRef="Keyword_canada_drivers_license" />
      </Pattern>
    </Entity>

Ключевые слова

Keyword_[province_name]_drivers_license_name

Keyword_canada_drivers_license

Аббревиатура провинции, например AB.

Название провинции, например Альберта.

DL

DLS

CDL

CDLS

DriverLic

DriverLics

DriverLicense

DriverLicenses

DriverLicence

DriverLicences

Driver Lic

Driver Lics

Driver License

Driver Licenses

Driver Licence

Driver Licences

DriversLic

DriversLics

DriversLicence

DriversLicences

DriversLicense

DriversLicenses

Drivers Lic

Drivers Lics

Drivers License

Drivers Licenses

Drivers Licence

Drivers Licences

Driver'Lic

Driver'Lics

Driver'License

Driver'Licenses

Driver'Licence

Driver'Licences

Driver' Lic

Driver' Lics

Driver' License

Driver' Licenses

Driver' Licence

Driver' Licences

Driver'sLic

Driver'sLics

Driver'sLicense

Driver'sLicenses

Driver'sLicence

Driver'sLicences

Driver's Lic

Driver's Lics

Driver's License

Driver's Licenses

Driver's Licence

Driver's Licences

Permis de Conduire

id

ids

idcard number

idcard numbers

idcard #

idcard #s

idcard card

idcard cards

idcard

identification number

identification numbers

identification #

identification #s

identification card

identification cards

identification

DL#

DLS#

CDL#

CDLS#

DriverLic#

DriverLics#

DriverLicense#

DriverLicenses#

DriverLicence#

DriverLicences#

Driver Lic#

Driver Lics#

Driver License#

Driver Licenses#

Driver License#

Driver Licences#

DriversLic#

DriversLics#

DriversLicense#

DriversLicenses#

DriversLicence#

DriversLicences#

Drivers Lic#

Drivers Lics#

Drivers License#

Drivers Licenses#

Drivers Licence#

Drivers Licences#

Driver'Lic#

Driver'Lics#

Driver'License#

Driver'Licenses#

Driver'Licence#

Driver'Licences#

Driver' Lic#

Driver' Lics#

Driver' License#

Driver' Licenses#

Driver' Licence#

Driver' Licences#

Driver'sLic#

Driver'sLics#

Driver'sLicense#

Driver'sLicenses#

Driver'sLicence#

Driver'sLicences#

Driver's Lic#

Driver's Lics#

Driver's License#

Driver's Licenses#

Driver's Licence#

Driver's Licences#

Permis de Conduire#

id#

ids#

idcard card#

idcard cards#

idcard#

identification card#

identification cards#

identification#

Формат

10 цифр.

Шаблон

10 цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_canada_health_service_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_canada_health_service_number.

<!-- Canada Health Service Number -->
<Entity id="59c0bf39-7fab-482c-af25-00faa4384c94" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_health_service_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_health_service_number" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_canada_health_service_number

personal health number

patient information

health services

speciality services

automobile accident

patient hospital

psychiatrist

workers compensation

disability

Формат

Две прописные буквы и шесть цифр.

Шаблон

Две прописные буквы и шесть цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_canada_passport_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_canada_passport_number или Keyword_passport.

 <!-- Canada Passport Number -->
<Entity id="14d0db8b-498a-43ed-9fca-f6097ae687eb" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_canada_passport_number" />
          <Match idRef="Keyword_passport" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_canada_passport_number

Keyword_passport

canadian citizenship

canadian passport

passport application

passport photos

certified translator

canadian citizens

processing times

renewal application

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート#

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

Формат

Девять цифр

Шаблон

Девять цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_canada_phin находит содержимое, соответствующее шаблону;

  • обнаруживаются хотя бы два ключевых слова из списка Keyword_canada_phin или Keyword_canada_provinces.

<!-- Canada PHIN -->
<Entity id="722e12ac-c89a-4ec8-a1b7-fea3469f89db" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_canada_phin" />
        <Any minMatches="2">
          <Match idRef="Keyword_canada_phin" />
          <Match idRef="Keyword_canada_provinces" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_canada_phin

Keyword_canada_provinces

social insurance number

health information act

income tax information

manitoba health

health registration

prescription purchases

benefit eligibility

personal health

power of attorney

registration number

personal health number

practitioner referral

wellness professional

patient referral

health and wellness

Nunavut

Quebec

Northwest Territories

Ontario

British Columbia

Alberta

Saskatchewan

Manitoba

Yukon

Newfoundland and Labrador

New Brunswick

Nova Scotia

Prince Edward Island

Canada

Формат

Девять цифр, которые могут разделяться дефисами или пробелами.

Шаблон

Форматированный:

  • три цифры;

  • дефис или пробел;

  • три цифры;

  • дефис или пробел;

  • три цифры.

Неформатированный:

  • девять цифр.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_canadian_sin находит содержимое, соответствующее шаблону;

  • выполняются хотя бы два из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_sin;

    • обнаруживается ключевое слово из списка Keyword_sin_collaborative;

    • функция Func_eu_date находит дату в правильном формате;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_unformatted_canadian_sin находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_sin;

  • проверка контрольной суммы проходит успешно.

<!-- Canada Social Insurance Number -->
<Entity id="a2f29c85-ecb8-4514-a610-364790c0773e" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_canadian_sin" />
        <Any minMatches="2">
          <Match idRef="Keyword_sin" />
          <Match idRef="Keyword_sin_collaborative" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_canadian_sin" />
        <Match idRef="Keyword_sin" />
  </Pattern>
</Entity>

Ключевые слова

Keyword_sin

Keyword_sin_collaborative

sin

social insurance

numero d'assurance sociale

sins

ssn

ssns

social security

numero d'assurance social

national identification number

national id

sin#

soc ins

social ins

driver's license

drivers license

driver's licence

drivers licence

DOB

Birthdate

Birthday

Date of Birth

Формат

7–8 цифр с разделителями, а также контрольная цифра или буква.

Шаблон

7–8 цифр с разделителями:

  • 1–2 цифры;

  • точка;

  • три цифры;

  • точка;

  • три цифры;

  • тире;

  • контрольная цифра или буква (без учета регистра).

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_chile_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_chile_id_card;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_chile_id_card находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Chile Identity Card Number -->
<Entity id="4e979794-49a0-407e-a0b9-2c536937b925" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_chile_id_card"/>
     <Match idRef="Keyword_chile_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_chile_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_chile_id_card

National Identification Number

Identity card

ID

Identification

Rol Único Nacional

RUN

Rol Único Tributario

RUT

Cédula de Identidad

Número De Identificación Nacional

Tarjeta de identificación

Identificación

Формат

18 цифр.

Шаблон

18 цифр:

  • шесть цифр — код адреса;

  • восемь цифр в формате ГГГГММДД — дата рождения;

  • три цифры — серия карты;

  • контрольная цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_china_resident_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_china_resident_id;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_china_resident_id находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- China Resident Identity Card (PRC) Number -->
<Entity id="c92daa86-2d16-4871-901f-816b3f554fc1" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_china_resident_id"/>
     <Match idRef="Keyword_china_resident_id"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_china_resident_id"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_china_resident_id

Resident Identity Card

PRC

National Identification Card

身份证

居民 身份证

居民身份证

鉴定

身分證

居民 身份證

鑑定

Формат

14 цифр, которые могут быть форматированными или неформатированными (цццццццццццццц), а также должны пройти проверку алгоритмом Луна.

Шаблон

Крайне сложный и надежный шаблон, с помощью которого распознаются все распространенные кредитные карты, включая Visa, MasterCard, Discover Card, JCB, American Express, подарочные карты и карты Diners Club.

Контрольная сумма

Да (рассчитывается по алгоритму Луна)

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_credit_card находит содержимое, соответствующее шаблону;

  • выполняется одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_cc_verification;

    • обнаруживается ключевое слово из списка Keyword_cc_name;

    • функция Func_expiration_date находит дату в правильном формате;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_credit_card находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Credit Card Number -->
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_credit_card" />
  </Pattern>
</Entity>

Ключевые слова

Keyword_cc_verification

Keyword_cc_name

card verification

card identification number

cvn

cid

cvc2

cvv2

pin block

security code

security number

security no

issue number

issue no

cryptogramme

numéro de sécurité

numero de securite

kreditkartenprüfnummer

kreditkartenprufnummer

prüfziffer

prufziffer

sicherheits Kode

sicherheitscode

sicherheitsnummer

verfalldatum

codice di verifica

cod. sicurezza

cod sicurezza

n autorizzazione

código

codigo

cod. seg

cod seg

código de segurança

codigo de seguranca

codigo de segurança

código de seguranca

cód. segurança

cod. seguranca cod. segurança

cód. seguranca

cód segurança

cod seguranca cod segurança

cód seguranca

número de verificação

numero de verificacao

ablauf

gültig bis

gültigkeitsdatum

gultig bis

gultigkeitsdatum

scadenza

data scad

fecha de expiracion

fecha de venc

vencimiento

válido hasta

valido hasta

vto

data de expiração

data de expiracao

data em que expira

validade

valor

vencimento

Venc

amex

american express

americanexpress

Visa

mastercard

master card

mc

mastercards

master cards

diner's Club

diners club

dinersclub

discover card

discovercard

discover cards

JCB

japanese card bureau

carte blanche

carteblanche

credit card

cc#

cc#:

expiration date

exp date

expiry date

date d’expiration

date d'exp

date expiration

bank card

bankcard

card number

card num

cardnumber

cardnumbers

card numbers

creditcard

credit cards

creditcards

ccn

card holder

cardholder

card holders

cardholders

check card

checkcard

check cards

checkcards

debit card

debitcard

debit cards

debitcards

atm card

atmcard

atm cards

atmcards

enroute

en route

card type

carte bancaire

carte de crédit

carte de credit

numéro de carte

numero de carte

nº de la carte

nº de carte

kreditkarte

karte

karteninhaber

karteninhabers

kreditkarteninhaber

kreditkarteninstitut

kreditkartentyp

eigentümername

kartennr

kartennummer

kreditkartennummer

kreditkarten-nummer

carta di credito

carta credito

n. carta

n carta

nr. carta

nr carta

numero carta

numero della carta

numero di carta

tarjeta credito

tarjeta de credito

tarjeta crédito

tarjeta de crédito

tarjeta de atm

tarjeta atm

tarjeta debito

tarjeta de debito

tarjeta débito

tarjeta de débito

nº de tarjeta

no. de tarjeta

no de tarjeta

numero de tarjeta

número de tarjeta

tarjeta no

tarjetahabiente

cartão de crédito

cartão de credito

cartao de crédito

cartao de credito

cartão de débito

cartao de débito

cartão de debito

cartao de debito

débito automático

debito automatico

número do cartão

numero do cartão

número do cartao

numero do cartao

número de cartão

numero de cartão

número de cartao

numero de cartao

nº do cartão

nº do cartao

nº. do cartão

no do cartão

no do cartao

no. do cartão

no. do cartao

Формат

Девять цифр

Шаблон

Девять цифр без разделителей

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_croatia_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_croatia_id_card.

<!--Croatia Identity Card Number-->
<Entity id="ff12f884-c20a-4189-b185-34c8e7258d47" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_id_card"/>
     <Match idRef="Keyword_croatia_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_croatia_id_card

Croatian identity card

Osobna iskaznica

Формат

10 цифр.

Шаблон

10 цифр:

  • шесть цифр — дата рождения в формате ДДММГГ;

  • четыре цифры, последняя из которых — контрольная.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_croatia_oib_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_croatia_oib_number;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_croatia_oib_number находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Croatia Personal Identification (OIB) Number -->
<Entity id="31983b6d-db95-4eb2-a630-b44bd091968d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_croatia_oib_number"/>
     <Match idRef="Keyword_croatia_oib_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_croatia_oib_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_croatia_oib_number

Personal Identification Number

Osobni identifikacijski broj

OIB

Формат

10 цифр с косой чертой.

Шаблон

10 цифр:

  • шесть цифр — дата рождения;

  • косая черта;

  • четыре цифры, последняя из которых — контрольная.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_czech_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_czech_id_card;

  • проверка контрольной суммы проходит успешно.

<!-- Czech National Identity Card Number -->
<Entity id="60c0725a-4eb6-455b-9dda-05d8a7396497" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_czech_id_card"/>
     <Match idRef="Keyword_czech_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_czech_id_card

Czech national identity card

Občanský průka

Формат

10 цифр с дефисом.

Шаблон

10 цифр:

  • шесть цифр — дата рождения в формате ДДММГГ;

  • дефис;

  • четыре цифры, последняя из которых — контрольная.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_denmark_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_denmark_id;

  • проверка контрольной суммы проходит успешно.

<!-- Denmark Personal Identification Number -->
<Entity id="6c4f2fef-56e1-4c00-8093-88d7a01cf460" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_denmark_id"/>
     <Match idRef="Keyword_denmark_id"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_denmark_id

Personal Identification Number

CPR

Det Centrale Personregister

Personnummer

Формат

Две буквы и семь цифр.

Шаблон

Номер в Управлении по борьбе с наркотиками США записывается в следующем порядке:

  • одна буква (без учета регистра) из набора abcdefghjklmnprstux — код регистрируемого;

  • одна буква (без учета регистра) — первая буква фамилии регистрируемого;

  • семь цифр, последняя из которых — контрольная.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_dea_number находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- DEA Number -->
<Entity id="9a5445ad-406e-43eb-8bd7-cac17ab6d0e4" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_dea_number"/>
  </Pattern>
</Entity>

Ключевые слова

Нет

Формат

16 цифр

Шаблон

Крайне сложный и надежный шаблон

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_eu_debit_card находит содержимое, соответствующее шаблону;

  • выполняется хотя бы одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_eu_debit_card;

    • обнаруживается ключевое слово из списка Keyword_card_terms_dict;

    • обнаруживается ключевое слово из списка Keyword_card_security_terms_dict;

    • обнаруживается ключевое слово из списка Keyword_card_expiration_terms_dict;

    • функция Func_expiration_date находит дату в правильном формате;

  • проверка контрольной суммы проходит успешно.

    <!-- EU Debit Card Number -->
    <Entity id="0e9b3178-9678-47dd-a509-37222ca96b42" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_eu_debit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_eu_debit_card" />
          <Match idRef="Keyword_card_terms_dict" />
          <Match idRef="Keyword_card_security_terms_dict" />
          <Match idRef="Keyword_card_expiration_terms_dict" />
          <Match idRef="Func_expiration_date" />
        </Any>
      </Pattern>
    </Entity>

Ключевые слова

Keyword_eu_debit_card

Keyword_card_terms_dict

Keyword_card_security_terms_dict

Keyword_card_expiration_terms_dict

account number

card number

card no.

security number

cc#

acct nbr

acct num

acct no

american express

americanexpress

americano espresso

amex

atm card

atm cards

atm kaart

atmcard

atmcards

atmkaart

atmkaarten

bancontact

bank card

bankkaart

card holder

card holders

card num

card number

card numbers

card type

cardano numerico

cardholder

cardholders

cardnumber

cardnumbers

carta bianca

carta credito

carta di credito

cartao de credito

cartao de crédito

cartao de debito

cartao de débito

carte bancaire

carte blanche

carte bleue

carte de credit

carte de crédit

carte di credito

carteblanche

cartão de credito

cartão de crédito

cartão de debito

cartão de débito

cb

ccn

check card

check cards

checkcard

checkcards

chequekaart

cirrus

cirrus-edc-maestro

controlekaart

controlekaarten

credit card

credit cards

creditcard

creditcards

debetkaart

debetkaarten

debit card

debit cards

debitcard

debitcards

debito automatico

diners club

dinersclub

discover

discover card

discover cards

discovercard

discovercards

débito automático

edc

eigentümername

european debit card

hoofdkaart

hoofdkaarten

in viaggio

japanese card bureau

japanse kaartdienst

jcb

kaart

kaart num

kaartaantal

kaartaantallen

kaarthouder

kaarthouders

karte

karteninhaber

karteninhabers

kartennr

kartennummer

kreditkarte

kreditkarten-nummer

kreditkarteninhaber

kreditkarteninstitut

kreditkartennummer

kreditkartentyp

maestro

master card

master cards

mastercard

mastercards

mc

mister cash

n carta

n. carta

no de tarjeta

no do cartao

no do cartão

no. de tarjeta

no. do cartao

no. do cartão

nr carta

nr. carta

numeri di scheda

numero carta

numero de cartao

numero de carte

numero de cartão

numero de tarjeta

numero della carta

numero di carta

numero di scheda

numero do cartao

numero do cartão

numéro de carte

nº carta

nº de carte

nº de la carte

nº de tarjeta

nº do cartao

nº do cartão

nº. do cartão

número de cartao

número de cartão

número de tarjeta

número do cartao

scheda dell'assegno

scheda dell'atmosfera

scheda dell'atmosfera

scheda della banca

scheda di controllo

scheda di debito

scheda matrice

schede dell'atmosfera

schede di controllo

schede di debito

schede matrici

scoprono la scheda

scoprono le schede

solo

supporti di scheda

supporto di scheda

switch

tarjeta atm

tarjeta credito

tarjeta de atm

tarjeta de credito

tarjeta de debito

tarjeta debito

tarjeta no

tarjetahabiente

tipo della scheda

ufficio giapponese della

scheda

v pay

v-pay

visa

visa plus

visa electron

visto

visum

vpay

card identification number

card verification

cardi la verifica

cid

cod seg

cod seguranca

cod segurança

cod sicurezza

cod. seg

cod. seguranca

cod. segurança

cod. sicurezza

codice di sicurezza

codice di verifica

codigo

codigo de seguranca

codigo de segurança

crittogramma

cryptogram

cryptogramme

cv2

cvc

cvc2

cvn

cvv

cvv2

cód seguranca

cód segurança

cód. seguranca

cód. segurança

código

código de seguranca

código de segurança

de kaart controle

geeft nr uit

issue no

issue number

kaartidentificatienummer

kreditkartenprufnummer

kreditkartenprüfnummer

kwestieaantal

no. dell'edizione

no. di sicurezza

numero de securite

numero de verificacao

numero dell'edizione

numero di identificazione della

scheda

numero di sicurezza

numero van veiligheid

numéro de sécurité

nº autorizzazione

número de verificação

perno il blocco

pin block

prufziffer

prüfziffer

security code

security no

security number

sicherheits kode

sicherheitscode

sicherheitsnummer

speldblok

veiligheid nr

veiligheidsaantal

veiligheidscode

veiligheidsnummer

verfalldatum

ablauf

data de expiracao

data de expiração

data del exp

data di exp

data di scadenza

data em que expira

data scad

data scadenza

date de validité

datum afloop

datum van exp

de afloop

espira

espira

exp date

exp datum

expiration

expire

expires

expiry

fecha de expiracion

fecha de venc

gultig bis

gultigkeitsdatum

gültig bis

gültigkeitsdatum

la scadenza

scadenza

valable

validade

valido hasta

valor

venc

vencimento

vencimiento

verloopt

vervaldag

vervaldatum

vto

válido hasta

Формат

Шесть цифр, а также символ, обозначающий век, три дополнительные цифры и контрольная цифра.

Шаблон

Национальный идентификационный номер гражданина Финляндии записывается в следующем порядке:

  • шесть цифр — дата рождения в формате ДДММГГ;

  • символ, обозначающий век ("-", "+" или "a");

  • трехзначный личный идентификационный номер;

  • контрольная цифра или буква (с учетом регистра).

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_finnish_national_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_finnish_national_id;

  • проверка контрольной суммы проходит успешно.

<!-- Finnish National ID-->
<Entity id="338FD995-4CB5-4F87-AD35-79BD1DD926C1" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_finnish_national_id" />
          <Match idRef="Keyword_finnish_national_id" />
  </Pattern>
</Entity>

Ключевые слова

Keyword_finnish_national_id

Sosiaaliturvatunnus

SOTU Henkilötunnus HETU

Personbeteckning

Personnummer

Формат

Сочетание из девяти букв и цифр.

Шаблон

Сочетание из девяти букв и цифр:

  • две буквы (без учета регистра);

  • семь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_finland_passport_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_finland_passport_number.

<!-- Finland Passport Number -->
<Entity id="d1685ac3-1d3a-40f8-8198-32ef5669c7a5" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_finland_passport_number"/>
     <Match idRef="Keyword_finland_passport_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_finland_passport_number

Passport

Passi

Формат

12 цифр.

Шаблон

12 цифр, которые проверяются для исключения совпадений с похожими шаблонами (например, используемым для французских номеров телефона).

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков выполняются следующие условия:

  • функция Func_french_drivers_license находит содержимое, соответствующее шаблону;

  • выполняется хотя бы одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_french_drivers_license;

    • функция Func_eu_date находит дату в правильном формате.

<!-- France Driver's License Number -->
<Entity id="18e55a36-a01b-4b0f-943d-dc10282a1824" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_french_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_french_drivers_license" />
          <Match idRef="Func_eu_date" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_french_drivers_license

drivers licence

drivers license

driving licence

driving license

permis de conduire

licence number

license number

licence numbers

license numbers

Формат

12 цифр.

Шаблон

12 цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_france_cni находит содержимое, соответствующее шаблону.

<!-- France CNI -->
<Entity id="f741ac74-1bc0-4665-b69b-f0c7f927c0c4" patternsProximity="300" recommendedConfidence="65">
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Regex_france_cni" />
  </Pattern>
</Entity>

Ключевые слова

Нет.

Формат

Девять цифр и букв.

Шаблон

Девять цифр и букв:

  • две цифры;

  • две буквы (без учета регистра);

  • пять цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_fr_passport находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_passport.

<!-- France Passport Number -->
<Entity id="3008b884-8c8c-4cd8-a289-99f34fc7ff5d" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_fr_passport" />
        <Match idRef="Keyword_passport" />
  </Pattern>
</Entity>

Ключевые слова

Keyword_passport

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート #

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

Формат

15 цифр.

Шаблон

Один из двух шаблонов:

  • 13 цифр, после которых через пробел следуют еще две цифры;

  • 15 цифр без разделителей.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 95 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_french_insee или Func_fr_insee находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_fr_insee;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_french_insee или Func_fr_insee находит содержимое, соответствующее шаблону;

  • не обнаруживается ни одного ключевого слова из списка Keyword_fr_insee;

  • проверка контрольной суммы проходит успешно.

<!-- France INSEE -->
<Entity id="71f62b97-efe0-4aa1-aa49-e14de253619d" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="95">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="1">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_french_insee" />
        <Match idRef="Func_fr_insee" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_fr_insee" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_fr_insee

insee

securité sociale

securite sociale

national id

national identification

numéro d'identité

no d'identité

no. d'identité

numero d'identite

no d'identite

no. d'identite

social security number

social security code

social insurance number

le numéro d'identification nationale

d'identité nationale

numéro de sécurité sociale

le code de la sécurité sociale

numéro d'assurance sociale

numéro de sécu

code sécu

Формат

Сочетание из 11 цифр и букв.

Шаблон

11 цифр и букв (без учета регистра):

  • одна цифра или буква;

  • две цифры;

  • шесть цифр или букв;

  • одна цифра;

  • одна цифра или буква.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_german_drivers_license находит содержимое, соответствующее шаблону;

  • выполняется хотя бы одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_german_drivers_license_number;

    • обнаруживается ключевое слово из списка Keyword_german_drivers_license_collaborative;

    • обнаруживается ключевое слово из списка Keyword_german_drivers_license;

  • проверка контрольной суммы проходит успешно.

<!-- German Driver's License Number -->
<Entity id="91da9335-1edb-45b7-a95f-5fe41a16c63c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_drivers_license" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_drivers_license_number" />
          <Match idRef="Keyword_german_drivers_license_collaborative" />
          <Match idRef="Keyword_german_drivers_license" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_german_drivers_license_number

Keyword_german_drivers_license_collaborative

Keyword_german_drivers_license

Führerschein

Fuhrerschein

Fuehrerschein

Führerscheinnummer

Fuhrerscheinnummer

Fuehrerscheinnummer

Führerschein-

Fuhrerschein-

Fuehrerschein-

FührerscheinnummerNr

FuhrerscheinnummerNr

FuehrerscheinnummerNr

FührerscheinnummerKlasse

FuhrerscheinnummerKlasse

FuehrerscheinnummerKlasse

Führerschein- Nr

Fuhrerschein- Nr

Fuehrerschein- Nr

Führerschein- Klasse

Fuhrerschein- Klasse

Fuehrerschein- Klasse

FührerscheinnummerNr

FuhrerscheinnummerNr

FuehrerscheinnummerNr

FührerscheinnummerKlasse

FuhrerscheinnummerKlasse

FuehrerscheinnummerKlasse

Führerschein- Nr

Fuhrerschein- Nr

Fuehrerschein- Nr

Führerschein- Klasse

Fuhrerschein- Klasse

Fuehrerschein- Klasse

DL

DLS

Driv Lic

Driv Licen

Driv License

Driv Licenses

Driv Licence

Driv Licences

Driv Lic

Driver Licen

Driver License

Driver Licenses

Driver Licence

Driver Licences

Drivers Lic

Drivers Licen

Drivers License

Drivers Licenses

Drivers Licence

Drivers Licences

Driver's Lic

Driver's Licen

Driver's License

Driver's Licenses

Driver's Licence

Driver's Licences

Driving Lic

Driving Licen

Driving License

Driving Licenses

Driving Licence

Driving Licences

Nr-Führerschein

Nr-Fuhrerschein

Nr-Fuehrerschein

No-Führerschein

No-Fuhrerschein

No-Fuehrerschein

N-Führerschein

N-Fuhrerschein

N-Fuehrerschein

Nr-Führerschein

Nr-Fuhrerschein

Nr-Fuehrerschein

No-Führerschein

No-Fuhrerschein

No-Fuehrerschein

N-Führerschein

N-Fuhrerschein

N-Fuehrerschein

ausstellungsdatum

ausstellungsort

ausstellende behöde

ausstellende behorde

ausstellende behoerde

Формат

10 цифр и букв;

Шаблон

Национальный идентификационный номер гражданина Финляндии записывается в следующем порядке:

  • первый символ — цифра или буква (C, F, G, H, J или K);

  • три цифры;

  • пять цифр или букв из следующего набора: C-H, J-N, P, R, T, V-Z;

  • одна цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_german_passport находит содержимое, соответствующее шаблону;

  • обнаруживается любое ключевое слово из пяти соответствующих списков;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_german_passport_data находит содержимое, соответствующее шаблону;

  • обнаруживается любое ключевое слово из пяти соответствующих списков;

  • проверка контрольной суммы проходит успешно.

<!-- German Passport Number -->
<Entity id="2e3da144-d42b-47ed-b123-fbf78604e52c" patternsProximity="300" recommendedConfidence="75">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_german_passport" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_german_passport_data" />
        <Any minMatches="1">
          <Match idRef="Keyword_german_passport" />
          <Match idRef="Keyword_german_passport_collaborative" />
          <Match idRef="Keyword_german_passport_number" />
          <Match idRef="Keyword_german_passport1" />
          <Match idRef="Keyword_german_passport2" />
        </Any>
  </Pattern>
</Entity>

Ключевые слова

Keyword_german_passport

Keyword_german_passport_collaborative

Keyword_german_passport_number

Keyword_german_passport1

Keyword_german_passport2

reisepass

reisepasse

reisepassnummer

passport

passports

geburtsdatum

ausstellungsdatum

ausstellungsort

No-Reisepass

Nr-Reisepass

Reisepass-Nr

bnationalit.t

Формат

С 1 ноября 2010 г.:

девять букв и цифр.

С 1 апреля 1987 г. до 31 октября 2010 г.:

10 цифр.

Шаблон

С 1 ноября 2010 г.:

  • одна буква (без учета регистра);

  • восемь цифр.

С 1 апреля 1987 г. до 31 октября 2010 г.:

  • 10 цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_germany_id_card находит содержимое, которое соответствует шаблону;

  • находится ключевое слово из Keyword_germany_id_card.

<!-- Germany Identity Card Number -->
<Entity id="e577372f-c42e-47a0-9d85-bebed1c237d4" recommendedConfidence="65" patternsProximity="300">
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Regex_germany_id_card"/>
     <Match idRef="Keyword_germany_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_germany_id_card

Identity Card

ID

Identification

Personalausweis

Identifizierungsnummer

Ausweis

Identifikation

Формат

Сочетание из 7–8 букв и цифр, разделенных одним тире.

Шаблон

Семь букв и цифр (старый формат):

  • любая буква греческого алфавита;

  • тире;

  • шесть цифр;

Восемь букв и цифр (новый формат):

  • две буквы, которые в прописном виде есть как в греческом, так и в латинском алфавите (ABEZHIKMNOPTYX);

  • тире;

  • шесть цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_greece_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_greece_id_card.

<!-- Greece National ID Card -->
<Entity id="82568215-1da1-46d3-874a-d2294d81b5ac" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_greece_id_card"/>
     <Match idRef="Keyword_greece_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_greece_id_card

Greek identity Card

Tautotita

Δελτίο αστυνομικής ταυτότητας

Ταυτότητα

Формат

Сочетание из 8–9 букв и цифр (последний символ может заключаться в скобки).

Шаблон

Сочетание из 8–9 букв:

  • 1–2 буквы (без учета регистра);

  • шесть цифр;

  • контрольный символ (любая цифра или буква A), который может заключаться в скобки.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_hong_kong_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_hong_kong_id_card;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_hong_kong_id_card находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Hong Kong Identity Card (HKID) number -->
<Entity id="e63c28a7-ad29-4c17-a41a-3d2a0b70fd9c" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_hong_kong_id_card"/>
     <Match idRef="Keyword_hong_kong_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_hong_kong_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_hong_kong_id_card

Hong Kong Identity Card

HKID

ID card

香港身份證

香港永久性居民身份證

Формат

10 букв или цифр.

Шаблон

10 букв или цифр:

  • пять букв (без учета регистра);

  • четыре цифры;

  • контрольная буква.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_india_permanent_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_india_permanent_account_number;

  • проверка контрольной суммы проходит успешно.

<!-- India Permanent Account Number -->
<Entity id="2602bfee-9bb0-47a5-a7a6-2bf3053e2804" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_india_permanent_account_number"/>
     <Match idRef="Keyword_india_permanent_account_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_india_permanent_account_number

Permanent Account Number

PAN

Формат

12 цифр, которые могут разделяться пробелами или тире.

Шаблон

12 цифр:

  • четыре цифры;

  • пробел или тире (необязательно);

  • четыре цифры;

  • пробел или тире (необязательно);

  • контрольная цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_india_aadhaar находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_india_aadhar;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_india_aadhaar находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- India Unique Identification (Aadhaar) number -->
<Entity id="1ca46b29-76f5-4f46-9383-cfa15e91048f" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_india_aadhaar"/>
     <Match idRef="Keyword_india_aadhar"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_india_aadhaar"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_india_aadhar

Aadhar

Aadhaar

UID

आधार

Формат

16 цифр, которые могут разделяться точками.

Шаблон

16 цифр:

  • две цифры — код провинции;

  • точка (необязательно);

  • две цифры — код округа или города;

  • две цифры — код района;

  • точка (необязательно);

  • шесть цифр — дата рождения в формате ДДММГГ;

  • точка (необязательно);

  • четыре цифры.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_indonesia_id_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_indonesia_id_card.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_indonesia_id_card находит содержимое, соответствующее шаблону.

<!-- Indonesia Identity Card (KTP) Number -->
<Entity id="da68fdb0-f383-4981-8c86-82689d3b7d55" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_indonesia_id_card"/>
     <Match idRef="Keyword_indonesia_id_card"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_indonesia_id_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_indonesia_id_card

KTP

Kartu Tanda Penduduk

Nomor Induk Kependudukan

Формат

Код страны (две буквы), а также проверочные цифры (две) и номер bban (до 30 символов)

Шаблон

Национальный идентификационный номер гражданина Финляндии записывается в следующем порядке:

  • Двухбуквенный код страны

  • Две проверочные цифры (после которых может следовать пробел)

  • 1–7 групп из четырех букв или цифр (могут разделяться пробелами)

  • 1–3 буквы или цифры.

Формат для названия каждой из стран немного отличается. Тип конфиденциальной информации IBAN применяется к следующим 60 странам:

ad, ae, al, at, az, ba, be, bg, bh, ch, cr, cy, cz, de, dk, do, ee, es, fi, fo, fr, gb, ge, gi, gl, gr, hr, hu, ie, il, is, it, kw, kz, lb, li, lt, lu, lv, mc, md, me, mk, mr, mt, mu, nl, no, pl, pt, ro, rs, sa, se, si, sk, sm, tn, tr, vg

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_iban находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<Entity id="e7dc4711-11b7-4cb0-b88b-2c394a771f0e" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_iban" />
  </Pattern>
</Entity>

Ключевые слова

Нет.

Формат

IPv4:

  • сложный шаблон, лежащий в основе форматированных (с точками) и неформатированных (без точек) версий IPv4-адресов.

IPv6:

  • сложный шаблон, лежащий в основе форматированных IPv6-адресов (записанных с двоеточиями).

Шаблон

Контрольная сумма

Нет

Определение

Политика защиты от потери данных для IPv6 с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_ipv6_address находит содержимое, соответствующее шаблону;

  • не обнаруживается ни одного ключевого слова из списка Keyword_ipaddress.

Политика защиты от потери данных для IPv4 с вероятностью 95 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_ipv4_address находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_ipaddress.

Политика защиты от потери данных для IPv6 с вероятностью 95 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_ipv6_address находит содержимое, соответствующее шаблону;

  • не обнаруживается ни одного ключевого слова из списка Keyword_ipaddress.

    <!-- IP Address -->
    <Entity id="1daa4ad5-e2dd-4ca4-a788-54722c09efb2" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_ipaddress" />
        </Any>
      </Pattern>
      <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv4_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
      </Pattern>
      <Pattern confidenceLevel="95">
        <IdMatch idRef="Regex_ipv6_address" />
        <Any minMatches="1">
          <Match idRef="Keyword_ipaddress" />
        </Any>
      </Pattern>
    </Entity>

Ключевые слова

Keyword_ipaddress

IP (с учетом регистра)

ip address

ip addresses

internet protocol

IP-כתובת ה

Форматирование

Dictionary

Шаблон

Ключевое слово

Контрольная сумма

no

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • Ключевое слово из Dictionary_icd_10_cm найти.

      <!-- ICD-10 CM -->
      <Entity id="3356946c-6bb7-449b-b253-6ffa419c0ce7" patternsProximity="300" recommendedConfidence="85">
        <Pattern confidenceLevel="85">
          <IdMatch idRef="Dictionary_icd_10_cm" />
        </Pattern>
      </Entity>

Ключевые слова

Любой термин из словаря Dictionary_icd_10_cm ключевое слово, которого зависит от Международная классификация из заболеваниями, версия десятой клинического изменения (ICD 10 см). Этот тип поиск только термин, не страхования коды.

Форматирование

Dictionary

Шаблон

Ключевое слово

Контрольная сумма

no

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • Ключевое слово из Dictionary_icd_9_cm найти.

      <Entity id="fa3f9c74-ee07-4c52-b5f2-085d6b2c0ec4" patternsProximity="300" recommendedConfidence="85">
        <Pattern confidenceLevel="85">
          <IdMatch idRef="Dictionary_icd_9_cm" />
        </Pattern>
      </Entity>

Ключевые слова

Любой термин из словаря Dictionary_icd_9_cm ключевое слово, которого зависит от Международная классификация из заболеваниями, версия девятый клинического изменения (ICD 9 см). Этот тип поиск только термин, не страхования коды.

Формат

Старый формат (до 31.12.2012):

семь цифр и 1–2 буквы.

Новый формат (с 01.01.2013):

семь цифр и две буквы.

Шаблон

Старый формат (до 31.12.2012):

  • семь цифр;

  • 1–2 буквы (без учета регистра).

Новый формат (с 01.01.2013):

  • семь цифр;

  • контрольная буква (без учета регистра);

  • буква А или H (без учета регистра).

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_ireland_pps находит содержимое, соответствующее шаблону;

  • выполняется одно из следующих условий:

    • обнаруживается ключевое слово из спискаKeyword_ireland_pps;

    • функцияFunc_eu_date находит дату в правильном формате;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_ireland_pps находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Ireland Personal Public Service (PPS) Number -->
<Entity id="1cdb674d-c19a-4fcf-9f4b-7f56cc87345a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_ireland_pps"/>
     <Any minMatches="1">
  <Match idRef="Keyword_ireland_pps"/>
  <Match idRef="Func_eu_date"/>
     </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_ireland_pps"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_ireland_pps

Personal Public Service Number

PPS Number

PPS Num

PPS No.

PPS #

PPS#

PPSN

Public Services Card

Uimhir Phearsanta Seirbhíse Poiblí

Uimh. PSP

PSP

Формат

13 цифр.

Шаблон

Форматированный:

  • две цифры;

  • тире;

  • три цифры;

  • тире;

  • восемь цифр.

Неформатированный:

  • 13 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_israel_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_israel_bank_account_number.

<!-- Israel Bank Account Number -->
<Entity id="7d08b2ff-a0b9-437f-957c-aeddbf9b2b25" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_israel_bank_account_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_israel_bank_account_number" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_israel_bank_account_number

Bank Account Number

Bank Account

Account Number

מספר חשבון בנק

Формат

Девять цифр

Шаблон

Девять цифр без разделителей

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_israeli_national_id_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_Israel_National_ID;

  • проверка контрольной суммы проходит успешно.

<!-- Israel National ID Number -->
<Entity id="e05881f5-1db1-418c-89aa-a3ac5c5277ee" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_israeli_national_id_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_Israel_National_ID" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_Israel_National_ID

מספר זהות

National ID Number

Формат

Сочетание из 10 букв и цифр.

Шаблон

Сочетание из 10 букв и цифр:

  • одна буква (без учета регистра);

  • буква А или V (без учета регистра);

  • семь букв (без учета регистра), цифр или символов подчеркивания;

  • одна буква (без учета регистра).

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_italy_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_italy_drivers_license_number.

<!-- Italy Driver's license Number -->
<Entity id="97d6244f-9157-41bd-8e0c-9d669a5c4d71" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_italy_drivers_license_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_italy_drivers_license_number" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_italy_drivers_license_number

numero di patente di guida

patente di guida

Формат

7–8 цифр.

Шаблон

Номер банковского счета:

  • 7–8 цифр.

Код филиала:

  • четыре цифры;

  • пробел или тире (необязательно);

  • три цифры.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_bank_account находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_bank_account;

  • выполняется одно из следующих условий:

    • функция Func_jp_bank_account_branch_code находит содержимое, соответствующее шаблону;

    • обнаруживается ключевое слово из списка Keyword_jp_bank_branch_code.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_bank_account находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_bank_account.

<!-- Japan Bank Account Number -->
<Entity id="d354f95b-96ee-4b80-80bc-4377312b55bc" patternsProximity="300" recommendedConfidence="75">
  <Version minEngineVersion="15.01.0131.000">
    <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_jp_bank_account" />
          <Match idRef="Keyword_jp_bank_account" />
          <Any minMatches="1">
            <Match idRef="Func_jp_bank_account_branch_code" />
            <Match idRef="Keyword_jp_bank_branch_code" />
          </Any>
      </Pattern>
  </Version>    
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_bank_account" />
        <Match idRef="Keyword_jp_bank_account" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_jp_bank_account

Keyword_jp_bank_branch_code

Checking Account Number

Checking Account

Checking Account #

Checking Acct Number

Checking Acct #

Checking Acct No.

Checking Account No.

Bank Account Number

Bank Account

Bank Account #

Bank Acct Number

Bank Acct #

Bank Acct No.

Bank Account No.

Savings Account Number

Savings Account

Savings Account #

Savings Acct Number

Savings Acct #

Savings Acct No.

Savings Account No.

Debit Account Number

Debit Account

Debit Account #

Debit Acct Number

Debit Acct #

Debit Acct No.

Debit Account No.

口座番号を当座預金口座の確認

#アカウントの確認、勘定番号の確認

#勘定の確認

勘定番号の確認

口座番号の確認

銀行口座番号

銀行口座

銀行口座#

銀行の勘定番号

銀行のacct#

銀行の勘定いいえ

銀行口座番号

普通預金口座番号

預金口座

貯蓄口座#

貯蓄勘定の数

貯蓄勘定#

貯蓄勘定番号

普通預金口座番号

引き落とし口座番号

口座番号

口座番号#

デビットのacct番号

デビット勘定#

デビットACCTの番号

デビット口座番号

Otemachi

Формат

12 цифр.

Шаблон

12 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_drivers_license_number.

<!-- Japan Driver's License Number -->
<Entity id="c6011143-d087-451c-8313-7f6d4aed2270" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_drivers_license_number" />
        <Match idRef ="Keyword_jp_drivers_license_number" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_jp_drivers_license_number

dl#

DL#

dls#

DLS#

driver license

driver licenses

drivers license

driver's license

drivers licenses

driver's licenses

driving licence

lic#

LIC#

lics#

state id

state identification

state identification number

低所得国#

免許証

状態ID

状態の識別

状態の識別番号

運転免許

運転免許証

運転免許証番号

Формат

Две буквы и семь цифр.

Шаблон

Две буквы (без учета регистра), за которыми следуют семь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_passport находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_passport.

<!-- Japan Passport Number -->
<Entity id="75177310-1a09-4613-bf6d-833aae3743f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_passport" />
        <Match idRef="Keyword_jp_passport" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_jp_passport

パスポート

パスポート番号

パスポートのNum

パスポート#

Формат

11 цифр.

Шаблон

11 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_resident_registration_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_resident_registration_number.

<!-- Japan Resident Registration Number -->
<Entity id="01c1209b-6389-4faf-a5f8-3f7e13899652" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_resident_registration_number" />
        <Match idRef ="Keyword_jp_resident_registration_number" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_jp_resident_registration_number

Resident Registration Number

Resident Register Number

Residents Basic Registry Number

Resident Registration No.

Resident Register No.

Residents Basic Registry No.

Basic Resident Register No.

住民登録番号、登録番号をレジデント

住民基本登録番号、登録番号

住民基本レジストリ番号を常駐

登録番号を常駐住民基本台帳登録番号

Формат

7–12 цифр.

Шаблон

7–12 цифр:

  • четыре цифры;

  • дефис (необязательно);

  • шесть цифр;

  • ИЛИ

  • 7–12 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_sin находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_sin.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_jp_sin_pre_1997 находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_jp_sin.

<!-- Japan Social Insurance Number -->
<Entity id="c840e719-0896-45bb-84fd-1ed5c95e45ff" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_jp_sin" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_jp_sin_pre_1997" />
        <Match idRef="Keyword_jp_sin" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_jp_sin

Social Insurance No.

Social Insurance Num

Social Insurance Number

社会保険のテンキー

社会保険番号

Формат

12 цифр, которые могут разделяться дефисами.

Шаблон

12 цифр:

  • шесть цифр — дата рождения в формате ГГММДД;

  • дефис (необязательно);

  • две буквы — код места рождения;

  • дефис (необязательно);

  • три случайные цифры;

  • одна цифра — код пола.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_malaysia_id_card_number находит содержимое, которое соответствует шаблону;

  • находится ключевое слово из Keyword_malaysia_id_card_number.

<!-- Malaysia ID Card Number -->
</Entity>
      <Entity id="7f0e921c-9677-435b-aba2-bb8f1013c749" patternsProximity="300" recommendedConfidence="85">
        <Pattern confidenceLevel="85">
            <IdMatch idRef="Regex_malaysia_id_card_number" />
            <Match idRef="Keyword_malaysia_id_card_number" />
        </Pattern>
</Entity>

Ключевые слова

Keyword_malaysia_id_card_number

MyKad

Identity Card

ID Card

Identification Card

Digital Application Card

Kad Akuan Diri

Kad Aplikasi Digital

Формат

8–9 цифр, которые могут разделяться пробелами.

Шаблон

8–9 цифр:

  • три цифры;

  • пробел (необязательно);

  • три цифры;

  • пробел (необязательно);

  • 2–3 цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_netherlands_bsn находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_netherlands_bsn;

  • функцияFunc_eu_date находит дату в правильном формате;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_netherlands_bsn находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Netherlands Citizen's Service (BSN) Number -->
<Entity id="c5f54253-ef7e-44f6-a578-440ed67e946d" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_netherlands_bsn"/>
     <Match idRef="Keyword_netherlands_bsn"/>
     <Match idRef="Func_eu_date"/>
  </Pattern>
  <Pattern confidenceLevel="65">
     <IdMatch idRef="Func_netherlands_bsn"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_netherlands_bsn

Citizen service number

BSN

Burgerservicenummer

Sofinummer

Persoonsgebonden nummer

Persoonsnummer

Формат

Три буквы, пробел (необязательно) и четыре цифры.

Шаблон

Три буквы (без учета регистра), пробел (необязательно) и четыре цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_new_zealand_ministry_of_health_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_nz_terms;

  • проверка контрольной суммы проходит успешно.

<!-- New Zealand Health Number -->
<Entity id="2b71c1c8-d14e-4430-82dc-fd1ed6bf05c7" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_new_zealand_ministry_of_health_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_nz_terms" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_nz_terms

NHI

New Zealand

Health

treatment

Формат

11 цифр.

Шаблон

11 цифр:

  • шесть цифр — дата рождения в формате ДДММГГ;

  • три цифры — индивидуальный номер;

  • две контрольные цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_norway_id_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_norway_id_numbe;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_norway_id_numbe находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Norway Identification Number -->
<Entity id="d4c8a798-e9f2-4bd3-9652-500d24080fc3" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_norway_id_number"/>
     <Match idRef="Keyword_norway_id_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_norway_id_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_norway_id_number

Personal identification number

Norwegian ID Number

ID Number

Identification

Personnummer

Fødselsnummer

Формат

12 цифр, разделенных дефисами.

Шаблон

12 цифр:

  • четыре цифры;

  • дефис;

  • семь цифр;

  • дефис;

  • одна цифра.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_philippines_unified_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_philippines_id.

<!-- Philippines Unified Multi-Purpose ID number -->
<Entity id="019b39dd-8c25-4765-91a3-d9c6baf3c3b3" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_philippines_unified_id"/>
     <Match idRef="Keyword_philippines_id"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_philippines_id

Unified Multi-Purpose ID

UMID

Identity Card

Pinag-isang Multi-Layunin ID

Формат

Три буквы и шесть цифр.

Шаблон

Три буквы (без учета регистра), за которыми следуют шесть цифр.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_polish_national_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_polish_national_id_passport_number;

  • проверка контрольной суммы проходит успешно.

<!-- Poland Identity Card-->
<Entity id="25E64989-ED5D-40CA-A939-6C14183BB7BF" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_national_id" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>

Ключевые слова

Keyword_polish_national_id_passport_number

Nazwa i nr dowodu tożsamości

Dowód Tożsamości

dow. os.

Формат

11 цифр.

Шаблон

11 цифр без разделителей.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_pesel_identification_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_pesel_identification_number;

  • проверка контрольной суммы проходит успешно.

<!-- Poland National ID (PESEL) -->      
<Entity id="E3AAF206-4297-412F-9E06-BA8487E22456" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_pesel_identification_number" />
          <Match idRef="Keyword_pesel_identification_number" />
      </Pattern>
</Entity>

Ключевые слова

Keyword_pesel_identification_number

Nr PESEL

PESEL

Формат

Две буквы и семь цифр.

Шаблон

Две буквы (без учета регистра), за которыми следуют семь цифр.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_polish_passport_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_polish_national_id_passport_number;

  • проверка контрольной суммы проходит успешно.

<!-- Poland Passport Number -->
<Entity id="03937FB5-D2B6-4487-B61F-0F8BFF7C3517" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_polish_passport_number" />
          <Match idRef="Keyword_polish_national_id_passport_number" />
      </Pattern>
</Entity>
</Version>

Ключевые слова

Keyword_polish_national_id_passport_number

Nazwa i nr dowodu tożsamości

Dowód Tożsamości

dow. os.

Формат

Восемь цифр.

Шаблон

Восемь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_portugal_citizen_card находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_portugal_citizen_card.

<!-- Portugal Citizen Card Number -->
<Entity id="91a7ece2-add4-4986-9a15-c84544d81ecd" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_portugal_citizen_card"/>
     <Match idRef="Keyword_portugal_citizen_card"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_portugal_citizen_card

Citizen Card

National ID Card

CC

Cartão de Cidadão

Bilhete de Identidade

Формат

10 цифр.

Шаблон

10 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_saudi_arabia_national_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_saudi_arabia_national_id.

<!-- Saudi Arabia National ID -->
<Entity id="8c5a0ba8-404a-41a3-8871-746aa21ee6c0" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_saudi_arabia_national_id" />
        <Any minMatches="1">
          <Match idRef="Keyword_saudi_arabia_national_id" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_saudi_arabia_national_id

Identification Card

I card number

ID number

الوطنية الهوية بطاقة رقم

Формат

Девять букв и цифр.

Шаблон

Девять букв и цифр:

  • буква F, G, S или T (без учета регистра);

  • семь цифр;

  • контрольный символ.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_singapore_nric находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_singapore_nric;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_singapore_nric находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Singapore National Registration Identity Card (NRIC) Number -->
<Entity id="cead390a-dd83-4856-9751-fb6dc98c34da" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Regex_singapore_nric"/>
     <Match idRef="Keyword_singapore_nric"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_singapore_nric"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_singapore_nric

National Registration Identity Card

Identity Card Number

NRIC

IC

Foreign Identification Number

FIN

身份证

身份證

Формат

13 цифр, которые могут разделяться пробелами.

Шаблон

13 цифр:

  • шесть цифр — дата рождения в формате ГГММДД;

  • четыре цифры;

  • одна цифра — индикатор гражданства;

  • цифра 8 или 9;

  • контрольная цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_south_africa_identification_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_south_africa_identification_number;

  • проверка контрольной суммы проходит успешно.

<!-- South Africa Identification Number -->
<Entity id="e2adf7cb-8ea6-4048-a2ed-d89eb65f2780" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_africa_identification_number"/>
     <Match idRef="Keyword_south_africa_identification_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_south_africa_identification_number

Identity card

ID

Identification

Формат

13 цифр с дефисом.

Шаблон

13 цифр:

  • шесть цифр — дата рождения в формате ГГММДД;

  • дефис;

  • одна цифра —индикатор века и пола;

  • четыре цифры — код региона рождения;

  • одна цифра — используется для разграничения людей, у которых все предшествующие цифры совпадают;

  • контрольная цифра.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_south_korea_resident_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_south_korea_resident_number;

  • проверка контрольной суммы проходит успешно.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функцияFunc_south_korea_resident_number находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- South Korea Resident Registration Number -->
<Entity id="5b802e18-ba80-44c4-bc83-bf2ad36ae36a" recommendedConfidence="85" patternsProximity="300">
  <Pattern confidenceLevel="85">
     <IdMatch idRef="Func_south_korea_resident_number"/>
     <Match idRef="Keyword_south_korea_resident_number"/>
  </Pattern>
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Func_south_korea_resident_number"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_south_korea_resident_number

National ID card

Citizen's Registration Number

Jumin deungnok beonho

RRN

주민등록번호

Формат

11–12 цифр.

Шаблон

11–12 цифр:

  • две цифры;

  • косая черта (необязательно);

  • 7–8 цифр;

  • косая черта (необязательно);

  • две цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_spanish_social_security_number находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Spain SSN -->
<Entity id="5df987c0-8eae-4bce-ace7-b316347f3070" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_spanish_social_security_number" />
    </Pattern>
</Entity>

Ключевые слова

Нет.

Формат

10 или 12 цифр и один необязательный разделитель.

Шаблон

10 или 12 цифр и один необязательный разделитель:

  • 2–4 цифры (необязательно);

  • шесть цифр — дата в формате ГГММДД;

  • знак "плюс" или "минус" — разделитель (необязательно);

  • четыре цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_swedish_national_identifier находит содержимое, соответствующее шаблону;

  • проверка контрольной суммы проходит успешно.

<!-- Sweden National ID -->
<Entity id="f69aaf40-79be-4fac-8f05-fd1910d272c8" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_swedish_national_identifier" />
    </Pattern>
</Entity>

Ключевые слова

Нет.

Формат

Восемь цифр.

Шаблон

Восемь цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_sweden_passport_number находит содержимое, соответствующее шаблону;

  • выполняется одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_passport;

    • обнаруживается ключевое слово из списка Keyword_sweden_passport.

<!-- Sweden Passport Number -->
<Entity id="ba4e7456-55a9-4d89-9140-c33673553526" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_sweden_passport_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_passport" />
          <Match idRef="Keyword_sweden_passport" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_sweden_passport

Keyword_passport

visa requirements

Alien Registration Card

Schengen visas

Schengen visa

Visa Processing

Visa Type

Single Entry

Multiple Entry

G3 Processing Fees

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート#

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

Формат

Четыре буквы, за которыми следуют от 5 до 31 буквы или цифры

Шаблон

Четыре буквы, за которыми следуют от 5 до 31 буквы или цифры:

  • четыре буквы (без учета регистра) — код банка;

  • пробел (необязательно);

  • от 4 до 28 букв или цифр — основной номер банковского счета (BBAN);

  • пробел (необязательно);

  • от 1 до 3 букв или цифр — оставшаяся часть номера BBAN.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_swift находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_swift.

<Entity id="cb2ab58c-9cb8-4c81-baf8-a4e106791df4" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_swift" />
        <Match idRef="Keyword_swift" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_swift

international organization for standardization 9362

iso 9362

iso9362

swift#

swiftcode

swiftnumber

swiftroutingnumber

swift code

swift number #

swift routing number

bic number

bic code

bic #

bic#

bank identifier code

標準化9362

迅速#

SWIFTコード

SWIFT番号

迅速なルーティング番号

BIC番号

BICコード

銀行識別コードのための国際組織

Organisation internationale de normalisation 9362

rapide #

code SWIFT

le numéro de swift

swift numéro d'acheminement

le numéro BIC

# BIC

code identificateur de banque

Формат

Одна буква из английского алфавита, за которой следуют девять цифр.

Шаблон

Одна буква из английского алфавита, за которой следуют девять цифр:

  • одна буква из английского алфавита (без учета регистра);

  • цифра 1 или 2;

  • восемь цифр.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_taiwanese_national_id находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_taiwanese_national_id;

  • проверка контрольной суммы проходит успешно.

<!-- Taiwanese National ID -->
<Entity id="4C7BFC34-8DD1-421D-8FB7-6C6182C2AF03" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
          <IdMatch idRef="Func_taiwanese_national_id" />
          <Match idRef="Keyword_taiwanese_national_id" />
      </Pattern>
</Entity>

Ключевые слова

Keyword_taiwanese_national_id

身份證字號

身份證

身份證號碼

身份證號

身分證字號

身分證

身分證號碼

身份證號

身分證統一編號

國民身分證統一編號

簽名

蓋章

簽名或蓋章

簽章

Формат

Номер биометрического паспорта:

девять цифр.

Номер обычного паспорта:

девять цифр.

Шаблон

Номер биометрического паспорта:

  • цифра 3;

  • восемь цифр.

Номер обычного паспорта:

  • девять цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_taiwan_passport находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_taiwan_passport.

<!-- Taiwan Passport Number -->
<Entity id="e7251cb4-4c2c-41df-963e-924eb3dae04a" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_passport"/>
     <Match idRef="Keyword_taiwan_passport"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_taiwan_passport

ROC passport number

Passport number

Passport no

Passport Num

Passport #

护照

中華民國護照

Zhōnghuá Mínguó hùzhào

Формат

10 букв и цифр.

Шаблон

10 букв и цифр:

  • две буквы (без учета регистра);

  • восемь цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_taiwan_resident_certificate находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из спискаKeyword_taiwan_resident_certificate.

<!-- Taiwan Resident Certificate (ARC/TARC) -->
<Entity id="48269fec-05ea-46ea-b326-f5623a58c6e9" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
     <IdMatch idRef="Regex_taiwan_resident_certificate"/>
     <Match idRef="Keyword_taiwan_resident_certificate"/>
  </Pattern>
</Entity>

Ключевые слова

Keyword_taiwan_resident_certificate

Resident Certificate

Resident Cert

Resident Cert.

Identification card

Alien Resident Certificate

ARC

Taiwan Area Resident Certificate

TARC

居留證

外僑居留證

台灣地區居留證

Формат

Сочетание из 18 букв и цифр, записанных в определенном формате.

Шаблон

18 букв и цифр:

  • пять символов: буквы (без учета регистра) или цифра 9;

  • одна цифра;

  • пять цифр — дата рождения в формате ДДММГГ;

  • два символа: буквы (без учета регистра) или цифра 9;

  • пять цифр.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_uk_drivers_license находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_uk_drivers_license;

  • проверка контрольной суммы проходит успешно.

<!-- U.K. Driver's License Number -->
<Entity id="f93de4be-d94c-40df-a8be-461738047551" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_drivers_license" />
        <Match idRef="Keyword_uk_drivers_license" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_uk_drivers_license

DVLA

light vans

quadbikes

motor cars

125cc

sidecar

tricycles

motorcycles

photocard licence

learner drivers

licence holder

licence holders

driving licences

driving licence

dual control car

Формат

Две буквы, за которыми следуют от 1 до 4 цифр.

Шаблон

Две буквы (без учета регистра), за которыми следуют от 1 до 4 цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_uk_electoral находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_uk_electoral.

<!-- U.K. Electoral Number -->
<Entity id="a3eea206-dc0c-4f06-9e22-aa1be3059963" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_uk_electoral" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_electoral" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_uk_electoral

council nomination

nomination form

electoral register

electoral roll

Формат

10–17 цифр, разделенных пробелами.

Шаблон

10–17 цифр:

  • 3 или 10 цифр;

  • пробел;

  • три цифры;

  • пробел;

  • четыре цифры.

Контрольная сумма

Да

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_uk_nhs_number находит содержимое, соответствующее шаблону;

  • выполняется одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_uk_nhs_number;

    • обнаруживается ключевое слово из списка Keyword_uk_nhs_number1;

    • обнаруживается ключевое слово из списка Keyword_uk_nhs_number_dob;

  • проверка контрольной суммы проходит успешно.

<!-- U.K. NHS Number -->
<Entity id="3192014e-2a16-44e9-aa69-4b20375c9a78" patternsProximity="300" recommendedConfidence="85">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nhs_number" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nhs_number" />
          <Match idRef="Keyword_uk_nhs_number1" />
          <Match idRef="Keyword_uk_nhs_number_dob" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_uk_nhs_number

Keyword_uk_nhs_number1

Keyword_uk_nhs_number_dob

national health service

nhs

health services authority

health authority

patient id

patient identification

patient no

patient number

GP

DOB

D.O.B

Date of Birth

Birth Date

Формат

14 или 15 символов, разделенных пробелами

Шаблон

14 или 15 символов, разделенных пробелами:

  • двухбуквенный код (без учета регистра);

  • шесть цифр;

  • пробел или тире;

  • две цифры;

  • пробел или тире;

  • две цифры;

  • пробел или тире;

  • две цифры;

  • буква или пробел

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_uk_nino находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_uk_nino.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_uk_nino находит содержимое, соответствующее шаблону;

  • не обнаруживается ни одного ключевого слова из списка Keyword_uk_nino.

<!-- U.K. NINO -->
<Entity id="16c07343-c26f-49d2-a987-3daf717e94cc" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>    
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_uk_nino

national insurance number

national insurance contributions

protection act

insurance

social security number

insurance application

medical application

social insurance

medical attention

social security

great britain

insurance

Формат

Девять цифр

Шаблон

Девять цифр без разделителей

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_usa_uk_passport находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_passport.

<Entity id="178ec42a-18b4-47cc-85c7-d62c92fd67f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_usa_uk_passport" />
        <Match idRef="Keyword_passport" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_passport

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート#

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

Формат

8–17 цифр.

Шаблон

8–17 цифр без разделителей.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • регулярное выражение Regex_usa_bank_account_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_usa_Bank_Account.

<!-- U.S. Bank Account Number -->
<Entity id="a2ce32a8-f935-4bb6-8e96-2a5157672e2c" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_usa_bank_account_number" />
        <Match idRef="Keyword_usa_Bank_Account" />
    </Pattern>
</Entity>

Ключевые слова

Keyword_usa_Bank_Account

Checking Account Number

Checking Account

Checking Account #

Checking Acct Number

Checking Acct #

Checking Acct No.

Checking Account No.

Bank Account Number

Bank Account #

Bank Acct Number

Bank Acct #

Bank Acct No.

Bank Account No.

Savings Account Number

Savings Account.

Savings Account #

Savings Acct Number

Savings Acct #

Savings Acct No.

Savings Account No.

Debit Account Number

Debit Account

Debit Account #

Debit Acct Number

Debit Acct #

Debit Acct No.

Debit Account No.

Формат

Зависит от штата

Шаблон

Зависит от штата. Например, в Нью-Йорке используется следующий порядок:

  • Подойдут девять цифр в формате ццц ццц ццц.

  • Не подойдут девять цифр в формате ццццццццц.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_new_york_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_[state_name]_drivers_license_name;

  • обнаружено ключевое слово из списка Keyword_us_drivers_license.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_new_york_drivers_license_number находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_[state_name]_drivers_license_name;

  • обнаруживается ключевое слово из списка Keyword_us_drivers_license_abbreviations.

  • не обнаруживается ни одного ключевого слова из списка Keyword_us_drivers_license.

    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license" />
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license_abbreviations" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_us_drivers_license" />
        </Any>
    </Pattern>

Ключевые слова

Keyword_us_drivers_license_abbreviations

Keyword_us_drivers_license

Keyword_[state_name]_drivers_license_name

DL

DLS

CDL

CDLS

ID

IDs

DL#

DLS#

CDL#

CDLS#

ID#

IDs#

ID number

ID numbers

LIC

LIC#

DriverLic

DriverLics

DriverLicense

DriverLicenses

Driver Lic

Driver Lics

Driver License

Driver Licenses

DriversLic

DriversLics

DriversLicense

DriversLicenses

Drivers Lic

Drivers Lics

Drivers License

Drivers Licenses

Driver'Lic

Driver'Lics

Driver'License

Driver'Licenses

Driver' Lic

Driver' Lics

Driver' License

Driver' Licenses

Driver'sLic

Driver'sLics

Driver'sLicense

Driver'sLicenses

Driver's Lic

Driver's Lics

Driver's License

Driver's Licenses

identification number

identification numbers

identification #

id card

id cards

identification card

identification cards

DriverLic#

DriverLics#

DriverLicense#

DriverLicenses#

Driver Lic#

Driver Lics#

Driver License#

Driver Licenses#

DriversLic#

DriversLics#

DriversLicense#

DriversLicenses#

Drivers Lic#

Drivers Lics#

Drivers License#

Drivers Licenses#

Driver'Lic#

Driver'Lics#

Driver'License#

Driver'Licenses#

Driver' Lic#

Driver' Lics#

Driver' License#

Driver' Licenses#

Driver'sLic#

Driver'sLics#

Driver'sLicense#

Driver'sLicenses#

Driver's Lic#

Driver's Lics#

Driver's License#

Driver's Licenses#

id card#

id cards#

identification card#

identification cards#

Аббревиатура штата (например, "NY")

Название штата (например, "New York")

Формат

Девять цифр, которые могут разделяться пробелами или тире. (Первая цифра — 9, четвертая — 7 или 8.)

Шаблон

Форматированный:

  • цифра 9;

  • две цифры;

  • пробел или тире;

  • цифра 7 или 8;

  • цифра;

  • пробел или тире;

  • четыре цифры;

Неформатированный:

  • цифра 9;

  • две цифры;

  • цифра 7 или 8;

  • пять цифр.

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_formatted_itin находит содержимое, соответствующее шаблону;

  • выполняется хотя бы одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_itin;

    • функция Func_us_address находит адрес в правильном формате;

    • функция Func_us_date находит дату в правильном формате;

    • обнаруживается ключевое слово из списка Keyword_itin_collaborative.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_unformatted_itin находит содержимое, соответствующее шаблону;

  • выполняется хотя бы одно из следующих условий:

    • обнаруживается ключевое слово из списка Keyword_itin_collaborative.

    • функция Func_us_address находит адрес в правильном формате;

    • функция Func_us_date находит дату в правильном формате;

<!-- U.S. Individual Taxpayer Identification Number (ITIN) -->
<Entity id="e55e2a32-f92d-4985-a35d-a0b269eb687b" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_formatted_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
          <Match idRef="Keyword_itin_collaborative" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_itin" />
        <Match idRef="Keyword_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin_collaborative" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
        </Any>
    </Pattern>
</Entity>

Ключевые слова

Keyword_itin

Keyword_itin_collaborative

taxpayer

tax id

tax identification

itin

ssn

tin

social security

tax payer

itins

taxid

individual taxpayer

License

DL

DOB

Birthdate

Birthday

Date of Birth

Формат

9 цифр по форматированному или неформатированному шаблону

Примечание : Есть SSN выдан до середины 2011 г., он отличается строгим форматированием, при котором определенные части номера должны входить в указанные диапазоны (при этом нет контрольной суммы).

Шаблон

Четыре функции выполняют поиск SSN с использованием четырех разных шаблонов:

  • Func_ssn находит SSN со строгим форматированием с тире или пробелами, выданные до 2011 г. (ццц-цц-цццц ИЛИ ццц цц цццц);

  • Func_unformatted_ssn находит SSN со строгим форматированием, выданные до 2011 г. (без форматирования в виде девяти последовательных цифр — ццццццццц);

  • Func_randomized_formatted_ssn находит SSN с тире или пробелами, выданные после 2011 г. (ццц-цц-цццц ИЛИ ццц цц цццц);

  • Func_randomized_unformatted_ssn находит SSN без форматирования в виде девяти последовательных цифр, выданные после 2011 г. (ццццццццц).

Контрольная сумма

Нет

Определение

Политика защиты от потери данных с вероятностью 85 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_ssn находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_ssn.

Политика защиты от потери данных с вероятностью 75 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • Функция Func_unformatted_ssn находит содержимое, которое соответствует шаблону.

  • обнаруживается ключевое слово из списка Keyword_ssn.

Политика защиты от потери данных с вероятностью 65 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_randomized_formatted_ssn находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_ssn;

  • функция Func_ssn не находит содержимое, соответствующее шаблону.

Политика защиты от потери данных с вероятностью 55 % правильно распознает этот тип конфиденциальной информации, если в пределах 300 знаков:

  • функция Func_randomized_unformatted_ssn находит содержимое, соответствующее шаблону;

  • обнаруживается ключевое слово из списка Keyword_ssn;

  • функция Func_unformatted_ssn не находит содержимое, соответствующее шаблону.

 <!-- U.S. Social Security Number (SSN) -->
    <Entity id="a44669fe-0d48-453d-a9b1-2cc83f2cba77" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_ssn" />
        <Match idRef="Keyword_ssn" />
      </Pattern>
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
      </Pattern>
      <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_randomized_formatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_ssn" />
        </Any>
      </Pattern>
      <Pattern confidenceLevel="55">
        <IdMatch idRef="Func_randomized_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_unformatted_ssn" />
        </Any>
      </Pattern>
    </Entity>

Ключевые слова

Keyword_ssn

Social Security

Social Security#

Soc Sec

SSN

SSNS

SSN#

SS#

SSID

Примечание : Отказ от ответственности относительно машинного перевода. Данная статья была переведена с помощью компьютерной системы без участия человека. Microsoft предлагает эти машинные переводы, чтобы помочь пользователям, которые не знают английского языка, ознакомиться с материалами о продуктах, услугах и технологиях Microsoft. Поскольку статья была переведена с использованием машинного перевода, она может содержать лексические,синтаксические и грамматические ошибки.

Совершенствование навыков
Перейти к обучению
Первоочередный доступ к новым возможностям
Присоединиться к программе предварительной оценки Office

Были ли сведения полезными?

Спасибо за ваш отзыв!

Благодарим за отзыв! Возможно, будет полезно связать вас с одним из наших специалистов службы поддержки Office.

×