Виявлення типів конфіденційної інформації в SharePoint Server 2016

Захист від втрати даних (DLP) у SharePoint Server 2016 поширюється на 10 типів конфіденційної інформації, які передбачено відповідними політиками. У цій статті перелічено всі ці типи, а також описано, як саме політика захисту від втрати даних виявляє кожен із них. Кожен тип конфіденційної інформації визначається за шаблоном, який задається за допомогою регулярного виразу або функції. Для виявлення конфіденційної інформації також можуть застосовуватися додаткові засоби, наприклад пошук ключових слів і перевірка контрольної суми. При цьому враховується показник імовірності та віддаленість слів один від одного в тексті.

Формат

Дев’ять цифр за форматованим або неформатованим шаблоном

Шаблон

Форматований:

  • чотири цифри, які починаються з 0, 1, 2, 3, 6, 7 або 8;

  • дефіс;

  • чотири цифри;

  • дефіс;

  • цифра.

Неформатований:

  • Дев’ять цифр без роздільників, які починаються з 0, 1, 2, 3, 6, 7 або 8.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_aba_routing знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_ABA_Routing.

<!-- ABA Routing Number -->
<Entity id="cb353f78-2b72-4c3c-8827-92ebe4f69fdf" patternsProximity="300" recommendedConfidence="75">
      <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_aba_routing" />
        <Match idRef="Keyword_ABA_Routing" />
      </Pattern>
 </Entity>

Ключові слова

Keyword_ABA_Routing

aba

aba #

aba routing #

aba routing number

aba#

abarouting#

aba number

abaroutingnumber

american bank association routing #

american bank association routing number

americanbankassociationrouting#

americanbankassociationroutingnumber

bank routing number

bankrouting#

bankroutingnumber

routing transit number

RTN

Формат

16 цифр, які можуть бути форматованими або неформатованими (цццццццццццццццц), а також мають пройти перевірку за алгоритмом Луна.

Шаблон

Дуже складний і надійний шаблон, за допомогою якого розпізнаються всі поширені кредитні картки, зокрема Visa, Mastercard, Discover Card, JCB, American Express, подарункові картки та картки Diners Club.

Контрольна сума

Так (розраховується за алгоритмом Луна)

Визначення

Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_credit_card знаходить вміст, який відповідає шаблону;

  • виконується одна з таких умов:

    • виявляється ключове слово зі списку Keyword_cc_verification;

    • виявляється ключове слово зі списку Keyword_cc_name;

    • функція Func_expiration_date знаходить дату в правильному форматі.

  • контрольна сума успішно проходить перевірку.

Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_credit_card знаходить вміст, який відповідає шаблону;

  • контрольна сума успішно проходить перевірку.

<!-- Credit Card Number -->
<Entity id="50842eb7-edc8-4019-85dd-5a5c1f2bb085" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_credit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_cc_verification" />
          <Match idRef="Keyword_cc_name" />
          <Match idRef="Func_expiration_date" />
        </Any>
  </Pattern>
  <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_credit_card" />
  </Pattern>
</Entity>

Ключові слова

Keyword_cc_verification

Keyword_cc_name

card verification

card identification number

cvn

cid

cvc2

cvv2

pin block

security code

security number

security no

issue number

issue no

cryptogramme

numéro de sécurité

numero de securite

kreditkartenprüfnummer

kreditkartenprufnummer

prüfziffer

prufziffer

sicherheits Kode

sicherheitscode

sicherheitsnummer

verfalldatum

codice di verifica

cod. sicurezza

cod sicurezza

n autorizzazione

código

codigo

cod. seg

cod seg

código de segurança

codigo de seguranca

codigo de segurança

código de seguranca

cód. segurança

cod. seguranca cod. segurança

cód. seguranca

cód segurança

cod seguranca cod segurança

cód seguranca

número de verificação

numero de verificacao

ablauf

gültig bis

gültigkeitsdatum

gultig bis

gultigkeitsdatum

scadenza

data scad

fecha de expiracion

fecha de venc

vencimiento

válido hasta

valido hasta

vto

data de expiração

data de expiracao

data em que expira

validade

valor

vencimento

Venc

amex

american express

americanexpress

Visa

mastercard

master card

mc

mastercards

master cards

diner’s Club

diners club

dinersclub

discover card

discovercard

discover cards

JCB

japanese card bureau

carte blanche

carteblanche

credit card

cc#

cc#:

expiration date

exp date

expiry date

date d’expiration

date d’exp

date expiration

bank card

bankcard

card number

card num

cardnumber

cardnumbers

card numbers

creditcard

credit cards

creditcards

ccn

card holder

cardholder

card holders

cardholders

check card

checkcard

check cards

checkcards

debit card

debitcard

debit cards

debitcards

atm card

atmcard

atm cards

atmcards

enroute

en route

card type

carte bancaire

carte de crédit

carte de credit

numéro de carte

numero de carte

nº de la carte

nº de carte

kreditkarte

karte

karteninhaber

karteninhabers

kreditkarteninhaber

kreditkarteninstitut

kreditkartentyp

eigentümername

kartennr

kartennummer

kreditkartennummer

kreditkarten-nummer

carta di credito

carta credito

n. carta

n carta

nr. carta

nr carta

numero carta

numero della carta

numero di carta

tarjeta credito

tarjeta de credito

tarjeta crédito

tarjeta de crédito

tarjeta de atm

tarjeta atm

tarjeta debito

tarjeta de debito

tarjeta débito

tarjeta de débito

nº de tarjeta

no. de tarjeta

no de tarjeta

numero de tarjeta

número de tarjeta

tarjeta no

tarjetahabiente

cartão de crédito

cartão de credito

cartao de crédito

cartao de credito

cartão de débito

cartao de débito

cartão de debito

cartao de debito

débito automático

debito automatico

número do cartão

numero do cartão

número do cartao

numero do cartao

número de cartão

numero de cartão

número de cartao

numero de cartao

nº do cartão

nº do cartao

nº. do cartão

no do cartão

no do cartao

no. do cartão

no. do cartao

Формат

16 цифр

Шаблон

Дуже складний і надійний шаблон

Контрольна сума

Так

Визначення

Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_eu_debit_card знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • виявляється ключове слово зі списку Keyword_eu_debit_card;

    • виявляється ключове слово зі списку Keyword_card_terms_dict;

    • виявляється ключове слово зі списку Keyword_card_security_terms_dict;

    • виявляється ключове слово зі списку Keyword_card_expiration_terms_dict;

    • функція Func_eu_date1 знаходить дату в правильному форматі;

    • функція Func_eu_date2 знаходить дату в правильному форматі.

  • контрольна сума успішно проходить перевірку.

<!-- EU Debit Card Number -->
<Entity id="0e9b3178-9678-47dd-a509-37222ca96b42" patternsProximity="300" recommendedConfidence="85">
  <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_eu_debit_card" />
        <Any minMatches="1">
          <Match idRef="Keyword_eu_debit_card" />
          <Match idRef="Keyword_card_terms_dict" />
          <Match idRef="Keyword_card_security_terms_dict" />
          <Match idRef="Keyword_card_expiration_terms_dict" />
          <Match idRef="Func_expiration_date" />
          <Match idRef="Func_eu_date" />
          <Match idRef="Func_eu_date1" />
          <Match idRef="Func_eu_date2" />
        </Any>
  </Pattern>
</Entity>

Ключові слова

Keyword_eu_debit_card

Keyword_card_terms_dict

Keyword_card_security_terms_dict

Keyword_card_expiration_terms_dict

account number

card number

card no.

security number

cc#

acct nbr

acct num

acct no

american express

americanexpress

americano espresso

amex

atm card

atm cards

atm kaart

atmcard

atmcards

atmkaart

atmkaarten

bancontact

bank card

bankkaart

card holder

card holders

card num

card number

card numbers

card type

cardano numerico

cardholder

cardholders

cardnumber

cardnumbers

carta bianca

carta credito

carta di credito

cartao de credito

cartao de crédito

cartao de debito

cartao de débito

carte bancaire

carte blanche

carte bleue

carte de credit

carte de crédit

carte di credito

carteblanche

cartão de credito

cartão de crédito

cartão de debito

cartão de débito

cb

ccn

check card

check cards

checkcard

checkcards

chequekaart

cirrus

cirrus-edc-maestro

controlekaart

controlekaarten

credit card

credit cards

creditcard

creditcards

debetkaart

debetkaarten

debit card

debit cards

debitcard

debitcards

debito automatico

diners club

dinersclub

discover

discover card

discover cards

discovercard

discovercards

débito automático

edc

eigentümername

european debit card

hoofdkaart

hoofdkaarten

in viaggio

japanese card bureau

japanse kaartdienst

jcb

kaart

kaart num

kaartaantal

kaartaantallen

kaarthouder

kaarthouders

karte

karteninhaber

karteninhabers

kartennr

kartennummer

kreditkarte

kreditkarten-nummer

kreditkarteninhaber

kreditkarteninstitut

kreditkartennummer

kreditkartentyp

maestro

master card

master cards

mastercard

mastercards

mc

mister cash

n carta

n. carta

no de tarjeta

no do cartao

no do cartão

no. de tarjeta

no. do cartao

no. do cartão

nr carta

nr. carta

numeri di scheda

numero carta

numero de cartao

numero de carte

numero de cartão

numero de tarjeta

numero della carta

numero di carta

numero di scheda

numero do cartao

numero do cartão

numéro de carte

nº carta

nº de carte

nº de la carte

nº de tarjeta

nº do cartao

nº do cartão

nº. do cartão

número de cartao

número de cartão

número de tarjeta

número do cartao

scheda dell’assegno

scheda dell’atmosfera

scheda dell’atmosfera

scheda della banca

scheda di controllo

scheda di debito

scheda matrice

schede dell’atmosfera

schede di controllo

schede di debito

schede matrici

scoprono la scheda

scoprono le schede

solo

supporti di scheda

supporto di scheda

switch

tarjeta atm

tarjeta credito

tarjeta de atm

tarjeta de credito

tarjeta de debito

tarjeta debito

tarjeta no

tarjetahabiente

tipo della scheda

ufficio giapponese della

scheda

v pay

v-pay

visa

visa plus

visa electron

visto

visum

vpay

card identification number

card verification

cardi la verifica

cid

cod seg

cod seguranca

cod segurança

cod sicurezza

cod. seg

cod. seguranca

cod. segurança

cod. sicurezza

codice di sicurezza

codice di verifica

codigo

codigo de seguranca

codigo de segurança

crittogramma

cryptogram

cryptogramme

cv2

cvc

cvc2

cvn

cvv

cvv2

cód seguranca

cód segurança

cód. seguranca

cód. segurança

código

código de seguranca

código de segurança

de kaart controle

geeft nr uit

issue no

issue number

kaartidentificatienummer

kreditkartenprufnummer

kreditkartenprüfnummer

kwestieaantal

no. dell’edizione

no. di sicurezza

numero de securite

numero de verificacao

numero dell’edizione

numero di identificazione della

scheda

numero di sicurezza

numero van veiligheid

numéro de sécurité

nº autorizzazione

número de verificação

perno il blocco

pin block

prufziffer

prüfziffer

security code

security no

security number

sicherheits kode

sicherheitscode

sicherheitsnummer

speldblok

veiligheid nr

veiligheidsaantal

veiligheidscode

veiligheidsnummer

verfalldatum

ablauf

data de expiracao

data de expiração

data del exp

data di exp

data di scadenza

data em que expira

data scad

data scadenza

date de validité

datum afloop

datum van exp

de afloop

espira

espira

exp date

exp datum

expiration

expire

expires

expiry

fecha de expiracion

fecha de venc

gultig bis

gultigkeitsdatum

gültig bis

gültigkeitsdatum

la scadenza

scadenza

valable

validade

valido hasta

valor

venc

vencimento

vencimiento

verloopt

vervaldag

vervaldatum

vto

válido hasta

Формат

Чотири букви, за якими слідує від 5 до 31 букви або цифри

Шаблон

Чотири букви, за якими слідує від 5 до 31 букви або цифри:

  • чотири букви (без урахування регістру) – код банку;

  • пробіл (необов’язково);

  • 4–28 букв або цифр – основний номер банківського рахунку (BBAN);

  • пробіл (необов’язково);

  • 1–3 букви або цифри – решта номера BBAN.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • регулярний вираз Regex_swift знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_swift.

<Entity id="cb2ab58c-9cb8-4c81-baf8-a4e106791df4" patternsProximity="300" recommendedConfidence="75">
<Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_swift" />
        <Match idRef="Keyword_swift" />
    </Pattern>
</Entity>

Ключові слова

Keyword_swift

international organization for standardization 9362

iso 9362

iso9362

swift#

swiftcode

swiftnumber

swiftroutingnumber

swift code

swift number #

swift routing number

bic number

bic code

bic #

bic#

bank identifier code

標準化9362

迅速#

SWIFTコード

SWIFT番号

迅速なルーティング番号

BIC番号

BICコード

銀行識別コードのための国際組織

Organisation internationale de normalisation 9362

rapide #

code SWIFT

le numéro de swift

swift numéro d’acheminement

le numéro BIC

# BIC

code identificateur de banque

Формат

7 або 9 символів, розділених пробілами чи тире

Шаблон

Можливі два шаблони:

  • дві букви (у допустимому NINO в цьому префіксі використовуються лише певні символи, які перевіряє цей шаблон; регістр не враховується);

  • шість цифр;

  • букви A, B, C або D (як і в префіксі, у суфіксі також допускаються лише певні символи; регістр не враховується).

АБО

  • дві букви;

  • пробіл або тире;

  • дві цифри;

  • пробіл або тире;

  • дві цифри;

  • пробіл або тире;

  • дві цифри;

  • пробіл або тире;

  • букви A, B, C або D.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_uk_nino знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_uk_nino.

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_uk_nino знаходить вміст, який відповідає шаблону;

  • не виявляється жодне ключове слово зі списку Keyword_uk_nino.

<!-- U.K. NINO -->
<Entity id="16c07343-c26f-49d2-a987-3daf717e94cc" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="1">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>    
     <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_uk_nino" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_uk_nino" />
        </Any>
    </Pattern>
</Entity>

Ключові слова

Keyword_uk_nino

national insurance number

national insurance contributions

protection act

insurance

social security number

insurance application

medical application

social insurance

medical attention

social security

great britain

insurance

Формат

Дев’ять цифр

Шаблон

Дев’ять цифр без роздільників

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_usa_uk_passport знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_passport.

<Entity id="178ec42a-18b4-47cc-85c7-d62c92fd67f8" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_usa_uk_passport" />
        <Match idRef="Keyword_passport" />
    </Pattern>
</Entity>

Ключові слова

Keyword_passport

Passport Number

Passport No

Passport #

Passport#

PassportID

Passportno

passportnumber

パスポート

パスポート番号

パスポートのNum

パスポート#

Numéro de passeport

Passeport n °

Passeport Non

Passeport #

Passeport#

PasseportNon

Passeportn °

Формат

4–17 цифр

Шаблон

4–17 цифр без роздільників

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • регулярний вираз Regex_usa_bank_account_number знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_usa_Bank_Account.

<!-- U.S. Bank Account Number -->
<Entity id="a2ce32a8-f935-4bb6-8e96-2a5157672e2c" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Regex_usa_bank_account_number" />
        <Match idRef="Keyword_usa_Bank_Account" />
    </Pattern>
</Entity>

Ключові слова

Keyword_usa_Bank_Account

Checking Account Number

Checking Account

Checking Account #

Checking Acct Number

Checking Acct #

Checking Acct No.

Checking Account No.

Bank Account Number

Bank Account #

Bank Acct Number

Bank Acct #

Bank Acct No.

Bank Account No.

Savings Account Number

Savings Account.

Savings Account #

Savings Acct Number

Savings Acct #

Savings Acct No.

Savings Account No.

Debit Account Number

Debit Account

Debit Account #

Debit Acct Number

Debit Acct #

Debit Acct No.

Debit Account No.

Формат

Залежить від штату

Шаблон

Залежить від штату. Наприклад, у Нью-Йорку:

  • підходять дев’ять цифр у форматі ццц ццц ццц;

  • не підходять дев’ять цифр у форматі ццццццццц.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_new_york_drivers_license_number знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_[state_name]_drivers_license_name;

  • виявляється ключове слово зі списку Keyword_us_drivers_license.

Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_new_york_drivers_license_number знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_[state_name]_drivers_license_name;

  • виявляється ключове слово зі списку Keyword_us_drivers_license_abbreviations;

  • не виявляється жодне ключове слово зі списку Keyword_us_drivers_license.

    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license" />
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_new_york_drivers_license_number" />
        <Match idRef="Keyword_new_york_drivers_license_name" />
        <Match idRef="Keyword_us_drivers_license_abbreviations" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Keyword_us_drivers_license" />
        </Any>
    </Pattern>

Ключові слова

Keyword_us_drivers_license_abbreviations

Keyword_us_drivers_license

Keyword_[state_name]_drivers_license_name

DL

DLS

CDL

CDLS

ID

IDs

DL#

DLS#

CDL#

CDLS#

ID#

IDs#

ID number

ID numbers

LIC

LIC#

DriverLic

DriverLics

DriverLicense

DriverLicenses

Driver Lic

Driver Lics

Driver License

Driver Licenses

DriversLic

DriversLics

DriversLicense

DriversLicenses

Drivers Lic

Drivers Lics

Drivers License

Drivers Licenses

Driver’Lic

Driver’Lics

Driver’License

Driver’Licenses

Driver’ Lic

Driver’ Lics

Driver’ License

Driver’ Licenses

Driver’sLic

Driver’sLics

Driver’sLicense

Driver’sLicenses

Driver’s Lic

Driver’s Lics

Driver’s License

Driver’s Licenses

identification number

identification numbers

identification #

id card

id cards

identification card

identification cards

DriverLic#

DriverLics#

DriverLicense#

DriverLicenses#

Driver Lic#

Driver Lics#

Driver License#

Driver Licenses#

DriversLic#

DriversLics#

DriversLicense#

DriversLicenses#

Drivers Lic#

Drivers Lics#

Drivers License#

Drivers Licenses#

Driver’Lic#

Driver’Lics#

Driver’License#

Driver’Licenses#

Driver’ Lic#

Driver’ Lics#

Driver’ License#

Driver’ Licenses#

Driver’sLic#

Driver’sLics#

Driver’sLicense#

Driver’sLicenses#

Driver’s Lic#

Driver’s Lics#

Driver’s License#

Driver’s Licenses#

id card#

id cards#

identification card#

identification cards#

Абревіатура штату (наприклад, NY)

Назва штату (наприклад, New York)

Формат

Дев’ять цифр, які можуть розділятися пробілами або тире (перша цифра – 9, четверта – 7 або 8)

Шаблон

Форматований:

  • цифра 9;

  • дві цифри;

  • пробіл або тире;

  • цифра 7 або 8;

  • цифра;

  • пробіл або тире;

  • чотири цифри.

Неформатований:

  • цифра 9;

  • дві цифри;

  • цифра 7 або 8;

  • п’ять цифр.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_formatted_itin знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • виявляється ключове слово зі списку Keyword_itin;

    • функція Func_us_address знаходить адресу в правильному форматі;

    • функція Func_us_date знаходить дату в правильному форматі;

    • виявляється ключове слово зі списку Keyword_itin_collaborative.

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_unformatted_itin знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • виявляється ключове слово зі списку Keyword_itin_collaborative;

    • функція Func_us_address знаходить адресу в правильному форматі;

    • функція Func_us_date знаходить дату в правильному форматі.

<!-- U.S. Individual Taxpayer Identification Number (ITIN) -->
<Entity id="e55e2a32-f92d-4985-a35d-a0b269eb687b" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_formatted_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
          <Match idRef="Keyword_itin_collaborative" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_itin" />
        <Match idRef="Keyword_itin" />
        <Any minMatches="1">
          <Match idRef="Keyword_itin_collaborative" />
          <Match idRef="Func_us_address" />
          <Match idRef="Func_us_date" />
        </Any>
    </Pattern>
</Entity>

Ключові слова

Keyword_itin

Keyword_itin_collaborative

taxpayer

tax id

tax identification

itin

ssn

tin

social security

tax payer

itins

taxid

individual taxpayer

License

DL

DOB

Birthdate

Birthday

Date of Birth

Формат

Дев’ять цифр за форматованим або неформатованим шаблоном

Примітка.: Номери соціального страхування, видані до середини 2011 року, мають строгий формат, згідно з яким певні частини номера мають входити у визначені діапазони (при цьому немає контрольної суми).

Шаблон

Пошук SSN виконують чотири функції з використанням чотирьох різних шаблонів:

  • Func_ssn знаходить SSN у строгому форматі з тире або пробілами (ццц-цц-цццц АБО ццц цц цццц), які видано до 2011 року;

  • Func_unformatted_ssn знаходить неформатовані SSN у вигляді дев’яти цифр без роздільників (ццццццццц), які видано до 2011 року;

  • Func_randomized_formatted_ssn знаходить SSN, розділені тире або пробілами (ццц-цц-цццц АБО ццц цц цццц), які видано після 2011 року;

  • Func_randomized_unformatted_ssn знаходить неформатовані SSN у вигляді дев’яти цифр без роздільників (ццццццццц), які видано після 2011 року.

Контрольна сума

Ні

Визначення

Політика захисту від втрати даних з імовірністю 85% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_ssn знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • виявляється ключове слово зі списку Keyword_ssn;

    • функція Func_us_date знаходить дату в правильному форматі;

    • функція Func_us_address знаходить адресу в правильному форматі.

Політика захисту від втрати даних з імовірністю 75% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_unformatted_ssn знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_ssn;

  • виконується щонайменше одна з таких умов:

    • функція Func_us_date знаходить дату в правильному форматі;

    • функція Func_us_address знаходить адресу в правильному форматі.

Політика захисту від втрати даних з імовірністю 65% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_randomized_formatted_ssn знаходить вміст, який відповідає шаблону;

  • функція Func_ssn не знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • виявляється ключове слово зі списку Keyword_ssn;

    • функція Func_us_date знаходить дату в правильному форматі;

    • функція Func_us_address знаходить адресу в правильному форматі.

Політика захисту від втрати даних з імовірністю 55% правильно розпізнає цей тип конфіденційної інформації, якщо в межах 300 символів:

  • функція Func_randomized_unformatted_ssn знаходить вміст, який відповідає шаблону;

  • виявляється ключове слово зі списку Keyword_ssn;

  • функція Func_unformatted_ssn не знаходить вміст, який відповідає шаблону;

  • виконується щонайменше одна з таких умов:

    • функція Func_us_date знаходить дату в правильному форматі;

    • функція Func_us_address знаходить адресу в правильному форматі.

<!-- U.S. Social Security Number (SSN) -->
<Entity id="a44669fe-0d48-453d-a9b1-2cc83f2cba77" patternsProximity="300" recommendedConfidence="75">
    <Pattern confidenceLevel="85">
        <IdMatch idRef="Func_ssn" />
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="75">
        <IdMatch idRef="Func_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="65">
        <IdMatch idRef="Func_randomized_formatted_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Keyword_ssn" />
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
    <Pattern confidenceLevel="55">
        <IdMatch idRef="Func_randomized_unformatted_ssn" />
        <Match idRef="Keyword_ssn" />
        <Any minMatches="0" maxMatches="0">
          <Match idRef="Func_unformatted_ssn" />
        </Any>
        <Any minMatches="1">
          <Match idRef="Func_us_date" />
          <Match idRef="Func_us_address" />
        </Any>
    </Pattern>
</Entity>

Ключові слова

Keyword_ssn

Social Security

Social Security#

Soc Sec

SSN

SSNS

SSN#

SS#

SSID

Удосконалення навичок роботи з Office
Ознайомтеся з навчальними матеріалами
Отримуйте нові функції раніше за інших
Приєднайтеся до оцінювачів Office

Ця інформація корисна?

Дякуємо за ваш відгук!

Дякуємо за відгук! Схоже, вам може стати в нагоді допомога одного з наших спеціалістів служби підтримки Office, з яким ми вас можемо з’єднати.

×