키워드 사전 만들기

참고:  사용자 언어로 가능한 한 빨리 가장 최신의 도움말 콘텐츠를 제공하고자 합니다. 이 페이지는 자동화를 통해 번역되었으며 문법 오류나 부정확한 설명을 포함할 수 있습니다. 이 목적은 콘텐츠가 사용자에게 유용하다는 것입니다. 이 페이지 하단의 정보가 도움이 되었다면 알려주세요. 쉽게 참조할 수 있는 영어 문서 가 여기 있습니다.

Office 365에서 데이터 손실 방지 (DLP) 식별, 모니터링 및 중요 한 정보를 보호할 수 있습니다. 간혹 중요 한 정보를 식별 하는 방법은 일반 콘텐츠 (예: 의료 관련 통신) 또는 부적절 한 또는 명시적 언어를 식별 하는 경우에 특히 키워드를 찾고 사용 해야 합니다. 중요 한 정보 형식에서 키워드 목록을 만들 수 있습니다를 동안 키워드 목록을 크기가 제한 되 고 XML 만들기 또는 편집을 수정 해야 합니다. 키워드 사전 키워드 및 사전 당 최대 100, 000 용어를 지 원하는 훨씬 더 큰 배율을, 간단한 관리를 제공 합니다.

키워드 사전 작성 하기 위한 기본 단계

사용자 사전에 대 한 키워드 기존 사전 또는 cmdlet에 직접 입력 하 여 목록에서 다양 한 원본 파일 (예:.csv 또는.txt 목록)에서 가장 일반적으로 가져올 수 있습니다. 키워드 사전을 만들면 같은 주요 단계를 따릅니다.

  1. 보안 및 규정 준수 센터 PowerShell에 연결 -참조 이 항목입니다.

  2. 정의 의도 한 원본에서 키워드를 로드 하거나 -키워드 사전을 만들려면 cmdlet 수락 키워드를 쉼표로 구분 된 목록 있으므로이 단계에서 키워드 가져올 위치에 따라 약간씩 달라 집니다.

  3. 키워드 인코딩할 -한 번 로드 가져오기가 전에 바이트 배열로 변환 중인 합니다.

  4. 사용자 사전 만들기 -이름 및 설명을 선택 하 고 사용자 사전 만듭니다.

파일에서 키워드 사전 만들기

주로 큰 사전을 만드는 데 필요한 경우 파일 또는 기타 원본에서 내보낸 목록에서 키워드를 사용 하 여 있습니다. 이 경우 외부 전자 메일에서 화면에 부적절 한 언어 목록이 포함 된 키워드 사전을 만들 수 있습니다. 첫 번째 보안 및 규정 준수 센터 PowerShell에 연결해야 합니다.

  1. 텍스트 파일에 키워드를 복사 하 고 각 키워드 별도 줄에 인지 확인 합니다.

  2. 유니코드 인코딩을 사용 하 여 텍스트 파일을 저장 합니다. 메모장에서 > 다른 이름으로 저장 > 인코딩 > 유니코드 합니다.

  3. 이 cmdlet를 실행 하 여 파일을 변수에 읽기:

    $fileData = Get-Content <filename> -Encoding Byte -ReadCount 0
  4. 이 cmdlet를 실행 하 여 사전을 만듭니다.

    New-DlpKeywordDictionary -Name <name> -Description <description> -FileData $fileData

기존 키워드 사전 수정

키워드 사전 중 하나에서 키워드를 수정 하거나 기본 제공 사전 중 하나를 수정 해야 할 수 있습니다. 이 예제에서는 조건 로컬로 전자 편집기에서 수정 하 고 다음 위치에서 이전 용어를 업데이트할 수 저장 PowerShell의 몇 가지 조건을 수정 합니다. 먼저, 사전 개체를 검색 합니다.

$dict = Get-DlpKeywordDictionary -Name "Diseases"

인쇄 $dict 다양 한 변수 표시 됩니다. 자체 키워드는 백 엔드, 개체에 저장 되지만 $dict.KeywordDictionary 사전을 수정 하는 데 사용 되는 이러한 문자열 표현을 포함 합니다. 사전을 수정 하기 전에 .split(‘,’) 방법을 사용 하 여 배열로 용어 문자열을 다시 설정 해야 합니다. 다음 원치 않는 간격에서 작동 하도록 키워드 방금 닫지 .trim() 방법 사용 하 여 키워드를 정리 됩니다.

$terms = $dict.KeywordDictionary.split(',').trim()

이제 사전에서 몇 가지 용어를 제거 합니다. 예제 사전에 몇 가지 키워드, 사전 내보내기 및 메모장에서 편집을 쉽게 건너뛸 수 있지만 사전에는 일반적으로 많은 양의 텍스트를 포함, 때문에 되므로 먼저 알아봅니다 PowerShell에서 쉽게 파일을 편집 하는이 방법은이 있습니다.

마지막 단계에서 배열에 키워드를 저장 합니다. 배열에서 항목을 제거하는 방법은 여러 가지가 있지만 간단한 방법으로는 사전에서 제거 하려는 용어의 배열을 만드는 한 다음 용어를 제거 하려면 목록에 없는 것만 사전 용어 복사 됩니다.

용어의 현재 목록 표시 명령 $terms 를 실행 합니다. 명령의 출력 다음과 같습니다.

aarskog's syndrome
abandonment
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipoproteinemia
abiotrophy
ablatio
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

제거 하려는 용어를 지정 하려면이 명령을 실행 합니다.

$termsToRemove = @('abandonment', 'ablatio')

실제로 조건 목록에서 제거 하려면이 명령을 실행 합니다.

$updatedTerms = $terms | Where-Object{ $_ -notin $termsToRemove }

용어에 업데이트 된 목록을 표시 하려면 $updatedTerms 명령을 실행 합니다. 명령의 출력은 다음과 같습니다 (지정 된 조건 제거 되었습니다).

aarskog's syndrome
abasia
abderhalden-kaufmann-lignac
abdominalgia
abduction contracture
abetalipo proteinemia
abiotrophy
ablation
ablepharia
abocclusion
abolition
aborter
abortion
abortus
aboulomania
abrami's disease

이제 사전 로컬로 저장 하 고 몇 가지 더 많은 용어 추가 합니다. Powershell을 바로 여기서 용어를 추가할 수 있지만 유니코드 인코딩을 사용 하 여 저장 하 고 BOM 포함 된 로컬에 파일을 내보내려면 여전히 필요 합니다.

사전에서 다음을 실행 하 여 로컬로 저장 합니다.

Set-Content $updatedTerms -Path "C:\myPath\terms.txt"

이제 단순히 파일, 사용자 추가 조건 추가 열고 유니코드 인코딩을 (utf-16)으로 저장 합니다. 지금 업데이트 된 용어를 업로드 하 고 현재 위치에서 사전 업데이트 합니다.

PS> Set-DlpKeywordDictionary -Identity "Diseases" -FileData (Get-Content -Path "C:myPath\terms.txt" -Encoding Byte -ReadCount 0)

이제 사전 곳에서 업데이트 되었습니다. 참고 Identity 필드 사전의 이름을 사용 합니다. 또한 set- cmdlet을 사용 하 여 사전의 이름을 변경 하려는 경우 새 사전 이름에 위의 란에 -Name 매개 변수를 추가 하려면 싶은 경우 것입니다.

중요 한 정보를 사용자 지정 형식 및 DLP 정책에서 키워드 사전을 사용 하 여

키워드 사전 중요 한 정보를 사용자 지정 형식에 대 한 일치 요구 사항의 일부로 사용할 수 있습니다 또는 중요 한 정보로 스스로 입력 합니다. 두 가지 모두 중요 한 정보를 사용자 지정 형식을 만드는필요합니다. 중요 한 정보 형식을 만들려면 연결 된 문서의 지침을 따릅니다. XML 있으면 사용 하기 위해 사전에 대 한 GUID 식별자가 필요 합니다.

<Entity id="9e5382d0-1b6a-42fd-820e-44e0d3b15b6e" patternsProximity="300" recommendedConfidence="75">
	<Pattern confidenceLevel="75">
		<IdMatch idRef=". . ."/>
	</Pattern>
</Entity>

사용자 사전 id를 가져오려면 다음이 명령을 실행 하 고 Identity 속성 값을 복사 합니다.

Get-DlpKeywordDictionary -Name "Diseases"

이 명령의 출력은 다음과 같습니다.

RunspaceId        : 138e55e7-ea1e-4f7a-b824-79f2c4252255
Identity          : 8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f
Name              : Diseases
Description       : Names of diseases and injuries from ICD-10-CM lexicon
KeywordDictionary : aarskog's syndrome, abandonment, abasia, abderhalden-kaufmann-lignac, abdominalgia, abduction contracture, abetalipo
                    proteinemia, abiotrophy, ablatio, ablation, ablepharia, abocclusion, abolition, aborter, abortion, abortus, aboulomania,
                    abrami's disease, abramo
IsValid           : True
ObjectState       : Unchanged

중요 한 정보를 사용자 지정 형식 XML에 id를 붙여 넣고 줄여 업로드 하세요. 이제 사용자 사전 중요 한 정보 유형 목록에 나타나고 오른쪽 사용할 수 있습니다 정책에서 얼마나 많은 키워드와 일치 하는 데 필요한를 지정 합니다.

<Entity id="d333c6c2-5f4c-4131-9433-db3ef72a89e8" patternsProximity="300" recommendedConfidence="85">
      <Pattern confidenceLevel="85">
        <IdMatch idRef="8d2d44b0-91f4-41f2-94e0-21c1c5b5fc9f" />
      </Pattern>
    </Entity>
    <LocalizedStrings>
      <Resource idRef="d333c6c2-5f4c-4131-9433-db3ef72a89e8">
        <Name default="true" langcode="en-us">Diseases</Name>
        <Description default="true" langcode="en-us">Detects various diseases</Description>
      </Resource>
    </LocalizedStrings>
Office 기술 확장
교육 살펴보기
새로운 기능 우선 가져오기
Office Insider 참여

이 정보가 유용한가요?

의견 주셔서 감사합니다!

피드백을 주셔서 감사합니다. Office 지원 에이전트와 연락하는 것이 도움이 될 것 같습니다.

×