Article 4. 개인정보 활용 1124
Section 2. 빅데이터 기술 및 제도
Paragraph 1. 개인정보 비식별화 개념
데이터값 삭제, 가명처리, 총계처리, 범주화, 데이터 마스킹 등을 통해 개인정보의 일부 또는 전부를 삭제하거나 대체함으로써 다른 정보와 쉽게 결합하여도 특정 개인을 식별할 수 없도록 하는 조치를 말함
Paragraph 2. 개인정보 비식별화 절차
- 개인정보보호 가이드라인은 개인정보를 비식별 조치하여 이용 또는 제공하려는 사업자 등이 준수하여야 할 조치 기준을 제시한다.
- 개인정보 비식별화는 사전검토, 비식별 조치, 적정성 평가, 사후관리 절차로 이루어진다.
- 사전검토
- 데이터가 개인정보에 해당하는지 검토
- 개인정보가 아닐 경우 법적 규제 없이 자유롭게 활용
- 개인정보일 경우 비식별 조치를 수행
- 비식별 조치
- 데이터 집합에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하는 등의 방법을 활용해 개인을 알아볼 수 없도록 하는 조치
- 적정성 평가
- 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는지를 비식별 조치, 적정성 평가단을 통해 평가
- 사후관리
- 비식별 정보 안전조치, 재식별 가능성 모니터링 등 비식별 정보 활용 과정에서 재식별 방지를 위해 필요한 조치 수행
Paragraph 3. 개인정보 비식별 조치 방법
개인정보 비식별 조치 방법은 가명처리, 총계처리, 데이터 삭제, 데이터 범주화, 데이터 마스킹 등이 있다
-
가명처리(Psudonymization)
-
세부기술
- 휴리스틱 익명화
- 암호화
- 교환방법
-
예시
- 개인 식별이 가능한 데이터에 대하여 직접 식별할 수 없는 다른 값으로 대체하는 기법
장길산, 20세, 인천 거주, 미래대 재학
➔
김식별, 20대, 인천 거주, 외국대 재학
-
-
총계처리(Aggregation)
-
세부기술
- 총계처리 기본 방식
- 부분집계
- 라운딩
- 데이터 재배열
-
예시
- 개인정보에 대하여 통곗값을 적용하여 특정 개인을 판단할 수 없도록 하는 기법
장길정 160cm, 김식별 150cm, 김콩쥐 170cm, 장길산 150cm
➔
물리학과 학생 키 합: 630cm, 평균 키 158cm
-
-
데이터 삭제(Data Reduction)
-
세부기술
- 속성값 삭제
- 속성값 부분 삭제
- 준 식별자 제거를 통한 단순 익명화
-
예시
- 개인정보 식별이 가능한 특정 데이터값 삭제 처리 기법
주민등록번호 801212-1234567
➔
80년대 생, 남자, 개인과 관련된 날짜 정보(합격일 등)는 연 단위로 처리
-
-
데이터 범주화(Data Suppression)
-
세부기술
- 범주화 기본 방식
- 랜덤 올림 방법
- 범위 방법
- 세분 정보 제한 방법
- 제어 올림 방법
-
예시
- 단일 식별 정보를 해당 그룹의 대푯값으로 변환(범주화)하거나 구간 값으로 변환(범위화)하여 고유 정보 추적 및 식별 방지 기법
장길산, 41세
➔
장 씨, 40~50세
-
-
데이터 마스킹(Data Masking)
-
세부기술
- 임의 잡음 추가 방법
- 공백과 대체 방법
-
예시
- 개인 식별 정보에 대하여 전체 또는 부분적으로 대체값(공백, ‘*’, 노이즈 등)으로 변환하는 기법
장길산, 41세, 서울 거주, 미래대학 재학
➔
장00, 41세, 서울 거주, 00대학 재학
-
Paragraph 4. 재식별 가능성 모니터링
- 비식별 정보를 이용하거나 제3자에게 제공하려는 사업자 등은 해당 정보의 재식별 가능성을 정기적으로 모니터링을 해야 한다
- 모니터링 결과, 점검 항목 중 어느 하나에 해당하는 경우에는 추가적인 비식별 조치를 강구한다
- 내부 요인의 변화
- 비식별 조치된 정보와 연계하여 재식별 우려가 있는 추가적인 정보를 수집하였거나 제공받은 경우
- 데이터 이용과정에서 생성되는 정보가 비식별 정보와 결합해서 새로운 정보가 생성되는 경우
- 이용부서에서 비식별 정보에 대한 비식별 수준을 낮추어 달라고 하는 요구가 있는 경우
- 신규 또는 추가로 구축되는 시스템이 비식별 정보에 대한 접근을 관리 통제하는 보안체계에 중대한 변화를 초래하는 경우
- 외부 환경의 변화
- 이용 중인 데이터에 적용된 비식별 조치 방법과 유사한 방법으로 비식별 조치한 사례가 재식별되었다고 알려진 경우
- 이용 중인 데이터에 적용된 비식별 기법과 기술을 무력화하는 새로운 기술이 등장하거나 공개된 경우
- 이용 중인 데이터와 새롭게 연계 가능한 정보가 출현하거나, 공개된 것으로 알려진 경우