본문 바로가기
IT기술노트/디지털보안

PPDM(Privacy Preserving Data Mining)

by 비트코기 2021. 2. 25.
반응형

I. 프라이버시 보존형 데이터 마이닝, PPDM의 개요

가. PPDM(Privacy Preserving Data Mining)의 정의

   - 데이터 소유자의 프라이버시를 침해하지 않으면서도 데이터를 함축적으로 들어있는 지식이나 패턴을 찾아내는 기술

나. PPDM의 유형

   - 실용적인 프라이버시 보존형 데이터 마이닝, SMC 기반 프라이버시 보존형 데이터 마이닝


II. PPDM의 주요 기술

구분

설명

랜덤노이즈

추가

- 프라이버시에 민감한 원본 데이터 대신 노이즈를 추가하여 교란된 데이터만 공개하는 기법

- 데이터 상관관계 활용, 노이지 평준화, 영역기반 교란기법

압축기반

교란기법

- 시계열 데이터를 낮은 차원의 새로운 특성 공간에 매핑 후 빠른 검색을 위해 R-트리와 같은 다차원 트리로 인덱스 하는 변환 기반의 교란 기법

- 이산푸리에 기법, 이산웨이블릿 변환 기법

기하학적

교란기법

- 노이즈 추가, 압축기반 교란 기법의 단점인 데이터간 상관관계 미지원 문제점을 보완한 기법

- 데이터 간 상관관계 및 민감 속성 보호

- 회전교란기법, 다중회전 기법, 응축 교란 기법

K-익명화

- 주어진 데이터 집합에서 준 식별자 속성 값들이 동일한 레코드가 적어도 k개 존재하도록 하는 연결 공격 방어형 프라이버시 보호 모델

- 데이터의 집합의 일부를 수정하여, 모든 레코드가 자기 자신과 동일한(구별되지 않는) k-1개 이상의 레코드를 가지게 한다.

분산

프라이버시

- 분산된 데이터를 각 노드 별로 마이닝하고 그 결과를 최종 노드에서 집계하여 결과를 도출하는 기법

- 분산 노드가 자신의 데이터를 공개하지 않으면서 합계, 평균, 거리 등의 집계 값을 계산하는 SMC(Secure Multiparty Computing) 기반으로 데이터 마이닝ㅇ

 

반응형

댓글