Skip to content

Latest commit

 

History

History
40 lines (37 loc) · 1.15 KB

README.md

File metadata and controls

40 lines (37 loc) · 1.15 KB

K - 익명화

준식별자 데이터

  • 이름, 분류 최대 레벨, 분류 최소값, 분류 최대값, 가중치
  • 예시
age,5,0,100,1
sex,1,0,2,2
tmp,5,0,10,5
surgery,2,0,10,3
length,2,0,100,6
location,5,0,100,4

데이터 예시

  • 위 준식별자 데이터의 값들과 민감정보의 값
    • age,sex,tmp,surgery,length,location,민감정보
  • 준식별자1,준식별자2, ..., 민감정보 의 형식
  • 예시
27,2,0,1,49,6,N926
50,2,0,1,49,10,N760
36,1,0,1,50,8,nncd
36,1,0,1,50,8,nncd
46,1,0,1,50,10,N4110

익명화 결과 예시

  • 준식별자 익명화 후 각 값들의 집합이 전부 k개 이상이어야 한다.
20-40,0-2,0-2,0-5,0-100,0-20,N926
40-60,0-2,0-2,0-5,0-100,0-20,N760
20-40,0-2,0-2,0-5,0-100,0-20,nncd
20-40,0-2,0-2,0-5,0-100,0-20,nncd
40-60,0-2,0-2,0-5,0-100,0-20,N4110

결론

  • 데이터가 유출되어도 같은 데이터의 값이 k개 존재하기 때문에 공격자는 원본데이터를 유추하기 힘들다.
  • k 값이 커질 수록 익명성은 증가하지만 배포 데이터의 정확도가 떨어진다.