이름
,분류 최대 레벨
,분류 최소값
,분류 최대값
,가중치
- 예시
age,5,0,100,1
sex,1,0,2,2
tmp,5,0,10,5
surgery,2,0,10,3
length,2,0,100,6
location,5,0,100,4
- 위 준식별자 데이터의 값들과 민감정보의 값
age,sex,tmp,surgery,length,location,민감정보
준식별자1
,준식별자2
,...
,민감정보
의 형식- 예시
27,2,0,1,49,6,N926
50,2,0,1,49,10,N760
36,1,0,1,50,8,nncd
36,1,0,1,50,8,nncd
46,1,0,1,50,10,N4110
- 준식별자 익명화 후 각 값들의 집합이 전부 k개 이상이어야 한다.
20-40,0-2,0-2,0-5,0-100,0-20,N926
40-60,0-2,0-2,0-5,0-100,0-20,N760
20-40,0-2,0-2,0-5,0-100,0-20,nncd
20-40,0-2,0-2,0-5,0-100,0-20,nncd
40-60,0-2,0-2,0-5,0-100,0-20,N4110
- 데이터가 유출되어도 같은 데이터의 값이 k개 존재하기 때문에 공격자는 원본데이터를 유추하기 힘들다.
- k 값이 커질 수록 익명성은 증가하지만 배포 데이터의 정확도가 떨어진다.