# 근로소득에 따른 의료 접근성 - 한국과 핀란드를 중심으로
경희대학교 사회학과 김은희    
2019-2 경희대학교 꿈도전장학 (연구) 분야

## 데이터 정보
ISSP 2011 : Health
한국 : 한국종합사회조사(KGSS) 누적데이터
핀란드 : Finnish Social Science Data Archive

누적데이터는 기존 공개된 연도별 데이터 중 오류를 수정한 내용을 포함하고 있습니다. 또한, 모든 연도에 적용할 가중치 변수가 포함되어 있습니다. 누적데이터 이용을 추천합니다.

## 패키지 설치

In [1]:
install.packages("foreign")
library(foreign)

"unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.5:
  URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.5/PACKAGES'를 열 수 없습니다"

package 'foreign' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
	C:\Users\eunee\AppData\Local\Temp\Rtmpk3rugi\downloaded_packages


## 파일 불러오기

In [2]:
kordata <- read.spss("C:/Users/eunee/khu_project_2019/data/kor.sav", reencode = 'utf-8', use.value.labels = FALSE, to.data.frame = TRUE)
findata <- read.spss("C:/Users/eunee/khu_project_2019/data/fin.por", use.value.labels = FALSE, to.data.frame = TRUE)

"C:/Users/eunee/khu_project_2019/data/kor.sav: Long string value labels record found (record type 7, subtype 21), but ignored"re-encoding from utf-8


## 한국 데이터 클리닝

KGSS 누적 데이터를 다운받아 그중 2011년 자료를 ```subset```해서 사용한다.

In [3]:
kor_2011 <- subset(kordata, YEAR == 2011)

분석에는 다음과 같은 변수를 사용한다.

- ```SEX``` : 성별
    - ```1``` : 남자
    - ```2``` : 여자

    
- ```AGE``` : 연령(만 나이)


- ```MARITAL``` : 동거
    - ```1``` : 기혼
    - ```2``` : 사별
    - ```3``` : 이혼
    - ```4``` : 별거
    - ```5``` : 미혼
    - ```6``` : 동거
    - ```-8``` : 모르겠다/무응답
    
    
- ```RINCOME``` : 월 평균 근로소득 (세전)
    - ```0``` : 소득 없음
    - ```1``` : 50만원 미만
    - ```2``` : 50만원 ~ 99만원
    - ```3``` : 100만원 ~ 149만원
    - ```4``` : 150만원 ~ 199만원
    - ```5``` : 200만원 ~ 249만원
    - ```6``` : 250만원 ~ 299만원
    - ```7``` : 300만원 ~ 349만원
    - ```8``` : 350만원 ~ 399만원
    - ```9``` : 400만원 ~ 449만원
    - ```10``` : 450만원 ~ 499만원
    - ```11``` : 500만원 이상
    - ```-8``` : 모르겠다/무응답
    - ```-1``` : 비해당
    
    
- ```RXTINCM``` : 월 평균 근로외 소득 (세전)
    - ```0``` : 소득 없음
    - ```1``` : 50만원 미만
    - ```2``` : 50만원 ~ 99만원
    - ```3``` : 100만원 ~ 149만원
    - ```4``` : 150만원 ~ 199만원
    - ```5``` : 200만원 ~ 249만원
    - ```6``` : 250만원 ~ 299만원
    - ```7``` : 300만원 ~ 349만원
    - ```8``` : 350만원 ~ 399만원
    - ```9``` : 400만원 ~ 449만원
    - ```10``` : 450만원 ~ 499만원
    - ```11``` : 500만원 이상
    - ```-8``` : 모르겠다/무응답
    - ```-1``` : 비해당
    
    
- 치료 못 받았던 경험  
    ```TRTWHY1``` : 비용을 지불할 능력이 없어서
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```-1``` : 비해당
    
 ```TRTWHY2``` : 직장을 빠지고 갈 시간이 없거나 다른 일로 바빠서  
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```-1``` : 비해당

 ```TRTWHY3``` : 거주하는 동네나 인근에서는 필요한 치료를 받을 수 없어서   
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```-1``` : 비해당
  
 ```TRTWHY4``` : 치료를 기다리는 사람들이 너무 많아서   
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```-1``` : 비해당

필요한 변수를 ```subset```한다.

In [6]:
kor <- subset(kor_2011, select = c("SEX", "AGE", "MARITAL", "RINCOME", "RXTINCM", "TRTWHY1", "TRTWHY2", "TRTWHY3", "TRTWHY4"))

동거에 ```1```, 비동거에 ```2```, 미혼에 ```3```의 새로운 값을 부여한다. 
- 동거 : 기혼, 동거    
- 비동거 : 사별, 이혼 별거    
- 미혼

In [9]:
kor$martial <- ifelse(kor$MARITAL == 6, 1, kor$MARITAL)
kor$martial <- ifelse(kor$martial == 3, 2, kor$martial)
kor$martial <- ifelse(kor$martial == 4, 2, kor$martial)
kor$martial <- ifelse(kor$martial == 5, 3, kor$martial)

소득에 따른 의료 접근성(치료받지 못함)을 분석하기 위함이므로, 비해당(치료가 필요하지 않음) 응답의 경우 연구 관심 밖이다. 이들은 ```NA```로 처리한다.

## 핀란드 데이터 클리닝

 분석에는 다음의 변수를 사용한다.

- ```K1``` : 성별
    - ```1``` : 남자
    - ```2``` : 여자

    
- ```K2``` : 출생년도


- ```K13``` : 동거
    - ```1``` : 동거
    - ```2``` : 비동거
    - ```3``` : 해당 없음
    
    
- ```K59``` : 월 평균 총 소득 (세전, 근로외 소득 포함)
    
    
- 치료 못 받았던 경험  
    ```TRTWHY1``` : 비용을 지불할 능력이 없어서
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```8``` : 비해당
    
 ```TRTWHY2``` : 직장을 빠지고 갈 시간이 없거나 다른 일로 바빠서  
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```8``` : 비해당

 ```TRTWHY3``` : 거주하는 동네나 인근에서는 필요한 치료를 받을 수 없어서   
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```8``` : 비해당
  
 ```TRTWHY4``` : 치료를 기다리는 사람들이 너무 많아서   
    - ```1``` : 있었다
    - ```2``` : 없었다
    - ```8``` : 비해당

필요한 데이터를 ```subset```한다.

In [20]:
fin <- subset(findata, select = c("K1", "K2", "K13", "K59", "K38A", "K38B", "K38C", "K38D"))

한국의 경우 연령 정보가 나이로 되어 있는 반면, 핀란드의 데이터에서는 태어난 연도로 되어 있다. 이를 모두 연령 단위로 통일해 ```age``` 변수로 만든다.

In [22]:
fin$age <- 2011-fin$K2

```TRTWHY1```~```TRTWHY4```의 응답에서 '비해당' 응답에 ```8```을 부여했는데, 한국과의 통일성을 위해 비해당의 경우 ```-1```을 부여한다.

In [23]:
fin$k38a <- ifelse(fin$K38A == 8, -1, fin$K38A)
fin$k38b <- ifelse(fin$K38B == 8, -1, fin$K38B)
fin$k38c <- ifelse(fin$K38C == 8, -1, fin$K38C)
fin$k38d <- ifelse(fin$K38D == 8, -1, fin$K38D)