### 1. DEA분석 데이터셋 불러오기
- 설명: python 소스코드 2-1.에서 만들고 저장한 DEA분석용 데이터셋(dea_data.csv)을 불러온다

In [27]:
df <- read.csv('dea_data.csv')
head(df,3)

Unnamed: 0_level_0,X,보호구역명,x1_주정차단속,x2_차량등록수,x3_유소년인구,x4_총인구,x5_유동인구,x6_학교_유치원,x7_교통량_승용차,x8_혼잡빈도강도,x9_혼잡시간강도,x10_학원_체육도장,y1_CCTV_보호구역,y2_단속카메라_불법주정차,y3_도로안전표지,y4_과속방지턱,y5_신호등,y6_CCTV_과속단속
Unnamed: 0_level_1,<int>,<fct>,<int>,<dbl>,<dbl>,<dbl>,<dbl>,<int>,<dbl>,<dbl>,<dbl>,<int>,<int>,<int>,<int>,<int>,<int>,<int>
1,0,성심학교,0,9,0,112,376.01,0,1627.98,325.05,340.96,0,0,0,0,0,0,0
2,1,가수초등학교,19,0,0,0,2658.7,4,800.41,88.22,145.36,5,1,0,0,0,0,0
3,2,광성초등학교,19,0,0,0,33513.36,6,15911.12,2.04,10.68,6,2,1,6,0,12,0


### 2. 데이터셋 전처리
- 설명: 어떤 지역의 여러 산출물(y변수) 값이 모두 0인 경우, 효율성 점수를 구하는 수식의 분모가 0이 되어 효율성 점수가 inf(무한대)로 산출되는 문제가 있어, y변수의 값이 0인 경우 0.1로 변환
- y변수 중 신호등은 분석에 적절하지 않다고 판단해 제거함 (PPT에 관련 내용 첨부)

In [28]:
library(dplyr)
X <- df[,-1] %>% 
    select(starts_with("x"))  %>% 
    as.matrix

Y <- df[,-17] %>% 
    select(starts_with("y")) 

Y[,1] <- ifelse(Y[,1]==0,0.1,Y[,1])
Y[,2] <- ifelse(Y[,2]==0,0.1,Y[,2])
Y[,3] <- ifelse(Y[,3]==0,0.1,Y[,3])
Y[,4] <- ifelse(Y[,4]==0,0.1,Y[,4])
Y[,5] <- ifelse(Y[,5]==0,0.1,Y[,5])

Y <- Y %>% 
    as.matrix 

In [29]:
head(X,3)

x1_주정차단속,x2_차량등록수,x3_유소년인구,x4_총인구,x5_유동인구,x6_학교_유치원,x7_교통량_승용차,x8_혼잡빈도강도,x9_혼잡시간강도,x10_학원_체육도장
0,9,0,112,376.01,0,1627.98,325.05,340.96,0
19,0,0,0,2658.7,4,800.41,88.22,145.36,5
19,0,0,0,33513.36,6,15911.12,2.04,10.68,6


In [30]:
head(Y)

y1_CCTV_보호구역,y2_단속카메라_불법주정차,y3_도로안전표지,y4_과속방지턱,y6_CCTV_과속단속
0.1,0.1,0.1,0.1,0.1
1.0,0.1,0.1,0.1,0.1
2.0,1.0,6.0,0.1,0.1
3.0,1.0,2.0,0.1,0.1
2.0,2.0,2.0,1.0,0.1
2.0,1.0,1.0,0.1,0.1


### 3. DEA 분석

#### 3-1. 출력데이터셋: dea_eff
- 각 지역에 대한 효율성점수를 계산해 dea_eff.csv파일에 저장함
- crs_eff: 불변규모수익(CCR) 모형
- vrs_eff: 가변규모수익(BCC) 모형
- 본 분석에서는 불변규모수익을 가정하였으므로, crs_eff 결과물만 사용함

In [31]:
library(Benchmarking)

In [32]:
dea_crs <- dea(X,Y, RTS="crs", ORIENTATION="out")
print(dea_crs)

# table(dea_eff$crs_eff)

 [1] 1.000 1.000 1.000 2.538 1.885 1.000 1.000 1.000 1.338 1.000 1.928 3.761
[13] 1.000 4.344 2.650 1.000 1.062 2.003 1.293 1.000 1.057 1.000 1.000 1.000
[25] 1.000 1.000 1.000 2.123 2.822 2.778 3.554 1.000 1.137 1.631 2.049 1.730
[37] 1.475 1.480 1.000 1.000 1.000 1.000 1.950 1.156 1.000 1.000 1.694 1.648
[49] 1.588 1.761 1.000 1.000 1.000 1.000 1.793 1.974 1.583 1.000 1.000 2.090
[61] 1.212 1.000 1.000 1.000 1.014 1.000 1.000 1.000 1.831 1.000 1.000 1.000
[73] 1.000 3.370 2.341 1.000 1.209 1.613 3.048 1.000 1.169 1.000 1.034 2.284
[85] 1.059 1.000 1.000 6.137 1.302 1.000 1.000


In [33]:
dea_vrs <- dea(X,Y, RTS="vrs", ORIENTATION="out")
print(dea_vrs)

# table(dea_eff$vrs_eff)

 [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[39] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[77] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1


In [34]:
dea_eff <- data.frame(schoolzone = df$보호구역명, crs_eff = dea_crs$eff,vrs_eff=dea_vrs$eff)
head(dea_eff,3)

Unnamed: 0_level_0,schoolzone,crs_eff,vrs_eff
Unnamed: 0_level_1,<fct>,<dbl>,<dbl>
1,성심학교,1,1
2,가수초등학교,1,1
3,광성초등학교,1,1


In [35]:
write.csv(dea_eff,"dea_eff.csv")

#### 3-2. 출력데이터셋: dea_crs
- 비효율 지역의 산출물(시설물) 목표치를 계산하기 위해 필요한 참조집단의 가중치를 dea_crs.csv 파일에 저장함

In [36]:
crs <- lambda(dea_crs, KEEPREF = FALSE)
head(crs,3)

L1,L2,L3,L6,L7,L8,L10,L13,L16,L20,⋯,L71,L72,L73,L76,L80,L82,L86,L87,L90,L91
1,0,0,0,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0
0,1,0,0,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0
0,0,1,0,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0


In [37]:
df$보호구역명 <- as.character(df$보호구역명)
colname <- as.numeric(substr(colnames(crs),2,3)) - 1 # 파이썬은 0부터 시작

for (i in 1:length(colname)){
    for (j in 1:nrow(df)){
        if (colname[i]==df$X[j]){
            colname[i] = df$보호구역명[j]
            # print(df$보호구역명[j])
        }
    }
}

colnames(crs) <- colname

In [38]:
dea_crs <- data.frame(schoolzone = df$보호구역명, crs)
head(dea_crs,3)

Unnamed: 0_level_0,schoolzone,성심학교,가수초등학교,광성초등학교,삼미초등학교,성산초등학교,성호초등학교,오산초등학교,오산원당초등학교,운암초등학교,⋯,리틀램어린이집,아이사랑어린이집,중앙어린이집,늘해랑어린이집,키즈맘.어린이집,행복아이.어린이집,자람터어린이집,시립세마어린이집,설리반어린이집,세교복지타운어린이집
Unnamed: 0_level_1,<fct>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,⋯,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
1,성심학교,1,0,0,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0
2,가수초등학교,0,1,0,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0
3,광성초등학교,0,0,1,0,0,0,0,0,0,⋯,0,0,0,0,0,0,0,0,0,0


In [39]:
write.csv(dea_crs,"dea_crs.csv")

## 본 R코드에서 저장한 "dea_eff.csv", "dea_crs.csv" 두 파일을 Python에서 불러 와 분석을 이어감 (python 소스코드 2-2 부터)