## 급성심정지환자
- 데이터 
    - ohca_18xlsx.XLS(질병관리청, 급성심정지 2018년도 데이터)
    - ohca_19.xlsx(질병관리청, 급성심정지 2019년도 데이터)
    - ohca_20.xlsx(질병관리청, 급성심정지 2020년도 데이터)
    - 서울시_구별_급성심정지환자(발생지기준).csv
        - 발생지기준 : (환자발생장소_시도를 '서울'로 전처리하고 환자발생장소_시군구가 '소재지'인 데이터)

In [None]:
# YEAR: 급성심장정지 발생 연도
# P_ADD_CITY : 환작거주지_시도
# P_ADD_DIST: 환자거주지_시군구
# H_SEX: 성별
    # 1. 남자
    # 2. 여자
# AGE: 연령(만 나이)
# F_HAPP_ADD_CITY : 환자발생장소_시도
# F_HAPP_ADD_DIST: 환자 발생장소_시군구
# BYSTANDER_CPR_ELSE : 일반인 심폐소생술 시행종류 
    # 1. 심폐소생술(CPR)
    # 2. 자동심장충격기(AED)
    # 3. CPR+AED
# H_PLACE_PUBLIC : 급성심장정지 발생 장소
    # 1. 공공장소
    # 2. 비공공장소
    # 3. 기타
    # 4. 미상 

## 발생지 기준 

In [None]:
import pandas as pd
import numpy as np

In [None]:
# 2018년도/2019년도/2020년도 급성심정지환자 데이터 불러오기 
arrest_18 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_18xlsx.XLS")
arrest_19 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_19.xlsx")
arrest_20 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_20.xlsx")

In [None]:
# 필요한 컬럼만 추출 
arrest_18_df = arrest_18[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]
arrest_19_df = arrest_19[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]
arrest_20_df = arrest_20[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]

In [None]:
arrest_df = pd.concat([arrest_18_df, arrest_19_df, arrest_20_df])

In [None]:
arrest_df

In [None]:
seoulgu_arrest_df = arrest_df[(arrest_df['P_ADD_CITY']=='서울')].reset_index()
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['index'],axis='columns')
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df["성별"] = [
    "남성" if x == 1 else
    "여성" for x in seoulgu_arrest_df.H_SEX]

In [None]:
seoulgu_arrest_df["연령대"] = [
    "소아청소년" if x < 19 else
    "청년" if x <= 29 else 
    "중년" if x <= 49 else 
    "장년" if x <= 64 else 
    "노년" for x in seoulgu_arrest_df.AGE
]

In [None]:
seoulgu_arrest_df["시행종류"] = [
    "CPR" if x == 1.0 else
    "AED" if x == 2.0 else 
    "CPR+AED" if x == 3.0 else 
    "NO" for x in seoulgu_arrest_df.BYSTANDER_CPR_ELSE]
# 1. 심폐소생술(CPR)
# 2. 자동심장충격기(AED)
# 3. CPR+AED

In [None]:
seoulgu_arrest_df["발생장소"] = [
    "공공장소" if x == 1.0 else
    "비공공장소" if x == 2.0 else 
    "기타" if x == 3.0 else 
    "미상" for x in seoulgu_arrest_df.H_PLACE_PUBLIC]
# 1. 공공장소
# 2. 비공공장소
# 3. 기타
# 4. 미상 

In [None]:
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['H_SEX'],axis='columns')

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['BYSTANDER_CPR_ELSE'],axis='columns')

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['H_PLACE_PUBLIC'],axis='columns')

In [None]:
seoulgu_arrest_df

In [None]:
# YEAR: 급성심장정지 발생 연도
# P_ADD_CITY : 환작거주지_시도
# P_ADD_DIST: 환자거주지_시군구
# H_SEX: 성별
    # 1. 남자
    # 2. 여자
# AGE: 연령(만 나이)
# F_HAPP_ADD_CITY : 환자발생장소_시도
# F_HAPP_ADD_DIST: 환자 발생장소_시군구
# BYSTANDER_CPR_ELSE : 일반인 심폐소생술 시행종류 
    # 1. 심폐소생술(CPR)
    # 2. 자동심장충격기(AED)
    # 3. CPR+AED
# H_PLACE_PUBLIC : 급성심장정지 발생 장소
    # 1. 공공장소
    # 2. 비공공장소
    # 3. 기타
    # 4. 미상 

In [None]:
seoulgu_arrest_df.rename(columns={"YEAR": "발생년도",
                                    "P_ADD_CITY" : "환자거주지_시도",
                                    "P_ADD_DIST" : "소재지",
                                   "AGE": "연령(만)",
                                  "F_HAPP_ADD_CITY" : "환자발생장소_시도",
                                  "F_HAPP_ADD_DIST" : "환자발생장소_시군구"}, inplace=True)

In [None]:
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df[["발생년도", "환자거주지_시도", "소재지","성별","연령(만)","연령대","환자발생장소_시도","환자발생장소_시군구","발생장소","시행종류"]]

In [None]:
seoulgu_arrest_df

In [None]:
# 저장 후 주석처리
# seoulgu_arrest_df.to_csv("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/서울시_구별_급성심정지환자(거주지기준).csv") 

## 발생지 기준 

In [None]:
import pandas as pd
import numpy as np

In [None]:
# 2018년도/2019년도/2020년도 급성심정지환자 데이터 불러오기 
arrest_18 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_18xlsx.XLS")
arrest_19 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_19.xlsx")
arrest_20 = pd.read_excel("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/ohca_20.xlsx")

In [None]:
# 필요한 컬럼만 추출 
arrest_18_df = arrest_18[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]
arrest_19_df = arrest_19[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]
arrest_20_df = arrest_20[['YEAR', 'P_ADD_CITY','P_ADD_DIST','H_SEX', 'AGE', 'F_HAPP_ADD_CITY', 'F_HAPP_ADD_DIST', 'BYSTANDER_CPR_ELSE','H_PLACE_PUBLIC']]

In [None]:
arrest_df = pd.concat([arrest_18_df, arrest_19_df, arrest_20_df])

In [None]:
arrest_df

In [None]:
seoulgu_arrest_df = arrest_df[(arrest_df['F_HAPP_ADD_CITY']=='서울')].reset_index()
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['index'],axis='columns')
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df["성별"] = [
    "남성" if x == 1 else
    "여성" for x in seoulgu_arrest_df.H_SEX]

In [None]:
seoulgu_arrest_df["연령대"] = [
    "소아청소년" if x < 19 else
    "청년" if x <= 29 else 
    "중년" if x <= 49 else 
    "장년" if x <= 64 else 
    "노년" for x in seoulgu_arrest_df.AGE
]

In [None]:
seoulgu_arrest_df["시행종류"] = [
    "CPR" if x == 1.0 else
    "AED" if x == 2.0 else 
    "CPR+AED" if x == 3.0 else 
    "NO" for x in seoulgu_arrest_df.BYSTANDER_CPR_ELSE]
# 1. 심폐소생술(CPR)
# 2. 자동심장충격기(AED)
# 3. CPR+AED

In [None]:
seoulgu_arrest_df["발생장소"] = [
    "공공장소" if x == 1.0 else
    "비공공장소" if x == 2.0 else 
    "기타" if x == 3.0 else 
    "미상" for x in seoulgu_arrest_df.H_PLACE_PUBLIC]
# 1. 공공장소
# 2. 비공공장소
# 3. 기타
# 4. 미상 

In [None]:
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['H_SEX'],axis='columns')

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['BYSTANDER_CPR_ELSE'],axis='columns')

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df.drop(['H_PLACE_PUBLIC'],axis='columns')

In [None]:
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df.rename(columns={"YEAR": "발생년도",
                                    "P_ADD_CITY" : "환자거주지_시도",
                                    "P_ADD_DIST" : "환자거주지_시군구",
                                   "AGE": "연령(만)",
                                  "F_HAPP_ADD_CITY" : "환자발생장소_시도",
                                  "F_HAPP_ADD_DIST" : "소재지"}, inplace=True)

In [None]:
seoulgu_arrest_df

In [None]:
seoulgu_arrest_df = seoulgu_arrest_df[["발생년도", "환자발생장소_시도","소재지","성별","연령(만)","연령대","환자거주지_시도", "환자거주지_시군구","발생장소","시행종류"]]

In [None]:
seoulgu_arrest_df

In [None]:
# 저장 후 주석처리
# seoulgu_arrest_df.to_csv("C:/sooeun/DATAexam/전공프로젝트(빅데이터)/data/서울시_구별_급성심정지환자(발생지기준).csv") 