# 5번 문제

### 0. DB 커넥션
+ 아래 접속정보 수정 필요
+ host, dbname, user, password, port

In [1]:
!pip install psycopg



In [2]:
import psycopg2
import pandas as pd

conn = psycopg2.connect(host="000.000.000.000",  # end-point 정보
                        dbname="dbname",  # db 명
                        user="user",  # 계정
                        password="password",  # 패스워드
                        port=5432)  # 포트

In [3]:
cur = conn.cursor()  # cursor 생성

### 1. 2형 당뇨병 and 18세 이상 환자 정보 추출
+ output : df(타입 : 데이터프레임)
+ df 컬럼 리스트
    + person_id : 환자 id
    + condition_start_date : 진단 일자
    + age_man : 만 나이

In [4]:
# 쿼리파일 read
f = open("./query/5_1.sql", "r", encoding="utf-8")
query = f.read()
f.close()
print(query)

/*
 * 5번 문제 1차 쿼리
 * 아래 조건에 모두 해당하는 환자수를 추출
 * a. 제 2형 당뇨병을 진단받은 환자 추출
 * b. 18세 이상
*/ 

WITH 
t2d AS (
	-- 조건 a : 제 2형 당뇨병 (Type 2 diabetes, T2D) 진단
	SELECT 
			person_id
		,	condition_start_date
	FROM de.condition_occurrence
	WHERE condition_concept_id IN (3191208, 36684827, 3194332, 3193274, 43531010
									, 4130162, 45766052, 45757474, 4099651, 4129519
									, 4063043, 4230254, 4193704, 4304377, 201826
									, 3194082, 3192767)
)
, person_age AS (
	-- 환자 나이 계산 / age() 함수 사용, 현재 시간(DBMS) 기준
	SELECT
			person_id
		,	birth_datetime
		,	EXTRACT(YEAR FROM age(now(), birth_datetime)) AS age_man
	FROM de.person
)
, t2d_man18_list AS (
SELECT 
		t2d.person_id
	,	t2d.condition_start_date
	,	pa.birth_datetime
	,	pa.age_man
FROM t2d t2d
LEFT JOIN person_age pa
ON t2d.person_id = pa.person_id
WHERE pa.age_man >= 18
)
SELECT 
		person_id  -- 환자 id
	,	condition_start_date -- 질병 진단일자
	,	age_man  -- 만 나이
FROM t2d_man18_list


In [5]:
# 쿼리 실행 및 데이터프레임 생성
cur.execute(query)
col_nm = [x[0] for x in cur.description]
df = pd.DataFrame(cur.fetchall(), columns=col_nm)

### 2. 환자별 Metformin (drug_concept_id = 40163924) 90일 이상 복용여부 확인
+ 조건 : 제 2형 당뇨병을 진단받은 이후
+ Output : cnt

In [6]:
cnt = 0 # 90일 이상 복용한 환자수

for record in df.itertuples():
    cur.execute("""
                SELECT 
                    sum(drug_exposure_end_date - drug_exposure_start_date + 1)
                FROM de.drug_exposure
                WHERE person_id = %(person_id)s  -- person_id
                AND drug_concept_id = '40163924'  -- concept_id(고정)
                AND drug_exposure_start_date >= %(condition_start_date)s -- condition_start_date
                """,
               {"person_id" : record.person_id, "condition_start_date" : record.condition_start_date})
    
    res = cur.fetchone()[0]  # 복용일 수 추출
    
    if res:  # 복용을 한 경우
        if res >= 90:  # 90일 이상인지 확인
            cnt += 1

In [7]:
print(cnt)

30


### 3. 결과
+ 조건에 맞는 환자수 : 30명