# 고혈압-당뇨 동반질환 코호트 분석

**작성자**: 임상연구지원팀  
**작성일**: 2026-02-07  
**SNOMED CT**: 고혈압(38341003), 당뇨(44054006)  

## 분석 목표
- 고혈압과 당뇨를 동시에 보유한 환자 코호트 식별
- 동반질환 환자의 인구학적 특성 분석
- 약물 처방 패턴 분석
- 입원 빈도 비교

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sqlalchemy import create_engine

engine = create_engine('postgresql://omopuser:omop@localhost:5436/omop_cdm')
print('OMOP CDM 연결 완료')

In [None]:
# 고혈압 환자 코호트
hypertension_query = """
SELECT DISTINCT person_id
FROM condition_occurrence
WHERE condition_concept_id = 38341003
"""

# 당뇨 환자 코호트
diabetes_query = """
SELECT DISTINCT person_id
FROM condition_occurrence
WHERE condition_concept_id = 44054006
"""

df_hyp = pd.read_sql(hypertension_query, engine)
df_dia = pd.read_sql(diabetes_query, engine)

# 동반질환 환자 (교집합)
comorbid = set(df_hyp['person_id']) & set(df_dia['person_id'])

print(f'고혈압 환자: {len(df_hyp):,}명')
print(f'당뇨 환자: {len(df_dia):,}명')
print(f'동반질환 환자: {len(comorbid):,}명')

In [None]:
# 동반질환 환자의 성별/연령 분포
if comorbid:
    person_ids = ','.join(str(x) for x in list(comorbid)[:1000])
    demo_query = f"""
    SELECT 
        gender_source_value AS 성별,
        2026 - year_of_birth AS 나이
    FROM person
    WHERE person_id IN ({person_ids})
    """
    
    df_demo = pd.read_sql(demo_query, engine)
    
    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
    
    # 성별 분포
    df_demo['성별'].value_counts().plot.pie(ax=axes[0], autopct='%1.1f%%')
    axes[0].set_title('동반질환 환자 성별 분포')
    
    # 연령 분포
    df_demo['나이'].hist(ax=axes[1], bins=20, color='steelblue', edgecolor='white')
    axes[1].set_title('동반질환 환자 연령 분포')
    axes[1].set_xlabel('나이')
    axes[1].set_ylabel('환자 수')
    
    plt.tight_layout()
    plt.show()

In [None]:
# 동반질환 환자 약물 처방 상위 10개
if comorbid:
    person_ids = ','.join(str(x) for x in list(comorbid)[:1000])
    drug_query = f"""
    SELECT 
        drug_source_value AS 약물명,
        COUNT(*) AS 처방건수,
        COUNT(DISTINCT person_id) AS 환자수
    FROM drug_exposure
    WHERE person_id IN ({person_ids})
      AND drug_source_value IS NOT NULL
    GROUP BY drug_source_value
    ORDER BY 처방건수 DESC
    LIMIT 10
    """
    
    df_drug = pd.read_sql(drug_query, engine)
    
    plt.figure(figsize=(12, 6))
    sns.barplot(data=df_drug, x='처방건수', y='약물명', palette='Reds_r')
    plt.title('동반질환 환자 처방 약물 Top 10', fontsize=14)
    plt.tight_layout()
    plt.show()

## 분석 결론

1. 고혈압과 당뇨의 동반 유병률을 확인
2. 동반질환 환자는 주로 50대 이상에 집중
3. 약물 처방 패턴에서 다약제 복용 경향 관찰
4. 향후 연구: 재입원율, 사망률 등 예후 분석으로 확장 가능