In [2]:
import pandas as pd
import numpy as np

# 1. 원천 데이터 로드
df_crm = pd.read_excel("daily_crm_activity_2026.xlsx")
# 병원 종류(규모) 정보를 가져오기 위해 배정 데이터와 Join (PHR 계산용)
df_hospitals = pd.read_excel("hospital_assignment_data.xlsx")[['병원ID', '종별코드명']]
df_crm = pd.merge(df_crm, df_hospitals, on='병원ID', how='left')

# 2. 담당자별/월별 집계
# 날짜에서 월 추출
df_crm['목표월'] = df_crm['활동일자'].str[:7] 

def calculate_indicators(group):
    # (1) HIR: 고가중치 활동(PT, 시연, 클로징) 비중
    high_impact_acts = ['PT', '시연', '클로징']
    hir = (group['활동명'].isin(high_impact_acts).sum() / len(group)) * 100
    
    # (2) RTR: 병원당 평균 방문 횟수 (관계 밀도)
    rtr = (len(group) / group['병원ID'].nunique()) * 10.0 # 0~100 스케일 조정용 상수
    
    # (3) BCR: 일별 활동량의 균일성 (표준편차 활용)
    daily_calls = group.groupby('활동일자')['콜수'].sum()
    bcr = 100 - (daily_calls.std() * 10) # 변동이 클수록 점수 하락
    
    # (4) PHR: 상급/종합병원 활동 비중
    core_hospitals = ['상급종합', '종합병원']
    phr = (group['종별코드명'].isin(core_hospitals).sum() / len(group)) * 100
    
    return pd.Series({
        'HIR': round(min(hir, 100), 1),
        'RTR': round(min(rtr, 100), 1),
        'BCR': round(min(max(bcr, 0), 100), 1),
        'PHR': round(min(phr, 100), 1)
    })

# 담당자별, 월별로 지수 산출
df_indicators = df_crm.groupby(['목표월', '지점ID', '지점명', '담당자ID', '담당자명']).apply(calculate_indicators).reset_index()

# 3. 결과 저장
output_file = "sfe_indicator_summary_2026.xlsx"
df_indicators.to_excel(output_file, index=False)

print(f"✅ 지표 로우데이터 생성 완료: {output_file}")
display(df_indicators.head())

✅ 지표 로우데이터 생성 완료: sfe_indicator_summary_2026.xlsx


  df_indicators = df_crm.groupby(['목표월', '지점ID', '지점명', '담당자ID', '담당자명']).apply(calculate_indicators).reset_index()


Unnamed: 0,목표월,지점ID,지점명,담당자ID,담당자명,HIR,RTR,BCR,PHR
0,2026-01,B01,서울지점,R016,박지유,34.5,100.0,85.5,100.0
1,2026-01,B01,서울지점,R017,박도윤,32.6,100.0,87.0,100.0
2,2026-01,B01,서울지점,R018,장도윤,33.6,100.0,85.5,100.0
3,2026-01,B01,서울지점,R019,강주원,35.7,100.0,88.3,100.0
4,2026-01,B01,서울지점,R020,김도윤,43.5,100.0,85.6,100.0
