#### 특정 시장의 업종별 수익률 상위 n개 종목의 위험도 분포를 파이차트로 시각화

In [1]:
# 데이터 분석을 위한 패키지
import numpy as np
import pandas as pd

In [2]:
# 시각화 패키지
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

In [3]:
import FinanceDataReader as fdr

In [4]:
import koreanize_matplotlib

In [5]:
from data_loader import load_sector_data

In [6]:
# 모든 컬럼,행을 출력하도록 설정
pd.set_option('display.max_columns', None) # None으로 설정하면 모든 컬럼 출력
pd.set_option('display.max_rows', None) #None으로 설정하면 모든 행 출력

In [7]:
# 각 시장별 업종 리스트
def print_sector_lists(market):
  
  if market in ['KOSPI', 'KOSDAQ', 'ETF'] : 
    sector_list = load_sector_data(market=market)['Sector'].unique()
  else : 
    raise ValueError('KOSPI, KOSDAQ, ETF 중 하나의 시장을 입력해야 합니다.')
  
  print(f'{market} 시장의 업종 리스트 : {sector_list}')
    

In [6]:
df = pd.read_csv('KOSPI_add_sector_2025-01-10_1m.csv')

In [9]:
df = df.sort_values(by='TotalReturn', ascending=False).head(100)

Unnamed: 0,Code,Name,Volatility,TotalReturn,Sector,Volume,Amount,Marcap,Risk
909,45014K,코오롱모빌리티그룹우,14.91,115.44,자동차,53789,358427990,16406881600,3
413,035510,신세계 I&C,9.44,92.05,IT서비스,1404194,23451492330,254373876400,3
271,097230,HJ중공업,8.88,87.97,건설,1110470,7936829830,597909337580,3
753,001210,금호전기,4.13,80.18,디스플레이장비및부품,1182702,1373363302,66466452105,3
522,077500,유니퀘스트,7.63,79.35,반도체와반도체장비,947251,7749804290,173448819060,3
...,...,...,...,...,...,...,...,...,...
145,007660,이수페타시스,6.44,13.32,전자장비와기기,2015399,57065457100,1755088127250,3
252,003570,SNT다이내믹스,3.30,13.13,자동차부품,50900,1004899000,660398562420,3
620,023450,동남합성,1.99,13.12,화학,587,20041400,119000000000,2
758,465770,STX그린로지스,3.59,13.11,해운사,303453,2830200840,66332046000,3


In [7]:
df = df.sort_values(by='TotalReturn', ascending=False).head(100)
    
# 위험도별 종목 비중 계산
risk_distribution = df['Risk'].value_counts().reset_index()
risk_distribution.columns = ['Risk', 'Count']

risk_distribution

Unnamed: 0,Risk,Count
0,3,80
1,2,20


In [8]:
# 특정 시장의 업종별 수익률 상위 n개 종목의 위험도 분포를 파이차트로 시각화
def visualize_sector_risk_distribution(market=None, sector=None, month_ago=1, cnt=None):

    df = load_sector_data(market, month_ago=month_ago)
    if sector is not None:
        if sector not in df['Sector'].unique():
            raise ValueError(f"'{sector}'는(은) 유효한 섹터가 아닙니다. 사용 가능한 섹터: {df['Sector'].unique()}")
        df = df[df['Sector'] == sector]
    
    if cnt is not None :
        df = df.sort_values(by='TotalReturn', ascending=False).head(cnt)
    
    # 위험도별 종목 비중 계산
    risk_distribution = df['Risk'].value_counts().reset_index()
    risk_distribution.columns = ['Risk', 'Count']
    
    if sector is not None :
        if cnt is not None:   
            title = f'{market}시장 {sector}업종 내 {month_ago}개월 평균 수익률 상위 {cnt}개 종목 위험도 비중'
        else :
            title = f'{market}시장 {sector}업종 내 {month_ago}개월 종목 위험도 비중'
    elif cnt is not None:
        title = f'{market}시장 내 {month_ago}개월 수익률 상위 {cnt}개 종목 위험도 비중'
    else :
        title = f'{market}시장 내 {month_ago}개월 종목 위험도 비중'

    fig = px.pie(
        risk_distribution,
        values='Count',
        names='Risk',
        title=title,
        labels={'Risk': '위험도', 'Count': '종목 수'}
    )
    # 위험도 설명 추가
    risk_explanations = """
    위험도 설명:
    1: 낮음 - 변동성이 작고 안정적인 종목 (시장내 변동성 하위 25%)
    2: 중간 - 평균적인 변동성을 가진 종목 (시장내 변동성 25%~75%구간)
    3: 높음 - 변동성이 크고 위험한 종목   (시장내 변동성 75%이상 구간)
    """
    fig.add_annotation(
        text=risk_explanations,
        showarrow=False,
        xref="paper", yref="paper",
        x=0.5, y=-0.3,  # 위치 조정
        font=dict(size=12),  # 글자 크기
        align="center"
    )
    fig.update_layout(
        title_x=0.5,
        title_font=dict(size=20, color='black', family='Arial')
    ) 
   # 그래프 보여주기
    fig.show()

In [12]:
visualize_sector_risk_distribution('KOSDAQ', cnt=100)

1개월 간의 data를 불러옵니다.
