# module import

In [2]:
# 데이터 처리를 위한 모듈들
import pandas as pd
import numpy as np

# 시각화를 위한 모듈들
import matplotlib.pyplot as plt
import matplotlib as mpl

import seaborn as sns
sns.set_theme(style="whitegrid")

# 시각화를 위한 사전 설정들 1.
# %matplotlib inline을 주피터 노트북 셀에 실행하면 해당 셀 아래에 그래프 출력

%matplotlib inline

# 시각화를 위한 사전 설정들 2.
# 한글 폰트 설정

from matplotlib import font_manager, rc  # 한글폰트 설정
import platform

if platform.system()=="Windows":
    font_name=font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name()
    rc('font', family=font_name)
    
mpl.rcParams['axes.unicode_minus']=False

# 기타 사전 설정
# warnigs 표시 설정 = ignore

import warnings
warnings.filterwarnings("ignore")

# 간단하게 시각화
import plotly.express as px

# 세세하게 시각화
import plotly.graph_objects as go

# subplot 생성
from plotly.subplots import make_subplots

# 지도 기반 시각화
# pip install folium
import folium

# 재산공개내역(aaset disclosure)

## asset data

In [198]:
ast_det = pd.read_excel("202303_001.xlsx", sheet_name='상세재산')
ast_tot = pd.read_excel("202303_001.xlsx", sheet_name='총계_명단')

In [199]:
ast_tot

Unnamed: 0,연월,no,monaCode,소속구분,소속,직위,이름,종전가액,증가액,감소액,현재가액,증감액,가액변동
0,202303,143,YOG1280B,1.국회의원,국회,국회의원,안철수,204055509,6419280,75765185,134709604,-69345905,-69184290.0
1,202303,230,DPZ7685X,1.국회의원,국회,국회의원,전봉민,106555786,13196875,63835889,55916772,-50639014,
2,202303,92,N4R2421C,1.국회의원,국회,국회의원,박덕흠,67238461,8609829,23231146,52617144,-14621317,
3,202303,104,4019850M,1.국회의원,국회,국회의원,박정,45814826,7464488,2680806,50598508,4783682,4629964.0
4,202303,169,MSY7784L,1.국회의원,국회,국회의원,윤상현,57792956,1735857,29614404,29914409,-27878547,-26304172.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...
328,202303,170,KFS1358P,1.국회의원,국회,국회의원,윤영덕,206514,145903,127499,224918,18404,3100.0
329,202303,58,LQW3652K,1.국회의원,국회,국회의원,김웅,98054,45324,12884,130494,32440,-10290.0
330,202303,33,MLH1404S,1.국회의원,국회,국회의원,김민석,-264758,280198,29450,-14010,250748,5000.0
331,202303,316,,2.국회사무처,국회,수석전문위원,오명호,-304102,23423,900,-281579,22523,0.0


### 자산 데이터 자료형 변경

#### '상세재산' 자산 데이터 자료형 변경

In [200]:
ast_det['종전가액'] = pd.to_numeric(ast_det['종전가액'], errors='coerce')
ast_det['증가액'] = pd.to_numeric(ast_det['증가액'], errors='coerce')
ast_det['증가액실거래가격'] = pd.to_numeric(ast_det['증가액실거래가격'], errors='coerce')
ast_det['감소액'] = pd.to_numeric(ast_det['감소액'], errors='coerce')
ast_det['감소액실거래가격'] = pd.to_numeric(ast_det['감소액실거래가격'], errors='coerce')
ast_det['현재가액'] = pd.to_numeric(ast_det['현재가액'], errors='coerce')

In [201]:
ast_det[['종전가액','증가액','증가액실거래가격','감소액','감소액실거래가격','현재가액']].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5971 entries, 0 to 5970
Data columns (total 6 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   종전가액      5939 non-null   float64
 1   증가액       5939 non-null   float64
 2   증가액실거래가격  81 non-null     float64
 3   감소액       5939 non-null   float64
 4   감소액실거래가격  84 non-null     float64
 5   현재가액      5939 non-null   float64
dtypes: float64(6)
memory usage: 280.0 KB


#### '상세재산' 자산 데이터 NaN -> Zero 로 변경

In [234]:
ast_det[['종전가액','증가액','증가액실거래가격','감소액','감소액실거래가격','현재가액']] =\
ast_det[['종전가액','증가액','증가액실거래가격','감소액','감소액실거래가격','현재가액']].fillna(value=0)
ast_det[['종전가액','증가액','증가액실거래가격','감소액','감소액실거래가격','현재가액']].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5971 entries, 0 to 5970
Data columns (total 6 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   종전가액      5971 non-null   float64
 1   증가액       5971 non-null   float64
 2   증가액실거래가격  5971 non-null   float64
 3   감소액       5971 non-null   float64
 4   감소액실거래가격  5971 non-null   float64
 5   현재가액      5971 non-null   float64
dtypes: float64(6)
memory usage: 280.0 KB


In [202]:
ast_tot.columns

Index(['연월', 'no', 'monaCode', '소속구분', '소속', '직위', '이름', '종전가액', '증가액', '감소액',
       '현재가액', '증감액', '가액변동'],
      dtype='object')

#### '총계_명단' 자산 데이터 자료형 변경

In [203]:
ast_tot['종전가액'] = pd.to_numeric(ast_tot['종전가액'], errors='coerce')
ast_tot['증가액'] = pd.to_numeric(ast_tot['증가액'], errors='coerce')
ast_tot['감소액'] = pd.to_numeric(ast_tot['감소액'], errors='coerce')
ast_tot['현재가액'] = pd.to_numeric(ast_tot['현재가액'], errors='coerce')
ast_tot['증감액'] = pd.to_numeric(ast_tot['증감액'], errors='coerce')
ast_tot['가액변동'] = pd.to_numeric(ast_tot['가액변동'], errors='coerce')

In [204]:
ast_tot[['종전가액', '증가액', '감소액', '현재가액', '증감액', '가액변동']].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 333 entries, 0 to 332
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   종전가액    333 non-null    int64  
 1   증가액     333 non-null    int64  
 2   감소액     333 non-null    int64  
 3   현재가액    333 non-null    int64  
 4   증감액     333 non-null    int64  
 5   가액변동    330 non-null    float64
dtypes: float64(1), int64(5)
memory usage: 15.7 KB


#### '총계_명단' 자산 데이터 NaN -> Zero 로 변경

In [235]:
ast_tot[['종전가액', '증가액', '감소액', '현재가액', '증감액', '가액변동']]=\
ast_tot[['종전가액', '증가액', '감소액', '현재가액', '증감액', '가액변동']].fillna(value=0)
ast_tot[['종전가액', '증가액', '감소액', '현재가액', '증감액', '가액변동']].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 333 entries, 0 to 332
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   종전가액    333 non-null    int64  
 1   증가액     333 non-null    int64  
 2   감소액     333 non-null    int64  
 3   현재가액    333 non-null    int64  
 4   증감액     333 non-null    int64  
 5   가액변동    333 non-null    float64
dtypes: float64(1), int64(5)
memory usage: 15.7 KB


In [236]:
ast_det.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5971 entries, 0 to 5970
Data columns (total 18 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   연월               5971 non-null   int64  
 1   no               5971 non-null   int64  
 2   monaCode         5317 non-null   object 
 3   소속구분             5971 non-null   object 
 4   소속               5971 non-null   object 
 5   직위               5971 non-null   object 
 6   이름               5971 non-null   object 
 7   재산구분             5971 non-null   object 
 8   본인과의관계           5971 non-null   object 
 9   재산의 종류           5971 non-null   object 
 10  소재지 면적 등 권리의 명세  5971 non-null   object 
 11  종전가액             5971 non-null   float64
 12  증가액              5971 non-null   float64
 13  증가액실거래가격         5971 non-null   float64
 14  감소액              5971 non-null   float64
 15  감소액실거래가격         5971 non-null   float64
 16  현재가액             5971 non-null   float64
 17  변동사유          

In [237]:
ast_det['재산의 종류'].to_frame()

Unnamed: 0,재산의 종류
0,예금
1,공장
2,비상장주식
3,비상장주식
4,예금
...,...
5966,예금
5967,자동차
5968,아파트(전세(임차)권)
5969,금융채무


In [238]:
ast_det[['재산구분','재산의 종류']]

Unnamed: 0,재산구분,재산의 종류
0,예금,예금
1,건물,공장
2,증권,비상장주식
3,증권,비상장주식
4,예금,예금
...,...,...
5966,예금,예금
5967,부동산에 관한 규정이 준용되는 권리와 자동차·건설기계·선박 및 항공기,자동차
5968,건물,아파트(전세(임차)권)
5969,채무,금융채무


In [239]:
ast_det[['재산구분','재산의 종류']] = ast_det[['재산구분','재산의 종류']].fillna(method='ffill', axis=1)

In [240]:
ast_det.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5971 entries, 0 to 5970
Data columns (total 18 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   연월               5971 non-null   int64  
 1   no               5971 non-null   int64  
 2   monaCode         5317 non-null   object 
 3   소속구분             5971 non-null   object 
 4   소속               5971 non-null   object 
 5   직위               5971 non-null   object 
 6   이름               5971 non-null   object 
 7   재산구분             5971 non-null   object 
 8   본인과의관계           5971 non-null   object 
 9   재산의 종류           5971 non-null   object 
 10  소재지 면적 등 권리의 명세  5971 non-null   object 
 11  종전가액             5971 non-null   float64
 12  증가액              5971 non-null   float64
 13  증가액실거래가격         5971 non-null   float64
 14  감소액              5971 non-null   float64
 15  감소액실거래가격         5971 non-null   float64
 16  현재가액             5971 non-null   float64
 17  변동사유          

## 소속구분별 자산 총액

In [241]:
ast_tot[ast_tot['현재가액']>0]['현재가액'].sum()

1113251641

In [242]:
ast_det[ast_det['현재가액']>0]['현재가액'].sum()

1374283442.0

In [243]:
ast_det[ast_det['현재가액']>0]['현재가액'].sum() - ast_tot[ast_tot['현재가액']>0]['현재가액'].sum()
# 자산 2천억 차이가 발생한다...?

261031801.0

In [244]:
t_df = ast_tot.groupby('소속구분')['현재가액'].agg('sum').reset_index() #.reindex(range(1,6))
t_df

Unnamed: 0,소속구분,현재가액
0,1.국회의원,1031450237
1,2.국회사무처,73693186
2,3.국회도서관,3251947
3,4.국회예산정책처,1783081
4,5.국회입법조사처,1843295


In [245]:
div_html = t_df.to_html(index=False)
div_html

'<table border="1" class="dataframe">\n  <thead>\n    <tr style="text-align: right;">\n      <th>소속구분</th>\n      <th>현재가액</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <td>1.국회의원</td>\n      <td>1031450237</td>\n    </tr>\n    <tr>\n      <td>2.국회사무처</td>\n      <td>73693186</td>\n    </tr>\n    <tr>\n      <td>3.국회도서관</td>\n      <td>3251947</td>\n    </tr>\n    <tr>\n      <td>4.국회예산정책처</td>\n      <td>1783081</td>\n    </tr>\n    <tr>\n      <td>5.국회입법조사처</td>\n      <td>1843295</td>\n    </tr>\n  </tbody>\n</table>'

In [246]:
with open('div_html.html', 'w', encoding='utf-8') as file:
    file.write(div_html)

###  소속구분별 자산 총액 차트

In [247]:
fig = px.bar(t_df.sort_values('현재가액', ascending=True),
             x='현재가액',
             y='소속구분',
             title = '국회 소속 구분별 자산 총액 (재산의 종류별 총합 기준) : 1조 1천 132억',
             text_auto=True
            )

fig.update_layout(
    width = 1000,
    height = 300,
)

fig.update_xaxes(title_text='자산총액(단위: 조(B), 10억(M))')
fig.update_yaxes(title_text='')

fig.show()
fig.write_html('asset_total.html')

## 개인별 자산 총액

### '총계_명단' 기준

In [338]:
by_name_tot = ast_tot.groupby('이름')

In [343]:
indi_rank_tot = by_name_tot['현재가액'].sum().reset_index().sort_values('현재가액', ascending=False)
indi_rank_tot.index = range(1, len(indi_rank_tot)+1)
indi_rank_tot

Unnamed: 0,이름,현재가액
1,안철수,134709604
2,전봉민,55916772
3,박덕흠,52617144
4,박정,50598508
5,윤상현,29914409
...,...,...
327,윤영덕,224918
328,김웅,130494
329,김민석,-14010
330,오명호,-281579


In [346]:
indi_rank_tot[indi_rank_tot['이름'] == '진선미']

Unnamed: 0,이름,현재가액
331,진선미,-934306


### '상세재산' 기준

In [340]:
by_name_det = ast_det.groupby('이름')

In [344]:
indi_rank_det = by_name_det['현재가액'].sum().reset_index().sort_values('현재가액', ascending=False)
indi_rank_det.index = range(1, len(indi_rank_det)+1)
indi_rank_det

Unnamed: 0,이름,현재가액
1,안철수,136449604.0
2,박정,77155478.0
3,전봉민,55936604.0
4,박덕흠,52677144.0
5,백종헌,32280784.0
...,...,...
327,윤미향,534015.0
328,조오섭,509818.0
329,윤재갑,504469.0
330,유정주,498728.0


In [356]:
indi_rank_det[indi_rank_det['이름'] == '진선미']

Unnamed: 0,이름,현재가액
146,진선미,2594628.0


### 개인별 자산 분석 (총액 - 부채*2)

#### 개인별 자산 구성

In [357]:
안철수 = by_name_det.get_group('안철수')[['재산구분','재산의 종류','현재가액']]
안철수

Unnamed: 0,재산구분,재산의 종류,현재가액
2842,비영리법인에 출연한 재산,출연,0.0
2843,증권,상장주식,124062000.0
2844,예금,예금,2219702.0
2845,증권,기타(채권),2137782.0
2846,건물,복합건물(주택+상가)(전세(임차)권),1900000.0
2847,예금,예금,1368931.0
2848,건물,아파트,1205000.0
2849,건물,아파트(전세(임차)권),870000.0
2850,채권,채권,870000.0
2851,채무,채무,870000.0


In [393]:
temp = 안철수.groupby('재산구분').sum().sort_values('현재가액', ascending=False).reset_index()
temp

Unnamed: 0,재산구분,현재가액
0,증권,126699782.0
1,건물,4005000.0
2,예금,3872547.0
3,채권,870000.0
4,채무,870000.0
5,토지,80515.0
6,부동산에 관한 규정이 준용되는 권리와 자동차·건설기계·선박 및 항공기,45190.0
7,정치자금법에 따른 정치자금의 수입 및 지출을 위한 예금계좌의 예금,6570.0
8,고지거부 및 등록제외사항,0.0
9,비영리법인에 출연한 재산,0.0


In [423]:
indi_total_asset = float(temp['현재가액'].sum() - temp[temp['재산구분']=='채무']['현재가액']*2)/100000
indi_total_asset

1347.09604

In [462]:
fig = px.pie(temp, values='현재가액', names='재산구분',
             title=f"\U0001F911 국회의원/안철수 : {indi_total_asset} 억원 (채무 제외 총액)",
             hover_data=['현재가액'], labels={'현재가액':'현재가액'})

fig.update_traces(textposition='inside', textinfo='percent+label')

fig.show()

# HTML 저장
fig.write_html('indiv_asset_001.html')

#### 개인별 자산 구성 함수

In [493]:
def indiv_asset_analysis(name_):
    temp1 = by_name_det.get_group(name_)[['재산구분','재산의 종류','현재가액']]
    temp2 = temp1.groupby('재산구분').sum().sort_values('현재가액', ascending=False).reset_index()
    temp3 = float(temp2['현재가액'].sum() - temp2[temp2['재산구분']=='채무']['현재가액']*2)/100000
    
    fig = px.pie(temp1, values='현재가액', names='재산구분',
             title=f"국회의원/{name_}: {temp3} 억원 (채무 제외 총액)",
             hover_data=['현재가액'], labels={'현재가액':'현재가액'})

    fig.update_traces(textposition='inside', textinfo='percent+label')
    
    fig.add_annotation(
        text='\U0001F911',
        x=0.5,  # x 위치 (중앙)
        y=0.5,  # y 위치 (중앙)
        showarrow=False,  # 화살표 표시 여부
        font=dict(size=68)  # 이모지 크기 조정
    )
    
    fig.show()
    
    return name_, indi_total_asset
indiv_asset_analysis('안철수')

('안철수', 1347.09604)

In [490]:
indiv_asset_analysis('김진표')

('김진표', 1347.09604)

In [491]:
진선미 = by_name_det.get_group('진선미')[['재산구분','재산의 종류','현재가액']]
진선미

Unnamed: 0,재산구분,재산의 종류,현재가액
5264,채무,채무,1603160.0
5265,채권,채권,380000.0
5266,건물,다세대주택(전세(임차)권),200000.0
5267,건물,아파트(전세(임차)권),100000.0
5268,채무,금융채무,83207.0
5269,채무,금융채무,78100.0
5270,예금,예금,76673.0
5271,정치자금법에 따른 정치자금의 수입 및 지출을 위한 예금계좌의 예금,정치자금법에 따른 정치자금의 수입 및 지출을 위한 예금계좌의 예금,59085.0
5272,증권,상장주식,9312.0
5273,예금,예금,4668.0


In [492]:
indiv_asset_analysis('진선미')

('진선미', 1347.09604)

### 국회의장

In [253]:
p1_t = ast_tot[ast_tot['직위'] == '국회의장']['현재가액'].sum()
p1_t

3067680

In [254]:
p1_d = ast_det[ast_det['직위'] == '국회의장']['현재가액'].sum()
p1_d

4367680.0

In [255]:
p1_d - p1_t

# 13억 차이 ...?

1300000.0

In [256]:
chairman = ast_det[ast_det['직위'] == '국회의장']

In [257]:
chairman.columns

Index(['연월', 'no', 'monaCode', '소속구분', '소속', '직위', '이름', '재산구분', '본인과의관계',
       '재산의 종류', '소재지 면적 등 권리의 명세', '종전가액', '증가액', '증가액실거래가격', '감소액',
       '감소액실거래가격', '현재가액', '변동사유'],
      dtype='object')

In [258]:
chairman[['이름','재산구분','본인과의관계','재산의 종류','소재지 면적 등 권리의 명세','현재가액']]

Unnamed: 0,이름,재산구분,본인과의관계,재산의 종류,소재지 면적 등 권리의 명세,현재가액
1154,김진표,건물,본인,아파트,서울특별시 강남구 도곡동 개포4차 우성 아파트 건물153.70㎡,2422000.0
1155,김진표,채무,본인,건물임대채무,서울특별시 강남구 도곡동 개포4차 우성 아파트임대보증금 감소,650000.0
1156,김진표,건물,배우자,아파트(전세(임차)권),경기도 수원시 팔달구 우만동 월드메르디앙 아파트 건물189.95㎡,483000.0
1157,김진표,예금,본인,예금,"(주)KEB하나은행 4, KB증권 5, 국민은행 35,675(3,590 감소), 농...",462498.0
1158,김진표,예금,배우자,예금,"KB증권 4, 미래에셋생명보험 12,000, 삼성생명보험92,095, 삼성화재해상보...",280370.0
1159,김진표,회원권,본인,헬스,용평리조트 피트니스 센터,35000.0
1160,김진표,회원권,본인,콘도미니엄,용평리조트,33250.0
1161,김진표,정치자금법에 따른 정치자금의 수입 및 지출을 위한 예금계좌의 예금,본인,정치자금법에 따른 정치자금의 수입 및 지출을 위한 예금계좌의 예금,"농협은행 1,562(50,435 감소)",1562.0
1162,김진표,부동산에 관한 규정이 준용되는 권리와 자동차·건설기계·선박 및 항공기,배우자,자동차,"2014년식 제네시스 배기량(3,342cc) 감소",0.0
1163,김진표,고지거부 및 등록제외사항,장남,고지거부 및 등록제외사항,고지거부,0.0
