In [1]:
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
import warnings
import plotly.express as px
import plotly.io as pio
import os

from matplotlib.gridspec import GridSpec
from tqdm.notebook import tqdm
from sklearn.ensemble import RandomForestClassifier


# ✅ Seaborn 테마 설정
sns.set_theme(
    style='white',  # 배경 스타일 ('darkgrid', 'whitegrid', 'dark', 'white', 'ticks' 가능)
    font='BM Hanna Pro',  # 폰트 설정 (Mac: 'AppleGothic', Windows: 'Malgun Gothic' 가능)
    rc={
        'axes.unicode_minus': False,  # 마이너스 기호 깨짐 방지
        'figure.figsize': (12, 6),    # 기본 그래프 크기 설정
        'axes.labelsize': 14,         # 축 레이블 크기
        'xtick.labelsize': 12,        # x축 눈금 크기
        'ytick.labelsize': 12,        # y축 눈금 크기
        'legend.fontsize': 12,        # 범례 폰트 크기
        'axes.titleweight': 'bold',   # 제목 굵게 표시
        'axes.titlesize': 16          # 제목 크기 설정
    }
)

# ✅ Jupyter Notebook 그래프 선명하게 출력
%config InlineBackend.figure_format = 'retina'

# ✅ Pandas 출력 설정 (데이터프레임 가독성 향상)
pd.set_option("display.max_columns", None)  # 모든 컬럼 출력

# ✅ 경고 메시지 무시 (불필요한 Warning 제거)
warnings.filterwarnings("ignore")

# ✅ Jupyter에서 외부 모듈 변경 사항 자동 반영
%load_ext autoreload
%autoreload 2

# ✅ Seaborn 추가 스타일링 (폰트 및 컬러)
sns.set_context("notebook", font_scale=1.2)  # 노트북 환경에 적합한 폰트 크기 조정

# ✅ Plotly 대화형 그래프 설정 (VSCode에서 대화형 그래프 활성화)
pio.renderers.default = "vscode" # VSCode에서 대화형 Plotly 그래프 활성화

# ✅ Pandas 진행률 표시 (대량 데이터 처리 시 유용)
tqdm.pandas()

In [2]:
recruit_df = pd.read_csv("../data/campus_recruitment.csv")
recruit_df.head()

Unnamed: 0,sl_no,gender,ssc_p,ssc_b,hsc_p,hsc_b,hsc_s,degree_p,degree_t,workex,etest_p,specialisation,mba_p,status,salary
0,1,M,67.0,Others,91.0,Others,Commerce,58.0,Sci&Tech,No,55.0,Mkt&HR,58.8,Placed,270000.0
1,2,M,79.33,Central,78.33,Others,Science,77.48,Sci&Tech,Yes,86.5,Mkt&Fin,66.28,Placed,200000.0
2,3,M,65.0,Central,68.0,Central,Arts,64.0,Comm&Mgmt,No,75.0,Mkt&Fin,57.8,Placed,250000.0
3,4,M,56.0,Central,52.0,Central,Science,52.0,Sci&Tech,No,66.0,Mkt&HR,59.43,Not Placed,0.0
4,5,M,85.8,Central,73.6,Central,Commerce,73.3,Comm&Mgmt,No,96.8,Mkt&Fin,55.5,Placed,425000.0


In [6]:
recruit_groupby1 = recruit_df.groupby('degree_t', observed=False)['salary'].mean().reset_index()

fig = px.bar(recruit_groupby1, x='degree_t', y='salary')
fig.show()

In [7]:
px.bar(recruit_groupby1, x='degree_t', y='salary')

In [9]:
recruit_groupby2 = recruit_df.groupby(['degree_t', 'workex'], observed=False)[['salary']].mean().reset_index()

px.bar(recruit_groupby2, x='degree_t', y='salary', color='workex')

In [10]:
px.bar(recruit_groupby2, x='degree_t', y='salary', color='workex', barmode='group')

In [11]:
px.bar(recruit_groupby2, x='degree_t', y='salary', facet_col='workex')

In [12]:
px.bar(recruit_groupby2, x='degree_t', y='salary', facet_col='workex', color='workex')

In [13]:
px.bar(recruit_groupby2, x='degree_t', y='salary', facet_row='workex', color='workex')

In [14]:
gapminder_df = pd.read_csv("../data/gapminder_1960to2020.csv")
gapminder_df.head()

Unnamed: 0,Country,Continent,Year,Population,Life Expectancy,GDP per Cap,Military Expenditure
0,Australia,Oceania,1960,10.3,71.1,1810.0,460.0
1,Austria,Europe,1960,7.05,69.0,935.0,91.6
2,Belgium,Europe,1960,9.11,70.1,1270.0,383.0
3,Benin,Africa,1960,2.51,44.8,93.0,1.3
4,Burkina Faso,Africa,1960,4.78,39.5,68.4,1.27


In [15]:
px.line(gapminder_df.query('Country == "South Korea"'), x='Year', y='Life Expectancy')

In [17]:
temp = gapminder_df.query('Country in ["South Korea", "Japan", "China"]')

px.line(temp, x='Year', y='Life Expectancy', color='Country')

In [19]:
px.line(temp, x='Year', y='Life Expectancy', color='Country', symbol='Country')