<a href="https://colab.research.google.com/github/pinggu95/deep_dive_AI/blob/main/11%EC%9D%BC%EC%B0%A8_python_%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D5_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Plotly 인터렉티브 환경 문법

In [81]:
!pip install pandas plotly



In [82]:
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
import seaborn as sns

### penguins
| 컬럼명                 | 설명                                                           |
| ------------------- | ------------------------------------------------------------ |
| `species`           | 펭귄의 종(species) 이름입니다. (`Adelie`, `Chinstrap`, `Gentoo` 중 하나) |
| `island`            | 펭귄이 발견된 섬 이름 (`Biscoe`, `Dream`, `Torgersen`)                |
| `bill_length_mm`    | 부리 길이 (mm 단위)                                                |
| `bill_depth_mm`     | 부리 두께 (mm 단위)                                                |
| `flipper_length_mm` | 날개 길이 (mm 단위)                                                |
| `body_mass_g`       | 몸무게 (g 단위)                                                   |
| `sex`               | 성별 (`Male`, `Female`, 결측치 존재 가능)                             |


In [83]:
df= sns.load_dataset("penguins")
df

Unnamed: 0,species,island,bill_length_mm,bill_depth_mm,flipper_length_mm,body_mass_g,sex
0,Adelie,Torgersen,39.1,18.7,181.0,3750.0,Male
1,Adelie,Torgersen,39.5,17.4,186.0,3800.0,Female
2,Adelie,Torgersen,40.3,18.0,195.0,3250.0,Female
3,Adelie,Torgersen,,,,,
4,Adelie,Torgersen,36.7,19.3,193.0,3450.0,Female
...,...,...,...,...,...,...,...
339,Gentoo,Biscoe,,,,,
340,Gentoo,Biscoe,46.8,14.3,215.0,4850.0,Female
341,Gentoo,Biscoe,50.4,15.7,222.0,5750.0,Male
342,Gentoo,Biscoe,45.2,14.8,212.0,5200.0,Female


In [84]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 344 entries, 0 to 343
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   species            344 non-null    object 
 1   island             344 non-null    object 
 2   bill_length_mm     342 non-null    float64
 3   bill_depth_mm      342 non-null    float64
 4   flipper_length_mm  342 non-null    float64
 5   body_mass_g        342 non-null    float64
 6   sex                333 non-null    object 
dtypes: float64(4), object(3)
memory usage: 18.9+ KB


In [85]:
df.shape

(344, 7)

In [86]:
# 결측치 확인
df.isna().sum()

Unnamed: 0,0
species,0
island,0
bill_length_mm,2
bill_depth_mm,2
flipper_length_mm,2
body_mass_g,2
sex,11


In [101]:
# 결측치 제거
df = sns.load_dataset("penguins").dropna()
df

Unnamed: 0,species,island,bill_length_mm,bill_depth_mm,flipper_length_mm,body_mass_g,sex
0,Adelie,Torgersen,39.1,18.7,181.0,3750.0,Male
1,Adelie,Torgersen,39.5,17.4,186.0,3800.0,Female
2,Adelie,Torgersen,40.3,18.0,195.0,3250.0,Female
4,Adelie,Torgersen,36.7,19.3,193.0,3450.0,Female
5,Adelie,Torgersen,39.3,20.6,190.0,3650.0,Male
...,...,...,...,...,...,...,...
338,Gentoo,Biscoe,47.2,13.7,214.0,4925.0,Female
340,Gentoo,Biscoe,46.8,14.3,215.0,4850.0,Female
341,Gentoo,Biscoe,50.4,15.7,222.0,5750.0,Male
342,Gentoo,Biscoe,45.2,14.8,212.0,5200.0,Female


In [88]:
# 결측치 제거로 수가 변경되었다.
df.shape

(333, 7)

In [107]:
# 로그 스케일 적용을 위한 필터링 (0 값 제거)
df = df[(df["bill_length_mm"] > 0) & (df["body_mass_g"] > 0)]

# Plotly 시각화
fig = px.scatter(
    df,
    x="bill_length_mm",
    y="body_mass_g",
    color="species",
    log_y=True,  # 로그 스케일
    trendline="ols",  # 선형 회귀선 추가
    title="로그 스케일: 부리 길이 vs 체중 (Penguins)"
)

fig.update_layout(
    title_x=0.5,
    xaxis_title="부리 길이(mm)",
    yaxis_title="체중(g, 로그 스케일)",
    template="plotly_white"
)

fig.show()


In [106]:
# box plot
fig = px.box(
    df,
    x="species",
    y="body_mass_g",
    color="species",
    points="all",               # 개별 점 표시
    title="펭귄 종별 체중 Box Plot"
)

fig.update_layout(
    title_x=0.5,
    xaxis_title="펭귄 종",
    yaxis_title="체중 (g)",
    template="plotly_white"
)

fig.show()

In [105]:
df_avg = df.groupby("species", as_index=False)["body_mass_g"].mean()

# Bar chart 그리기
fig = px.bar(
    df_avg,
    x="species",
    y="body_mass_g",
    color="species",
    title="펭귄 종별 평균 체중 (Bar Chart)"
)

fig.update_layout(
    title_x=0.5,
    xaxis_title="펭귄 종",
    yaxis_title="평균 체중 (g)",
    template="plotly_white"
)

fig.show()

### gapminder



In [92]:
df = px.data.gapminder()
df

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.853030,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.100710,AFG,4
3,Afghanistan,Asia,1967,34.020,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4
...,...,...,...,...,...,...,...,...
1699,Zimbabwe,Africa,1987,62.351,9216418,706.157306,ZWE,716
1700,Zimbabwe,Africa,1992,60.377,10704340,693.420786,ZWE,716
1701,Zimbabwe,Africa,1997,46.809,11404948,792.449960,ZWE,716
1702,Zimbabwe,Africa,2002,39.989,11926563,672.038623,ZWE,716


In [93]:
fig = px.scatter(df[df['year'] == 2007],
                 x="gdpPercap", y="lifeExp",
                 size="pop", color="continent",
                 hover_name="country", log_x=True,
                 size_max=60, title="2007년 GDP vs 기대수명")

fig.update_layout(title_x=0.5)  # 가운데 정렬
fig.show()


In [94]:
#'Korea, Rep.'과 'Japan'
df_filtered = df[df["country"].isin(["Korea, Rep.", "Japan"])]

fig = go.Figure()

# 국가별 trace 추가
for country in ["Korea, Rep.", "Japan"]:
    df_country = df_filtered[df_filtered["country"] == country]
    fig.add_trace(go.Scatter(
        x=df_country["year"],
        y=df_country["lifeExp"],
        mode='lines+markers',
        name=country
    ))


fig.update_layout(
    title="한국(Korea, Rep.) vs 일본(Japan) 기대수명 추이",
    title_x=0.5,
    xaxis_title="연도",
    yaxis_title="기대수명",
    template="ggplot2"
)
fig.update_traces(mode="lines+markers", hovertemplate="연도: %{x}<br>기대수명: %{y}")

fig.show()

In [95]:
# Plotly 버블 차트 with 애니메이션
fig = px.scatter(
    df,
    x="gdpPercap",
    y="lifeExp",
    size="pop",
    color="continent",
    animation_frame="year",
    animation_group="country",
    size_max=60,
    log_x=True,
    template="plotly_white",
    title="대륙별 인구 대비 GDP vs 기대수명 변화 (1952–2007)"
)

fig.update_layout(
    xaxis_title="1인당 GDP (로그 스케일)",
    yaxis_title="기대수명 (Life Expectancy)",
    xaxis=dict(gridcolor="lightgray",showspikes=True, spikecolor="green", spikesnap="cursor", spikemode="across"),
    yaxis=dict(gridcolor="lightgray",showspikes=True, spikecolor="orange", spikethickness=2, range =[0,100]),
    legend_title_text="대륙"
)

fig.show()


In [111]:
# 데이터 로드 및 아시아 국가 필터링
df = px.data.gapminder()
df_asia = df[df["continent"] == "Asia"]
df_asia_2007 = df_asia[df_asia["year"] == 2007]

# Figure 생성
fig = go.Figure()

# 히스토그램 (기대수명 분포)
fig.add_trace(go.Histogram(
    x=df_asia_2007["lifeExp"],
    name="히스토그램",
    visible=True,
    marker_color="skyblue",
    hovertemplate="기대수명: %{x:.1f}세<extra></extra>"
))

# 꺾은선 그래프 (연도별 평균 기대수명)
df_line = df_asia.groupby("year")["lifeExp"].mean().reset_index()
fig.add_trace(go.Scatter(
    x=df_line["year"],
    y=df_line["lifeExp"],
    mode="lines+markers",
    name="꺾은선",
    visible=False,
    hovertemplate="연도: %{x}<br>평균 기대수명: %{y:.1f}세<extra></extra>"
))

# 산점도 (국가 vs 기대수명)
fig.add_trace(go.Scatter(
    x=df_asia_2007["country"],
    y=df_asia_2007["lifeExp"],
    mode="markers",
    name="산점도",
    visible=False,
    text=df_asia_2007["country"],
    hovertemplate="국가: %{text}<br>기대수명: %{y:.1f}세<extra></extra>"
))

# 드롭다운 메뉴 설정
fig.update_layout(
    updatemenus=[{
        "buttons": [
            {"label": "히스토그램", "method": "update",
             "args": [{"visible": [True, False, False]},
                      {"title": "아시아 국가 - 기대수명 히스토그램 (2007년)",
                       "xaxis": {"title": "기대수명"},
                       "yaxis": {"title": "국가 수"}}]},
            {"label": "꺾은선", "method": "update",
             "args": [{"visible": [False, True, False]},
                      {"title": "아시아 평균 기대수명 추이",
                       "xaxis": {"title": "연도"},
                       "yaxis": {"title": "평균 기대수명"}}]},
            {"label": "산점도", "method": "update",
             "args": [{"visible": [False, False, True]},
                      {"title": "아시아 국가별 기대수명 (2007년)",
                       "xaxis": {"title": "국가", "tickangle": -45},
                       "yaxis": {"title": "기대수명"}}]},
        ],
        "direction": "down",
        "x": 1.0,
        "y": 1.2,
        "showactive": True
    }],
    title="아시아 기대수명 시각화",
    title_x=0.5
)

fig.show()
