<img src="https://i.ibb.co/1MPXBQZ/ringodata-banner-v2.jpg" width="200"/>


---
-  강의 및 추가 자료 링크
- 강의 링크: [Python 강의](#)

-  소셜 미디어 및 연락처
  - 저자 SNS: [instagram](https://www.instagram.com/ringo_data/?igsh=MTlrdW4xMzZvNTBtdw%3D%3D), [LinkedIn](https://www.linkedin.com/in/ringokwon/)
  - 이메일: ringo.data1@gmail.com

---

# px.line()

- `시간에 따른 데이터의 변화나 추세를 나타낼 때 사용. 예를 들어, 시간에 따른 주식 가격 변동이나 기온 변화를 보여줄 때 좋음.`

```python
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df
    , x="col_1"  # X축에 표시할 컬럼
    , y="col_2"  # Y축에 표시할 컬럼
    , color="col_3"  # 각 선의 색상을 구분하기 위한 컬럼
    , facet_col="col_4"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    , title="title_name"  # 그래프의 제목
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

```

In [1]:
import numpy as np
import pandas as pd

data_size = 1000

np.random.seed(0)

dates = pd.date_range('2021-01-01', '2021-01-31')


random_dates = np.random.choice(dates, size=data_size)
random_dates.sort()

# 데이터 생성
data = {
    'tras_id': np.arange(data_size),  # 순차적인 번호를 tras_id로 사용
    'date': random_dates,
    'amount': np.random.randint(100, 1000, size=data_size),
    'payment': np.random.choice(['Cash', 'Card'], size=data_size),
    'category': np.random.choice(['A', 'B'], size=data_size)
}

df = pd.DataFrame(data)

df['amount'] = df.apply(lambda row: row['amount'] * 3 if row['payment'] == 'Card' else row['amount'], axis=1)
df['amount'] = df.apply(lambda row: row['amount'] * 2.3 if row['category'] == 'A' else row['amount'], axis=1)

df.head()
# date: 날짜 데이터로, 특정 기간(2021년 1월) 동안의 일자별 데이터를 나타냅니다.
# amount: 수치형 데이터로, 각 날짜에 해당하는 금액(거래, 판매 등)을 나타냅니다.
# payment: 범주형 데이터로, 거래의 결제 방식(현금 또는 카드)을 나타냅니다.
# tras_id: 각 행의 고유 식별자로, 거래나 이벤트를 구별하는 데 사용됩니다.

Unnamed: 0,tras_id,date,amount,payment,category
0,0,2021-01-01,786.6,Cash,A
1,1,2021-01-01,970.0,Cash,B
2,2,2021-01-01,360.0,Card,B
3,3,2021-01-01,1800.9,Cash,A
4,4,2021-01-01,5037.0,Card,A


In [2]:
df_agg1 = df.groupby(by = 'date').amount.sum().reset_index()

In [3]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg1
    , x="date"  # X축에 표시할 컬럼
    , y="amount"  # Y축에 표시할 컬럼
    #, color="col_3"  # 각 선의 색상을 구분하기 위한 컬럼
    #, facet_col="col_4"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

In [5]:
df_agg2 = df.groupby(by = ['date','payment']).amount.sum().reset_index()

In [6]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg2
    , x="date"  # X축에 표시할 컬럼
    , y="amount"  # Y축에 표시할 컬럼
    , color="payment"  # 각 선의 색상을 구분하기 위한 컬럼
    #, facet_col="col_4"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

In [9]:
df_agg3 = df.groupby(by = ['date','payment','category']).amount.sum().reset_index()
df_agg3.head()

Unnamed: 0,date,payment,category,amount
0,2021-01-01,Card,A,18257.4
1,2021-01-01,Card,B,16887.0
2,2021-01-01,Cash,A,14729.2
3,2021-01-01,Cash,B,4575.0
4,2021-01-02,Card,A,30028.8


 ## facet_col/row
 `facet_col/row` 에 지정된 열의 고유 값마다 별도의 그래프가 생성

In [14]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg3
    , x="date"  # X축에 표시할 컬럼
    , y="amount"  # Y축에 표시할 컬럼
    , color="payment"  # 각 선의 색상을 구분하기 위한 컬럼
    , facet_col="category"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
     , hover_data = {
         'category' : True
     }
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

In [15]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg3
    , x="date"  # X축에 표시할 컬럼
    , y="amount"  # Y축에 표시할 컬럼
    , color="payment"  # 각 선의 색상을 구분하기 위한 컬럼
    , facet_row="category"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
     , hover_data = {
         'category' : True
     }
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

# Exercise
- 일시정지 후 스스로 문제를 풀어보고 강의를 수강해 주세요

- Seaborn의 taxis 데이터셋을 사용하세요.
- Plotly Express의 px.line 함수를 사용하여 `pickup` 일별 `payment` 방식에 따른 평균 요금(`total`)을 나타내는 선 그래프를 그리세요. 여기서 x축은 `pickup` 일, y축은 평균 요금으로 설정하세요.
- 추가 사항
  - facet_row 를 활용하여 추가로 `color`별 비교를 하세요.

In [16]:
import seaborn as sns
import pandas as pd
import plotly.express as px

# 데이터 불러오기
df = sns.load_dataset('taxis', cache = False)
df.head()

Unnamed: 0,pickup,dropoff,passengers,distance,fare,tip,tolls,total,color,payment,pickup_zone,dropoff_zone,pickup_borough,dropoff_borough
0,2019-03-23 20:21:09,2019-03-23 20:27:24,1,1.6,7.0,2.15,0.0,12.95,yellow,credit card,Lenox Hill West,UN/Turtle Bay South,Manhattan,Manhattan
1,2019-03-04 16:11:55,2019-03-04 16:19:00,1,0.79,5.0,0.0,0.0,9.3,yellow,cash,Upper West Side South,Upper West Side South,Manhattan,Manhattan
2,2019-03-27 17:53:01,2019-03-27 18:00:25,1,1.37,7.5,2.36,0.0,14.16,yellow,credit card,Alphabet City,West Village,Manhattan,Manhattan
3,2019-03-10 01:23:59,2019-03-10 01:49:51,1,7.7,27.0,6.15,0.0,36.95,yellow,credit card,Hudson Sq,Yorkville West,Manhattan,Manhattan
4,2019-03-30 13:27:42,2019-03-30 13:37:14,3,2.16,9.0,1.1,0.0,13.4,yellow,credit card,Midtown East,Yorkville West,Manhattan,Manhattan


In [19]:
df['pickup_date'] = df['pickup'].dt.date
df.head()

Unnamed: 0,pickup,dropoff,passengers,distance,fare,tip,tolls,total,color,payment,pickup_zone,dropoff_zone,pickup_borough,dropoff_borough,pickup_date
0,2019-03-23 20:21:09,2019-03-23 20:27:24,1,1.6,7.0,2.15,0.0,12.95,yellow,credit card,Lenox Hill West,UN/Turtle Bay South,Manhattan,Manhattan,2019-03-23
1,2019-03-04 16:11:55,2019-03-04 16:19:00,1,0.79,5.0,0.0,0.0,9.3,yellow,cash,Upper West Side South,Upper West Side South,Manhattan,Manhattan,2019-03-04
2,2019-03-27 17:53:01,2019-03-27 18:00:25,1,1.37,7.5,2.36,0.0,14.16,yellow,credit card,Alphabet City,West Village,Manhattan,Manhattan,2019-03-27
3,2019-03-10 01:23:59,2019-03-10 01:49:51,1,7.7,27.0,6.15,0.0,36.95,yellow,credit card,Hudson Sq,Yorkville West,Manhattan,Manhattan,2019-03-10
4,2019-03-30 13:27:42,2019-03-30 13:37:14,3,2.16,9.0,1.1,0.0,13.4,yellow,credit card,Midtown East,Yorkville West,Manhattan,Manhattan,2019-03-30


In [20]:
df_agg1 = df.groupby(by = ['payment', 'pickup_date']).total.mean().reset_index()
df_agg1.head()

Unnamed: 0,payment,pickup_date,total
0,cash,2019-02-28,6.3
1,cash,2019-03-01,12.479333
2,cash,2019-03-02,14.64339
3,cash,2019-03-03,16.295417
4,cash,2019-03-04,14.509184


In [21]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg1
    , x="pickup_date"  # X축에 표시할 컬럼
    , y="total"  # Y축에 표시할 컬럼
    , color="payment"  # 각 선의 색상을 구분하기 위한 컬럼
    #, facet_col="col_4"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

In [22]:
# 추가문제
df_agg2 = df.groupby(by = ['payment', 'pickup_date', 'color']).total.mean().reset_index()
df_agg2.head()

Unnamed: 0,payment,pickup_date,color,total
0,cash,2019-02-28,green,6.3
1,cash,2019-03-01,green,10.329412
2,cash,2019-03-01,yellow,13.329302
3,cash,2019-03-02,green,14.107692
4,cash,2019-03-02,yellow,14.794783


In [23]:
import plotly.express as px

# 선 그래프 생성
line_fig = px.line(df_agg2
    , x="pickup_date"  # X축에 표시할 컬럼
    , y="total"  # Y축에 표시할 컬럼
    , color="payment"  # 각 선의 색상을 구분하기 위한 컬럼
    , facet_row="color"  # 서브플롯을 구분하기 위한 컬럼 (세로로 나누기)
    # facet_row="col_5"를 사용하면 가로로 나눌 수 있음
    #, title="title_name"  # 그래프의 제목
)
# line_fig.update_layout(xaxis_title="x_title_name", yaxis_title="y_title_name")

# 선 그래프 표시
line_fig.show()

---
-  🔒 저작권 및 사용 조건 (중요)
  - **저작권 보호**: 이 강의 노트는 저작권법에 의해 엄격히 보호됩니다.
  - **무단 사용 금지**: 어떠한 형태로든 상업적 사용이 엄격히 금지됩니다.
  - **개인용도 한정**: 이 자료는 교육 목적으로만 사용이 허가되며, 개인적인 학습 외의 목적으로 사용할 수 없습니다.
  - **위반 시 조치**: 저작권법 위반 시 법적 조치가 취해질 수 있습니다.
---

<img src="https://i.ibb.co/1MPXBQZ/ringodata-banner-v2.jpg" width="200"/>
