當連到一個WebServer時，提供一個WebAPI，第一個動作是：透過HTTP requests先連線上去，可是有可能網路會中斷，所以檢查status_code=200 (代表沒問題)
確保應用程式的穩定性

- class datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0, tzinfo=None, *, fold=0)

In [10]:
import requests
from requests import Response
from pydantic import RootModel,BaseModel,Field,field_validator
from datetime import datetime
import pandas as pd

class Site (BaseModel):
    行政區域:str = Field(alias='sarea')
    總數量:int = Field(alias='total')
    可借數量:int = Field(alias='available_rent_bikes') 
    可還數量:int = Field(alias='available_return_bikes')
    時間:datetime = Field(alias='mday')

    @field_validator('可借數量','可還數量',mode='before')
    @classmethod
    def whitespace_to_zero(cls, value: str) -> str:
        return '0.0' if value == '' else value

class Youbike(RootModel):
    root:list[Site]

try:
    youbike_url:Response= requests.get('https://tcgbusfs.blob.core.windows.net/dotapp/youbike/v2/youbike_immediate.json')
    youbike_url.raise_for_status()
except Exception as e:   #不管是什麼錯誤
    print(e)
else:
    data = Youbike.model_validate_json(youbike_url.text)
    all_sites = data.model_dump()
# model_dump 將對象轉化為Dict，之後就可以調用python標準庫序列化json字串，会序列化嵌套对象
# 也可以使用dict(model)将对象转化为字典，但嵌套对象不会被转化为字典。
df = pd.DataFrame(all_sites)
df

Unnamed: 0,行政區域,總數量,可借數量,可還數量,時間
0,大安區,28,0,28,2024-07-03 20:51:19
1,大安區,21,0,21,2024-07-03 20:50:27
2,大安區,16,14,2,2024-07-03 20:46:21
3,大安區,11,3,8,2024-07-03 20:50:32
4,大安區,16,2,14,2024-07-03 20:51:19
...,...,...,...,...,...
1425,臺大公館校區,30,0,29,2024-07-03 20:51:19
1426,臺大公館校區,20,1,19,2024-07-03 20:44:14
1427,臺大公館校區,24,14,9,2024-07-03 20:50:33
1428,臺大公館校區,40,9,31,2024-07-03 20:50:33


In [11]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1430 entries, 0 to 1429
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype         
---  ------  --------------  -----         
 0   行政區域    1430 non-null   object        
 1   總數量     1430 non-null   int64         
 2   可借數量    1430 non-null   int64         
 3   可還數量    1430 non-null   int64         
 4   時間      1430 non-null   datetime64[ns]
dtypes: datetime64[ns](1), int64(3), object(1)
memory usage: 56.0+ KB


DataFrame.groupby(by=None, axis=_NoDefault.no_default, level=None, as_index=True, sort=True, group_keys=True, observed=_NoDefault.no_default, dropna=True)[source]

- by=[col1, col2]：數據的分組。
- {col3: func3, col4: func4}：數據的處理。

In [13]:
df1 = df.set_index(keys=["行政區域"])
df1.groupby(level='行政區域')[['總數量','可借數量','可還數量']].sum()
# groupby 是一個可以把數據組合（group）的功能。

Unnamed: 0_level_0,總數量,可借數量,可還數量
行政區域,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
中山區,3819,1242,2533
中正區,3209,1318,1843
信義區,3331,953,2266
內湖區,3499,1205,2260
北投區,2472,919,1519
南港區,2317,913,1382
士林區,2962,1069,1803
大同區,1630,576,1035
大安區,4987,1869,2990
文山區,2203,767,1420
