<a href="https://colab.research.google.com/github/linwanlu/hello-colab/blob/main/Hello_Colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 專題實作 #01：Hello Word

In [None]:
print('Hello World!')

Hello World!


##利用 Python 收集來自 API 的資料
API 來源的爬蟲主要是通過網路上提供的 API 接口，從網路上獲取數據，例如從某個網站獲取股票市場行情、氣象預報等，通常是先向 API 接口發送請求，獲取 JSON 格式的數據，然後使用 json 模組對數據進行解析和處理。在今天的例子中，我們將以 Python 實現 API 來源的資料收集。若要進行 API 資料收集，可以使用 Python 中的 requests 套件向 API 伺服器發送 HTTP 請求，獲取 API 回傳的資料。以下是一個簡單的範例：


In [None]:
import requests
import json


# 利用 requests 對 API 來源發送一個請求
url = '{ API 網址}'
response = requests.get(url)

# 將請求回應的內容存成一個字串格式
d = response.text

# 將長得像 json 格式的字串解析成字典或列表
data = json.loads(d)

print(data)

以上範例中的 `data` 變數，就是我們利用 Python 抓取回來的資料並且經過解析後變成一個 Python 內建的資料結構。但是有這樣的資料之後，下一步還需要做什麼呢？這個時候就會需要仰賴你對程式語言的熟悉程度，將原始的資料整理成你想要使用的樣子。  



除此之外，你還有利用更多的第三方套件與函式庫協助你在資料收集的項目中完成更高階的操作：


* requests：用於向網站發送 HTTP 請求，獲取網站上的資訊。
* BeautifulSoup：用於解析 HTML 或 XML 結構化資料，抓取所需的資料。
* Scrapy：用於編寫網頁爬蟲框架，支持非同步網路爬蟲。
* Selenium：用於自動化瀏覽器操作，支持 JavaScript 用於模擬操作網頁的行為解決網頁動態加載的問題。
* pandas：用於數據處理和分析，可將爬蟲收集到的數據進行結構化處理和分析。



 總體來說，使用 Python 進行資料爬蟲和資料收集是一個相對簡單而且實用的技能，可以幫助我們獲取網路上的資訊，並對這些資訊進行處理、分析和可視化，從而加速日常工作的生產力。

# Task #07 作業#01 口罩資料API串接

In [None]:
import requests
import json

url='https://raw.githubusercontent.com/kiang/pharmacies/master/json/points.json'
response = requests.get(url)
d=response.text
data = json.loads(d)
# print(data)


# 計算各地區的藥局數量
med_count = {}
# 填入欄位名稱
for d in data['features']:
    conunty = d['properties']['county']
    if conunty not in med_count:
         med_count[conunty] = 1
    else:
        med_count[conunty] = med_count.get(conunty)+1
print(med_count)


# 計算出每個地區的成人剩餘口罩數量，並且將結果從大到小排列
mask_count = {}

# 填入欄位名稱
for d in data['features']:
    conunty = d['properties']['county']
    number = d['properties']['mask_adult']
    if conunty not in mask_count:
         mask_count[conunty] = number
    else:
        mask_count[conunty] = mask_count.get(conunty)+number

# 將結果從大到小排列
mask_count = dict(sorted(mask_count.items(), key=lambda item: item[1],reverse=True))

print(mask_count)


{'臺北市': 339, '': 49, '高雄市': 422, '臺中市': 420, '臺南市': 271, '基隆市': 57, '新竹市': 39, '嘉義市': 67, '新北市': 501, '桃園市': 264, '新竹縣': 46, '宜蘭縣': 76, '苗栗縣': 56, '彰化縣': 179, '南投縣': 67, '雲林縣': 129, '嘉義縣': 84, '屏東縣': 140, '澎湖縣': 11, '花蓮縣': 46, '臺東縣': 23, '金門縣': 6, '連江縣': 1}
{'新北市': 670270, '臺中市': 536710, '高雄市': 424170, '臺南市': 393900, '桃園市': 331940, '臺北市': 322490, '彰化縣': 219400, '雲林縣': 196990, '屏東縣': 184250, '苗栗縣': 131080, '嘉義縣': 113180, '嘉義市': 107840, '宜蘭縣': 106900, '南投縣': 91240, '基隆市': 80100, '': 69210, '花蓮縣': 57330, '新竹縣': 51350, '新竹市': 45630, '臺東縣': 28510, '金門縣': 15510, '澎湖縣': 12600, '連江縣': 7930}


# Task#08 作業01 將資料存入資料庫

In [2]:
import requests
import json
import sqlite3
import datetime


conn = sqlite3.connect('example.db')
c = conn.cursor()

# 新增且清空資料表
c.execute('''CREATE TABLE IF NOT EXISTS pharmacies
             (city text, counts text, createdAt datetime)''')
c.execute('''DELETE FROM pharmacies''')
conn.commit()

# 新增資料
url='https://raw.githubusercontent.com/kiang/pharmacies/master/json/points.json'
response = requests.get(url)
d=response.text
data = json.loads(d)

# 計算各地區的藥局數量
med_count = {}
# 填入欄位名稱
for d in data['features']:
    conunty = d['properties']['county']
    if conunty not in med_count:
         med_count[conunty] = 1
    else:
        med_count[conunty] = med_count.get(conunty)+1


for key,value in med_count.items():
  city = key
  counts = value
  t = datetime.datetime.now()
  print(f"INSERT INTO stocks VALUES ('{city}', {counts}, '{t}')")
  c.execute(f"INSERT INTO pharmacies VALUES ('{city}', {counts}, '{t}')")
  conn.commit()

# 查詢資料
c.execute("SELECT * FROM pharmacies")
print(c.fetchall())

conn.commit()
conn.close()

INSERT INTO stocks VALUES ('臺北市', 339, '2024-04-07 15:42:45.879295')
INSERT INTO stocks VALUES ('', 49, '2024-04-07 15:42:45.891816')
INSERT INTO stocks VALUES ('高雄市', 422, '2024-04-07 15:42:45.901848')
INSERT INTO stocks VALUES ('臺中市', 420, '2024-04-07 15:42:45.912907')
INSERT INTO stocks VALUES ('臺南市', 271, '2024-04-07 15:42:45.923070')
INSERT INTO stocks VALUES ('基隆市', 57, '2024-04-07 15:42:45.932519')
INSERT INTO stocks VALUES ('新竹市', 39, '2024-04-07 15:42:45.941786')
INSERT INTO stocks VALUES ('嘉義市', 67, '2024-04-07 15:42:45.951054')
INSERT INTO stocks VALUES ('新北市', 501, '2024-04-07 15:42:45.960198')
INSERT INTO stocks VALUES ('桃園市', 264, '2024-04-07 15:42:45.969301')
INSERT INTO stocks VALUES ('新竹縣', 46, '2024-04-07 15:42:45.980168')
INSERT INTO stocks VALUES ('宜蘭縣', 76, '2024-04-07 15:42:45.989875')
INSERT INTO stocks VALUES ('苗栗縣', 56, '2024-04-07 15:42:45.999717')
INSERT INTO stocks VALUES ('彰化縣', 179, '2024-04-07 15:42:46.008363')
INSERT INTO stocks VALUES ('南投縣', 67, '2024-