#  使用行政院的OpenData來了解哪個職業可能最熱門

## 案例幫助我們學會什麼?  
使用Python來輕快的幫忙我們研究，目前台灣的**證照發行狀況**，透過了解證照發行的熱們度與否，可以幫助新鮮人在找工作的時候多一項指標。  

本案例使用[政府開放資料平台](http://data.gov.tw/)的**技能檢定發證數統計資料**，根據每年政府統計的技能檢定發證，來大致了解目前國內就業資料的概況。特別如果是**高中學生**，用於未來大學選填志願時，可以了解目前哪些產業的檢定證書比較流行，或者說哪些證書的發送較為稀少，可以根據這些條件來輔助自身選擇志願。

## 如何使用python來擷取開放資料，並且做一些基本處理呢?

- 範例選擇: 技能檢定發證數統計資料
- 讀取檔案格式: JSON格式
- API接口位置: http://apiservice.mol.gov.tw/OdService/download/A17000000J-000011-9oA 

## 程式語言環境
- Python3.6
- 使用套件 `requests` `json`
    - Requests套件說明: 用來傳遞Http/Https封包，並且擷取內容回來

In [6]:
import requests
import json
r = requests.get("http://apiservice.mol.gov.tw/OdService/download/A17000000J-000011-9oA") ##填入想要查詢的API位置
data =r.json() ## 取得JSON格式的封裝資料data
print(data['data'])

[{'colum_1': '細項名稱', 'colum_2': '職類群', 'colum_3': ' 甲級 ', 'colum_4': ' 乙級 ', 'colum_5': ' 丙級 ', 'colum_6': ' 單一級 ', 'colum_7': ' 總計 '}, {'colum_1': '00100冷凍空調裝修', 'colum_2': '電機類群', 'colum_3': ' 1 ', 'colum_4': ' 28 ', 'colum_5': ' 77 ', 'colum_6': '', 'colum_7': ' 106 '}, {'colum_1': '00400一般手工電銲', 'colum_2': '銲接配管類群', 'colum_3': '', 'colum_4': '', 'colum_5': '', 'colum_6': ' 16 ', 'colum_7': ' 16 '}, {'colum_1': '00700室內配線（屋內線路裝修）', 'colum_2': '電機類群', 'colum_3': '', 'colum_4': ' 119 ', 'colum_5': ' 75 ', 'colum_6': '', 'colum_7': ' 194 '}, {'colum_1': '00901泥水－砌磚', 'colum_2': '營造類群', 'colum_3': '', 'colum_4': '', 'colum_5': ' 14 ', 'colum_6': '', 'colum_7': ' 14 '}, {'colum_1': '01000電器修護', 'colum_2': '電機類群', 'colum_3': '', 'colum_4': ' 164 ', 'colum_5': '', 'colum_6': '', 'colum_7': ' 164 '}, {'colum_1': '01100鑄造', 'colum_2': '金屬及機械加工類群', 'colum_3': '', 'colum_4': ' 90 ', 'colum_5': '', 'colum_6': '', 'colum_7': ' 90 '}, {'colum_1': '01200家具木工', 'colum_2': '營造類群', 'colum_3': '', 'co

> 以上操作，我們便可以將政府開放資料平台的資料取得取得，並且根據所取得的資料來製作表格統計

In [26]:
## print(data) ## 印出data的資料
## 稍微整理一下我們的資料吧

for i in data['data']:
    ## print(i['colum_1'])
    print("{:30} {:20} {:5} {:5} {:5} {:5} {:5}".format(i['colum_1'],i['colum_2'],i['colum_3'],i['colum_4'],i['colum_5'],i['colum_6'],i['colum_7']))
    

細項名稱                           職類群                   甲級    乙級    丙級    單一級   總計  
00100冷凍空調裝修                    電機類群                  1     28    77          106 
00400一般手工電銲                    銲接配管類群                                  16    16  
00700室內配線（屋內線路裝修）              電機類群                        119   75          194 
00901泥水－砌磚                     營造類群                              14          14  
01000電器修護                      電機類群                        164               164 
01100鑄造                        金屬及機械加工類群                   90                90  
01200家具木工                      營造類群                        32    35          67  
01300工業配線                      電機類群                        24    15          39  
01400板金                        金屬及機械加工類群                   9     26          35  
01600自來水管配管                    銲接配管類群                      58    13          71  
02000汽車修護                      機械及設備修護類群                   192   5           197 
02800工業電子       

> 以上我們就可以獲得每一天，每一站的進出資料，並且藉由EXCEL或者相關軟體，更深入的解析我們的系統，以及相關使用方式囉。

## 當然我們可以將表格更加精緻的進行處理，讓顯示的過程更好看

> 由於有些文字是全型有些文字是半型，因此顯示的結果會有些不整齊，我們可以使用下列語法，將所有字形接轉換為全型，讓頁面更好閱讀

In [34]:
for i in data['data']:
    ## print(i['colum_1'])
    print("{:20} {:20} {:5} {:5} {:5} {:5} {:5}".format((i['colum_1']),i['colum_2'],i['colum_3'],i['colum_4'],i['colum_5'],i['colum_6'],i['colum_7']))
    

細項名稱                 職類群                   甲級    乙級    丙級    單一級   總計  
00100冷凍空調裝修          電機類群                  1     28    77          106 
00400一般手工電銲          銲接配管類群                                  16    16  
00700室內配線（屋內線路裝修）    電機類群                        119   75          194 
00901泥水－砌磚           營造類群                              14          14  
01000電器修護            電機類群                        164               164 
01100鑄造              金屬及機械加工類群                   90                90  
01200家具木工            營造類群                        32    35          67  
01300工業配線            電機類群                        24    15          39  
01400板金              金屬及機械加工類群                   9     26          35  
01600自來水管配管          銲接配管類群                      58    13          71  
02000汽車修護            機械及設備修護類群                   192   5           197 
02800工業電子            電子儀表類群                            15          15  
02900視聽電子            電子儀表類群                      77    2        

## 總結  
使用Python作為資料處理的工具，可以更方便的讓我們獲得一些重要的資料。以上範例特別適合用於`房地產`、`人口統計`、`商業分析`等重要資料的探勘。  
假設您為一個**投資專業人才**，你可以藉由OpenData所提供的資料，透過數據更加合理的推論，什麼樣的地區可以有更好的投資獲利。更重要的是，程式是使用API的串街方式，只要撰寫一次，你可以持續使用，並且進行更大規模的資料探勘以及交叉比對，來達成你的職業規劃以及目標。