# 今日主題：挑選投資專家

## 首先，我們先蒐集名片
名片的格式通常不是常見的表格，擅長的領域通常不只一個，每個人的專長數量也不同。  
理論上csv中，一格只會放一個東西，此時我們有一個更好的選擇——Json。

### 程式關掉之後，輸出結果會不見、變數紀錄會不見，我們能留下什麼？
常見的資料格式，其中兩種就是json跟csv
- ```json```: 看起來比較像是某種「程式」，但事實上就是像python的dict一樣  
- ```csv```: 利用**分隔符**與**換行**，將資料切成像是表格的形式，excel可以輸出成csv

以下狀況，是我們會需要上述這兩種格式的時候：
- 程式存檔
- 傳遞資料到另外一個程式（不限python）
- 讀取資料
- 輸出資料

在你學完pandas的初步功能之後，你就同時擁有編輯、輸出csv跟json的能力了

In [None]:
import numpy as np #主要處理向量、矩陣運算，也有亂數生成功能
import pandas as pd #主要用來讀取資料、處理資料
import matplotlib.pyplot as plt #主要讓你看圖表的module
%matplotlib inline 
#jupyter notebook的"魔術語言"，你也可以說這一行不是python語法，用來讓你的圖表乖乖的在結果列顯示

#### 首先，先來認識一下json
json的用途其實比你想像中的廣，他除了在電腦上，讓程式之間可以傳遞有條理的資料、可以存檔之外，在一些智能家電的設定上，也有許多是用json的方式去調整他

In [None]:
import json
from pandas import json_normalize

In [None]:
# 記錄一張名片
card = {
    'name':,#打上名字
    'year':,#打上年資
    'model':{#這邊是等等要用的數字，先放著
        'alpha':0.1,
        'beta':0.6,
        'e':0.05
    },
    'score':2.5
}

In [None]:
card_json = json.dumps(card, ensure_ascii=False) #讓他用json的格式儲存，後面那個是避免以ASCII這個編碼方式儲存，他就會改用utf8了
card_json

'{"name": "白勞贖", "year": 2, "model": {"alpha": 0.1, "beta": 0.6, "e": 0.05}, "score": 2.5}'

In [None]:
cards = open('cards.json', 'w',encoding='utf8') #建立一個json檔，注意編碼
cards.write(card_json) #把剛剛編輯好的名片放進去
cards.close() #記得用完要習慣性的關掉

## 試試看
再一張名片，你可以用另外一個變數暫時儲存

In [None]:
card_b = {
    'name':'曉白薯',#打上名字
    'year':3,#打上年資
    'model':{#這邊是等等要用的數字，先放著
        'alpha':0.2,
        'beta':0.5,
        'e':0.04
    },
    'score':4
}

### json的多筆資料&pandas資料表的多筆資料
依照我們上次所學，pandas的多筆資料對應如下：
```
   {
   'no':[1, 2, 3, 4, 5, 6, 7], 
   'name':['Mike', 'Jason', 'Merry', 'Eric', 'Sandy', 'Bob', 'Andy'], 
   'age':[21, 30, 12, 25, 18, 32, 9], 
   'nationality':['Taiwan', 'USA', 'Japan', 'USA', 'Thailand', 'Taiwan', 'USA']
   }
```
但json如果要實現多筆資料，而不是一欄多值的情況，他會以list裡面包dict的情況表現：
```
   [
        {'no':1,
        'name':'Mike',
        'age':21,
        'nationality':'Taiwan'},
        {'no':2,
        'name':'Jason',
        'age':30,
        'nationality':'USA'}
   ]
```
這邊就不全部列出來了，看起來會很長（冷汗    
  
又或者，我們可以再給他一個編號
```
    {
    0:{
        'no':1,
        'name':'Mike',
        'age':21,
        'nationality':'Taiwan'},
    1:{'no':2,
        'name':'Jason',
        'age':30,
        'nationality':'USA'}
    }
```

In [None]:
card_list = json.dumps([card,card_b], ensure_ascii=False) #把兩個角色都轉換成json的形式
cards = open('cards.json', 'w') #打開剛剛的json檔
cards.write(card_list) #把剛剛編輯好的角色放進去
cards.close() #記得用完要習慣性的關掉

### 在學會寫檔案進去之後，讓我們看看怎麼讀檔案出來

In [None]:
cards = open('cards.json', 'r')
cards_data = json.load(cards)
cards.close()
cards_data #快用type看看這時候的型別是什麼

[{'name': '白勞贖',
  'year': 2,
  'model': {'alpha': 0.1, 'beta': 0.6, 'e': 0.05},
  'score': 2.5},
 {'name': '曉白薯',
  'year': 3,
  'model': {'alpha': 0.2, 'beta': 0.5, 'e': 0.04},
  'score': 4}]

In [None]:
cards = open('cards.json','r')
cards_data_pd = pd.read_json(cards) #也可以直接用pandas開
cards.close()
cards_data_pd

Unnamed: 0,name,year,model,score
0,白勞贖,2,"{'alpha': 0.1, 'beta': 0.6000000000000001, 'e'...",2.5
1,曉白薯,3,"{'alpha': 0.2, 'beta': 0.5, 'e': 0.04}",4.0


In [None]:
#一定有人覺得，那個attribute一串在那邊，看了很阿砸
with open('cards.json','r') as cards:#順代換一個讀取檔案的寫法
    cards_data = json.loads(cards.read())
card_attribute = pd.json_normalize(cards_data)
card_attribute

Unnamed: 0,name,year,score,model.alpha,model.beta,model.e
0,白勞贖,2,2.5,0.1,0.6,0.05
1,曉白薯,3,4.0,0.2,0.5,0.04


In [None]:
cards_json = card_attribute.to_json(orient = 'records',force_ascii=False)#一樣注意編碼
#pandas也可以再轉回去json，但pandas本身沒有巢狀，所以json也會失去巢狀的格式
cards_json

'[{"name":"白勞贖","year":2,"score":2.5,"model.alpha":0.1,"model.beta":0.6,"model.e":0.05},{"name":"曉白薯","year":3,"score":4.0,"model.alpha":0.2,"model.beta":0.5,"model.e":0.04}]'

## 試試看
給我一個function，可以依照輸入的數字，回傳對應數量的☆（四捨五入）。  
例如：輸入3，回傳☆☆☆。

In [None]:
# 測試用的資料
all_card = [
    {
    'name': '白勞贖',
    'year': 2,
    'model': {'alpha': 0.1, 'beta': 0.6, 'e': 0.05},
    'score': 2.5
    },
    {
    'name': '曉白薯',
    'year': 3,
    'model': {'alpha': 0.2, 'beta': 0.5, 'e': 0.04},
    'score': 4
    },
    {
    'name': '烤白薯',
    'year': 3,
    'model': {'alpha': 0.2, 'beta': 0.5, 'e': 0.04},
    'score': 3
    }
]

In [None]:
with open('cards.json','w',encoding='utf8') as cards:
    cards.write(json.dumps(all_card, ensure_ascii=False))
with open('cards.json','r',encoding='utf8') as cards:
    card_data = json.loads(cards.read())
card_data_pd = pd.json_normalize(card_data)
card_data_pd

Unnamed: 0,name,year,score,model.alpha,model.beta,model.e
0,白勞贖,2,2.5,0.1,0.6,0.05
1,曉白薯,3,4.0,0.2,0.5,0.04
2,烤白薯,3,3.0,0.2,0.5,0.04


## 試試看
用迴圈+剛剛的function，把cards.json裡面的分數都用星星表示。

## 用information ratio鑑定投資專家的投資組合
![image.png](attachment:image.png)

In [None]:
# 我們快樂的省略掉迴歸的部分，請你把我們的結果匯進來
df = pd.read_csv('single_index_model.csv')
df

Unnamed: 0,name,alpha,beta,error,standard_deviation_of_error
0,A,0.1,0.9,0.05,0.25
1,B,0.3,0.5,0.07,0.21
2,C,0.5,0.8,0.025,0.19
3,D,0.7,1.2,0.09,0.33
4,E,1.2,0.4,0.1,0.15


## 試試看
information ratio是alpha/standard_deviation_of_error，請把所有人依照他的information ratio排列。

## 下學期：決策樹與神經網路