# 課題1 データの基本的な記述統計の計算
データの特徴を指標（統計値）によって記述することを記述統計と呼びます。データ分析の過程で、記述統計は分析対象のデータを観察し、理解するのに用いられます。記述統計により対象データを理解することは、データの前処理（欠損値、外れ値、異常値の処理）の準備にもなります。記述統計および前処理について次回の授業で詳しく説明します。

代表的な記述統計に平均があります。平均はデータの中心傾向を記述するための指標で、データが$n$個の数値要素からなる場合、平均は以下のように計算できます。$x_{i}$はデータの要素を表しています。

$\frac{1}{n}\Sigma^{n}_{i=1}x_{i}$

以下では、Pythonの基礎で学んだ内容を元にして、数値データの平均に加えて最大値、最小値を求めるPythonコードを実装します。

## Q1
0から100までの整数を要素とする任意の長さのリストを引数で入力として受け取り、以下を要素とするリストを返す`avg_max_min`関数を完成させてください。
- 入力リストの全ての要素の平均値
- 入力リストの全ての要素の中で最大の値
- 入力リストの全ての要素の中で最小の値

In [8]:
def avg_max_min(input_list):
    avg_value=0 # 平均値を初期化
    max_value=-1 # 最大値を初期化
    min_value= 101 # 最小値を初期化    
    sum_value=0 # 要素の和を初期化
    results=[] # 結果のリスト
    
    for v in input_list:
        sum_value += v
        
        if max_value < v:
            max_value = v
            
        if min_value > v:
            min_value = v
        
    avg_value =  sum_value / len(input_list)
    results.append(avg_value) 
    results.append(max_value)
    results.append(min_value)
    return results    

`avg_max_min`関数が完成したら、以下のセルを実行して動作を確認してください。

In [9]:
avg_max_min([30,39,29,95,70,67,29,56,45,68])

[52.8, 95, 29]

以下のセルを実行して、実行結果が上記と同じであること確認してください。結果が異なる場合は、作成した`avg_max_min`関数に誤りがないか確認してください。

In [10]:
# avg_max_min関数の結果を検証するための関数
def avg_max_min_test(input_list):
    return [sum(input_list)/len(input_list), max(input_list), min(input_list)]

avg_max_min_test([30,39,29,95,70,67,29,56,45,68])

[52.8, 95, 29]

## Q2
以下のような形式の"exam_score.csv"ファイルを読み込み、教科名をキー、キーの教科の平均値、最大値、最小値のリストを値とする辞書を返す`exam_stat`関数を完成させてください。その際、先に作成した`avg_max_min`関数を利用してください。
```Python
## exam_score.csvファイル
kokugo, shakai, sugaku, rika
30, 43, 51, 63
39, 21, 49, 56
...
```

In [14]:
import csv
import numpy as np

def exam_stat():
    kokugo_score = [] 
    shakai_score = []
    sugaku_score = [] 
    rika_score = [] 
        
    score = open('exam_score.csv') # ファイルをオープン
    
    score_reader = csv.reader(score, delimiter=',', )
    
    for row in score_reader: # 1行ずつ読み込み
        if score_reader.line_num > 1: # 2行以降を処理する
            ### 各行の国語の点数, int(row[0]), をkokugo_scoreに追加するコード ###
            kokugo_score.append(int(row[0]))
            ### 各行の社会の点数, int(row[1]), をshakai_scoreに追加するコード ###
            shakai_score.append(int(row[1]))
            ### 各行の数学の点数, int(row[2]), をsugaku_scoreに追加するコード ###
            sugaku_score.append(int(row[2]))
            ### 各行の理科の点数, int(row[3]), をrika_scoreに追加するコード ###
            rika_score.append(int(row[3]))
    
    ### 各教科の点数リストから平均値、最大値、最小値のリストを計算するコードを以下に記入してください ###
    kokugo_stat = [np.mean(kokugo_score), np.max(kokugo_score), np.min(kokugo_score)]
    shakai_stat =   [np.mean(shakai_score), np.max(shakai_score), np.min(shakai_score)]
    sugaku_stat = [np.mean(sugaku_score), np.max(sugaku_score), np.min(sugaku_score)]
    rika_stat =  [np.mean(rika_score), np.max(rika_score), np.min(rika_score)]
    
    results={"kokugo":kokugo_stat, "shakai":shakai_stat, "sugaku":sugaku_stat, "rika":rika_stat} # 結果の辞書
    return results

`exam_stat`関数が完成したら、以下のセルを実行して動作を確認してください。

In [15]:
exam_stat()

{'kokugo': [52.33132530120482, 96, 0],
 'rika': [49.8855421686747, 100, 9],
 'shakai': [39.602409638554214, 90, 4],
 'sugaku': [45.6144578313253, 100, 0]}

以下のセルを実行して、実行結果が上記と同じであること確認してください。結果が異なる場合は、作成した`exam_stat`関数に誤りがないか確認してください。

In [16]:
import pandas as pd

# exam_stat関数の結果を検証するための関数
def exam_stat_test():
    score = pd.read_csv('exam_score.csv')
    return {"kokugo":[score['kokugo'].mean(), score['kokugo'].max(), score['kokugo'].min()],\
                 "shakai":[score['shakai'].mean(), score['shakai'].max(), score['shakai'].min()], \
                 "sugaku":[score['sugaku'].mean(), score['sugaku'].max(), score['sugaku'].min()],\
                 "rika":[score['rika'].mean(), score['rika'].max(), score['rika'].min()]}

exam_stat_test()

{'kokugo': [52.33132530120482, 96, 0],
 'rika': [49.8855421686747, 100, 9],
 'shakai': [39.602409638554214, 90, 4],
 'sugaku': [45.6144578313253, 100, 0]}