# カリキュラム

## 導入
---
- [到達目標](target.ipynb)
- [進め方](method.ipynb)
- [Jupyter Notebookの使い方](jupyter.ipynb)
- [NumPyの使い方](numpy_basic.ipynb)
- [pandasの使い方](pandas_basic.ipynb)

## データサイエンス初級
---
データ分析手法を実行できるようになる

### [簡単な分析を実行する](beginner/market_basket_analysis.ipynb)
---
条件付き確率を理解する  
マーケット・バスケット分析を使える

### [データ分析を実施するにあたっての注意点](beginner/caution.ipynb)
---
実際にデータを扱う前後の工程の重要性を理解する

### データの内容を把握する

#### [データ要約について](beginner/data_summary_introduction.ipynb)
---
データ可視化の目的を理解する

#### 数値で把握する

##### [変数ごとに把握](beginner/describe.ipynb)
---
代表値の種類を把握する  
データの尺度の違いがわかる  
分散・標準偏差・四分位点がわかる

##### [変数の組み合わせごとに把握](beginner/summarize.ipynb)
---
クロス集計表が作成できる  
相関係数がわかる

##### [数値要約の注意点](beginner/caution_for_summary.ipynb)
---
数値要約の解釈・実施にあたっての注意点がわかる

#### グラフで把握する

##### [変数ごとに把握](beginner/visualization.ipynb)
---
棒グラフ・ヒストグラム・箱ひげ図が作成できる

##### [変数の組み合わせごとに把握](beginner/visualization2d.ipynb)
---
モザイク図・散布図が作成できる

##### [時系列データの把握](beginner/line_chart.ipynb)
---
折れ線グラフが作成できる

##### [カテゴリ間比較](beginner/comparison_over_categories.ipynb)
---
層別グラフ・複数系列グラフが作成できる

##### [グラフ表示の注意点](beginner/caution_for_visualization.ipynb)
---
適切なグラフの種類・強調表現を選択できる

#### [データ把握まとめ](beginner/conclusion_of_data_understanding.ipynb)
---
データ可視化の重要性を理解する  
日常的にデータ把握できているか確認する

### クラスタリングを実行する

#### [クラスタリングの概要](beginner/clustering.ipynb)

#### [k-means](beginner/kmeans.ipynb)
---
k-means を実行できる

#### [Mean Shift](beginner/mean_shift.ipynb)
---
Mean Shift を実行できる

#### [階層的クラスタリング](beginner/hierarchical_clustering.ipynb)
---
階層的クラスタリングを実行できる

### [確率分布を理解する](beginner/distribution.ipynb)
---
以下の確率分布がわかる
 - 一様分布
 - ベルヌーイ分布
 - 二項分布
 - ポアソン分布
 - 正規分布

任意の値から確率 (密度) や上側・下側確率を求められる  
上側・下側確率から対応する値を求められる

### [全体の平均を推定する](beginner/population_mean_estimation.ipynb)
---
母平均と標本平均の違いがわかる  
中心極限定理がわかる  
標準誤差がわかる

### [モデリングの目的を理解する](beginner/introduction_to_modeling.ipynb)
---
数理モデルと統計モデルの違いがわかる  
モデリングの目的の種類 (特に相関関係と因果関係の違い) がわかる

### 回帰を実行する

#### [単回帰分析](beginner/simple_linear_regression.ipynb)
---
単回帰分析を実行できる

### 分類を実行する

#### [ロジスティック回帰](beginner/logistic_regression.ipynb)
---
名義尺度の変数をダミー変数に変換できる  
ロジスティック回帰が行なっていること (確率の推定) がわかる  
ロジスティック回帰を実行できる

### データの取り扱い

#### [データ取得](beginner/data_acquisition.ipynb)
---
CSV ファイルや SQL を使用したデータベースからデータを読み込める  
条件を指定して必要なデータを絞り込んだり、件数を制限できる  
複数のデータを統合できる

#### [データ加工](beginner/preprocessing.ipynb)
---
datetime 型を扱える  
地名から都道府県コードなどへの変換ができる  
変数をスケーリングできる  
カテゴリ別に合計や平均などを集計できる  
行方向や列方向に平均をとり、データを集約できる

#### [外れ値・異常値・欠損値の除去・補完](beginner/imputation.ipynb)
---
簡単な外れ値の検出方法を実行できる  
欠損値を除去できる  
欠損値を代表値で補完できる

### [初級課題](beginner/exercise.ipynb)

## データサイエンス中級

### 数学

#### 行列分解

### データ把握

#### 集計・数値要約

#### グラフ表示

##### [複数変数を一度に把握](graph_matrix.ipynb)
---
散布図行列・相関行列が作成できる

##### グラフ表示の注意点
---
何を見たいか、伝えたいかを考えてグラフの種類を選ぶ  
軸は原点から始める  
カテゴリ数が多い場合は棒グラフの軸に意味を持たせる  
色・大きさ・原点の位置などの影響  
可視化演習

### 統計的仮説検定

#### [統計的仮説検定の概要](intermediate/hypothesis_testing.ipynb)
---
帰無仮説・対立仮説・検定がわかる  
両側検定・片側検定と対応する対立仮説がわかる

#### [t検定](intermediate/t_test.ipynb)

#### 対応のない2群の検定

#### 分割表の検定

#### 検定力分析

### テスト・バリデーション

### 回帰

#### 重回帰分析

#### 正則化

### 分類

#### 決定木

#### ロジスティック回帰

#### サポートベクターマシン

#### ナイーブベイズ

### モデル評価・選択

### 高度な予測手法

#### アンサンブル学習

#### ニューラルネットワーク

#### ベイジアンネットワーク

### クラスタリング

#### k-means

#### mean-shift

#### 階層的クラスタリング

### 時系列データ分析

### ベイズ統計

### 次元削減・潜在変数

#### 主成分分析

#### コレスポンデンス分析

#### 因子分析

#### 分散共分散構造分析

#### コンジョイント分析

#### 多次元尺度構成法

### 最適化

#### 線形計画法

#### 多腕バンディットアルゴリズム

### データ取得

### データハンドリング

#### 外れ値・異常値・欠損値

### 中級課題