# Python で気軽に化学・化学工学
# 第 11 章 目標達成に向けて実験条件・製造条件を提案する
本章で用いる仮想サンプルの生成

## Jupyter Notebook の有用なショートカットのまとめ
- <kbd>Esc</kbd>: コマンドモードに移行（セルの枠が青）
- <kbd>Enter</kbd>: 編集モードに移行（セルの枠が緑）
- コマンドモードで <kbd>M</kbd>: Markdown セル (説明・メモを書く用) に変更
- コマンドモードで <kbd>Y</kbd>: Code セル (Python コードを書く用) に変更
- コマンドモードで <kbd>H</kbd>: ヘルプを表示
- コマンドモードで <kbd>A</kbd>: ひとつ**上**に空のセルを挿入
- コマンドモードで <kbd>B</kbd>: ひとつ**下**に空のセルを挿入
- コマンドモードで <kbd>D</kbd><kbd>D</kbd>: セルを削除
- <kbd>Ctrl</kbd>+<kbd>Enter</kbd>: セルの内容を実行
- <kbd>Shift</kbd>+<kbd>Enter</kbd>: セルの内容を実行して下へ

わからないことがありましたら、関係する単語やエラーの文章などでウェブ検索してご自身で調べてみましょう。

In [None]:
import pandas as pd # pandas のインポート
import numpy as np # NumPy のインポート

### 上限値と下限値を自由に設定
生成するサンプルにおける特徴量ごとの上限値と下限値を csv ファイルで事前に設定しておき、それを読み込むことで、特徴量ごとの上限値と下限値を自由に設定できます。`sim_upper_lower.csv` に基づいて本章で用いる仮想サンプルを生成します。

In [None]:
x = pd.read_csv('sim_upper_lower.csv', index_col=0, header=0) # 特徴量の最大値と最小値の読み込み

In [None]:
x # 念のため確認

In [None]:
x_upper = x.iloc[0, :] # 上限値

In [None]:
x_upper # 念のため確認

In [None]:
x_lower = x.iloc[1, :] # 下限値

In [None]:
x_lower # 念のため確認

サンプルの生成

In [None]:
number_of_generated_samples = 100000 # 生成するサンプル数

In [None]:
generated_x = np.random.rand(number_of_generated_samples, x.shape[1]) # 0 から 1 の間の一様乱数でサンプル生成

In [None]:
generated_x # 念のため確認。array 型で生成されます

In [None]:
generated_x = generated_x * (x_upper.values - x_lower.values) + x_lower.values # 上限値から下限値までの間に変換

In [None]:
generated_x # 念のため確認。

もし、四捨五入で端数処理をしたいときは、下の Code セルにおいて list の変数 `effective_digits` で特徴量ごとの桁の数を指定して実行してから、さらに次の Code セルを実行してください。桁数の指定の仕方として、小数点 *m* 桁目まで残したい ((*m* + 1) 桁目を四捨五入したい) 場合は `m`、10 の *n* 乗の位まで残したい (10 の (*n* - 1) 乗の位で四捨五入したい) 場合は `-n` とします。  
その必要がなければ、以下の 3 つの Code セルを実行せずに飛ばしてください。  
今回は、`x1`, `x2`, `x3` ともに小数点 3 桁目まで残すようにします。

In [None]:
effective_digits = [3, 3, 3] # 特徴量ごとの、桁数の設定

In [None]:
for feature_number in range(generated_x.shape[1]):
    generated_x[:, feature_number] = np.round(generated_x[:, feature_number], effective_digits[feature_number])

In [None]:
generated_x # 念のため確認

DataFrame 型に変換して csv ファイルに保存

In [None]:
generated_x = pd.DataFrame(generated_x, columns=x.columns) # pandas の DataFrame 型に変換し、特徴量の名前を x と同じに

In [None]:
generated_x.iloc[:35, :] # 念のため確認

In [None]:
generated_x.to_csv('all_experiments.csv') # csv ファイルに保存