# 学習済みモデルを利用した性別予測
* 先日の調査データ（N=30）に基づく学習済みモデルで性別を予測するサンプルです。
* 学習済みモデル gender_model.pkl は、以下のURLから読み込みます。  
* https://github.com/koichi-inoue/DataScience/raw/main/gender_model.pkl

### モデルが学習した特徴量は、以下のとおり
* 形式科学（数学・統計学等）に対する関心度  ＞　興味ない 1,2,3,4,5 興味ある
* 自然科学（物理・化学・生物等）に対する関心度  ＞　興味ない 1,2,3,4,5 興味ある
* 情報科学（コンピュータ・情報処理等）に対する関心度  ＞　興味ない 1,2,3,4,5 興味ある
* ３年次以降、研究（探究）したいテーマは定まっていますか  ＞　特にない 1,2,3,4,5 明確に定まっている
* １日あたりの運動（スポーツ・筋トレ等）の時間を教えて下さい＞ 1,2,3,4,5（時間）
* １日あたりの平均睡眠時間を教えて下さい　＞ 1,2,3,4,5 （5時間 - 9時間に対応)

### 注意
* ソーシャルデザイン学科２年生のアンケート結果にもとづいて学習させていますので、  
異なる母集団に属する方の性別推定はできない・・とお考え下さい。


In [1]:
# 標準的なライブラリ
import pandas as pd

# scikit-learn
from sklearn.metrics import accuracy_score, confusion_matrix

# ファイルの入出力
import requests
from io import BytesIO
import pickle

In [2]:
# 学習済みモデルを読み込み
model_url = 'https://github.com/koichi-inoue/DataScience/raw/main/gender_model.pkl'
response = requests.get(model_url)

if response.status_code == 200:
  model_bytes = BytesIO(response.content)
  with open("gender_model.pkl", "wb") as f:
    f.write(model_bytes.getvalue())
  with open("gender_model.pkl", "rb") as f:
   loaded_model = pickle.load(f)
else:
  print(f"エラー: {response.status_code}")

## データ入力と予測判定
以下を実行して、質問に回答してみて下さい。すべて半角英数の 1〜5 で入力して下さい。  
あなたが、女性である確率、男性である確率が、表示されます。

In [3]:
# 形式科学（数学・統計学等）に対する関心度  ＞　興味ない 1,2,3,4,5 興味ある
x1 = input( "形式科学（数学・統計学等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：" )
x2 = input( "自然科学（物理・化学・生物等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：" )
x3 = input( "情報科学（コンピュータ・情報処理等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：" )
x4 = input( "３年次以降、研究（探究）したいテーマは定まっていますか：「特にない〜明確に定まっている」を１〜５で入力してください：" )
x5 = input( "１日あたりの運動（スポーツ・筋トレ等）の時間を教えて下さい：「時間単位で１〜５で入力してください：" )
x6 = input( "１日あたりの平均睡眠時間を教えて下さい：5時間= 1, 6時間=2, 7時間=3, 8時間=4, 9時間=5 として１〜５で入力してください：" )

sample = pd.DataFrame(data=[[x1,x2,x3,x4,x5,x6]], columns= [['形式科学','自然科学','情報科学','研究テーマ','運動','睡眠']]
                      )
probability = loaded_model.predict_proba(sample)

print('------------ 判定 ------------')
print(f"女性:{probability[0,0] * 100:.2f}%" )
print(f"男性:{probability[0,1] * 100:.2f}%" )

形式科学（数学・統計学等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：3
自然科学（物理・化学・生物等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：5
情報科学（コンピュータ・情報処理等）に対する関心度：「興味ない〜興味ある」を１〜５で入力してください：4
３年次以降、研究（探究）したいテーマは定まっていますか：「特にない〜明確に定まっている」を１〜５で入力してください：2
１日あたりの運動（スポーツ・筋トレ等）の時間を教えて下さい：「時間単位で１〜５で入力してください：1
１日あたりの平均睡眠時間を教えて下さい：5時間= 1, 6時間=2, 7時間=3, 8時間=4, 9時間=5 として１〜５で入力してください：2
------------ 判定 ------------
女性:98.47%
男性:1.53%


