# Module1: Visual Studio Code 入門
このモジュールでは、Visual Studio Code の簡単な紹介と、Python の実行を実演します。
10分

# Visual Studio Code の準備
[MS Learn](https://docs.microsoft.com/ja-jp/learn/modules/python-install-vscode/) に学習コンテンツがございます。
今回ご紹介する手順は上記のモジュールを基に作成しています。
また、Python の基本的な文法を理解しており、機械学習ライブラリを使った経験がある方を対象にしていますので、Python 自体のセットアップには触れません。

## VS Code の導入
お使いの環境に合わせて、[ダウンロード](https://code.visualstudio.com/)し、インストールしてください。

## VS Code 拡張機能
左側の拡張機能から様々な機能を追加することができます。
今回は Python の開発・実行を実演しますので、Python の拡張を install しましょう。

## Azure Command-Line Interface(CLI)
また、Azure 環境との相性を最大限活用する場合、Azure CLI が必須になります。
例えば Azure Machine Learning のワークスペースを作成したり、コンピューティングリソースを作成することもできます。
CLI のセットアップ、サインインなど多少手続きが必要ですので、今回は実演しませんのでご了承ください。

# Python のデモ
まずは VS Code の学習モジュールにある、*hello.py* を作成してみます。
以下のコードではスクリプトを書き出しています。別のタブで開き、エディタとしての機能も確認してみましょう。

In [1]:
%%writefile hello.py
print('Hello, world!')

Writing hello.py


以下のようにスクリプトを実行します。

In [2]:
!python hello.py

Hello, world!


# Module2 をローカルで実装

Module2 では Azure の環境を最大限活用しています。
ローカルの環境では全て再現できませんので、scikit-learn の機能に限定して再現しています。

## 準備
必要なモジュールを読み込みます。お使いの環境に scikit-learn がインストールされていることを確認してください。

In [4]:
import pandas as pd
import numpy as np

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score
from sklearn.metrics import roc_curve



## データ読み込み
スクリプトの引数として実装しているハイパーパラメータは、変数として与えます。

In [7]:
reg = 0.01

# load the diabetes dataset
print("Loading Data...")
# load the diabetes dataset
diabetes = pd.read_csv('data/diabetes.csv')


Loading Data...


## モデルの学習
ここから scikit-learn の機能を使い、モデルを学習します。Module2 では **run.log()** と言うコードが随所に現れますが、ここでは再現できないため外しています。
この log によってメトリックを保存したり、様々な情報を Azure 上で管理することができるようになります。

In [8]:
# Separate features and labels
X, y = diabetes[['Pregnancies','PlasmaGlucose','DiastolicBloodPressure','TricepsThickness','SerumInsulin','BMI','DiabetesPedigree','Age']].values, diabetes['Diabetic'].values

# Split data into training set and test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=0)

# Train a logistic regression model
print('Training a logistic regression model with regularization rate of', reg)
model = LogisticRegression(C=1/reg, solver="liblinear").fit(X_train, y_train)

# calculate accuracy
y_hat = model.predict(X_test)
acc = np.average(y_hat == y_test)
print('Accuracy:', acc)

# calculate AUC
y_scores = model.predict_proba(X_test)
auc = roc_auc_score(y_test,y_scores[:,1])
print('AUC: ' + str(auc))


Training a logistic regression model with regularization rate of 0.01
Accuracy: 0.774
AUC: 0.848486491865267
