# Pythonの基本と各種ツール

ここでは、Jupyter Notebookというツールを使って、Pythonの基本を学んでいきます。

## pipコマンドの基本

Pythonのパッケージのインストールに`pip`コマンドを使用しました。`pip`コマンドは以下のようなよく使われる機能があります。

### インストール済みパッケージの一覧表示

```bash
pip list
```

### インターネット上のパッケージ検索

```bash
pip search numpy
```

### インターネットからのパッケージインストール
パッケージのバージョンを指定する場合には、パッケージ名の後に`==バージョン番号`をつけます。

```bash
pip install numpy
```

```bash
pip install tensorflow==2.0.0
```

## pip コマンド実行時の警告について

pipコマンドを実行する際に、警告が表示される場合があります。対処方法を簡単に示します。

### listコマンドの出力に関するDEPRECATE警告

`pip list`コマンドの出力形式が`columns`形式に変わったことから、パッケージ名のあとに（）書きでバージョン番号を表示する従来の形式（`legacy`）か新形式（`columns`）を選択するように促す警告です。

`pip.ini`あるいは`pip.conf`ファイルに下記の記述を加えることで、表示されなくなります。
```pip.ini
[list]
format = columns
```

### pipの新バージョンへのアップグレードを促す警告

pipの新バージョンが利用可能となっているため、アップグレードを促す警告です。

`pip install --upgrade pip`

を実行することで、pip自体をアップグレードできます。

# Pythonプログラム作成と実行

Pythonはインタプリタ型言語なので、プログラムはテキストファイルです。  
したがって任意のテキストエディタでプログラム作成が可能ですが、Python3よりエンコーディングはUTF-8がデフォルトです。  
Windowsのメモ帳は今のところ、システムのエンコーディングをUTF-8にしない限りBOMなしのUTF-8ファイルを作成できないので、Python3のプログラム作成には使用できません。  

※BOM（Byte Order Mark）複数バイトの文字の場合のバイトの並び順を示すコード

## おすすめの開発ツール

### Visual Studio Code

Microsoftの無料ソースコードエディタ。Windows以外にMac、Linuxにも提供されている。  
Microsoftが提供しているPython拡張機能があり、インテリセンスによる保管機能やコードハイライトのほか、リファクタリングやデバッグなどのサポートもある。


ダウンロードサイト：  
https://code.visualstudio.com


Python向け設定方法：
Visual Studio Codeの設定「虎の巻」：Python編   
http://www.atmarkit.co.jp/ait/articles/1711/24/news034.html


### Atom

Githubが開発したオープンソースのコードエディタ。Visual Studio Codeのお手本となった開発ツールであり、機能も豊富でマルチOS対応。  
MicrosoftがGithubを買収したので、VSCodeと統合される？  


ダウンロードサイト：  
https://atom.io


Python向け設定方法：Python入門 初心者でも出来るAtomエディタでの開発方法  
http://python-tech.com/python_beginner_on_atom/

### PyCharm

各種開発ツールを販売する<span style="color: red">JetBrains</span>が開発しているPython用統合開発環境。Jupyter Notebookの編集・実行やWebアプリケーションフレームワークのDjangoなどにも対応している。  
有償のフル機能版と無償のコミュニティ版がある。


ダウンロードサイト：  
https://www.jetbrains.com/pycharm/


日本語ヘルプ：  
https://pleiades.io/help/pycharm/meet-pycharm.html



### Visual Studio

Visual Studio製品版を使用している場合にはPythonの開発も可能。  （Windows版のみ）


Microsoftの解説：  
https://docs.microsoft.com/ja-jp/visualstudio/python/overview-of-python-tools-for-visual-studio

### Jupyter Notebook （今回はこれを使います）

Jupyter NotebookはPythonの高度なインタラクティブ実行環境であるIPythonをWebインターフェイスを通して使えるようにしたもの。  
実行結果の出力やグラフなどを一緒に保存できる他、Markdown記法によって簡単なテキストフォーマッティングやTexによる数式記述も可能。  
内容を論文等でよく使われるLaTexやPDFとして出力させたり、スライドショーにしたりすることもできる。  
Python以外に、RやJuliaといったデータ分析系言語やRuby, Scalaなど40の言語にも対応可能。  
データ分析用の用途によく使われており、Microsoft, AWS, Googleのデータ分析関連サービスでも使用されている。


本家サイト：  
http://jupyter.org


非常に簡単な解説：Jupyter Notebook を使ってみよう  
https://pythondatascience.plavox.info/pythonの開発環境/jupyter-notebookを使ってみよう


#### Jupyter Notebookのインストール

Pythonが実行できるコマンド環境で下記のようにpipでインストール

    pip install jupyter

#### Jupyter Notebookの実行

Pythonが実行できるコマンド環境で下記のコマンドで実行する。通常デフォルトのブラウザが自動的に起動され、http://localhost:8888 を開く。

    jupyter notebook
    
#### Jupyter Notebookの停止

実行中のNotebookを保存しカーネルを停止したあと、jupyter notebookが起動しているコマンドプロンプトでCtrl+Cを押す。停止確認のプロンプトでyを入力して停止させる。

#### コード入力補完機能の追加

    pip install jupyter_contrib_nbextensions
    jupyter contrib nbextension install
    

上記の設定を行ってJupyter Serverを再起動すると、ファイル一覧の画面に Nbextensions というタブが表示されます。  
Hinterlandというチェックボックスを選択すると、コード入力補完機能が有効になります。  

## Jupyter Notebookの操作

### Cellとモード

Jupyter Notebookは複数のCell（セル）で構成されます。  
Cellには3つの種類があり、ページ上部のドロップダウンで種類の変更が可能です。  

現在選択されているCellは青あるいは緑の枠で示されます。  
<span style="color: blue">青はコマンドモード</span>、<span style="color: green">緑は編集モード</span>を意味します。  
選択中のCellをダブルクリックすると編集モードに入ることができます。  
編集モードから抜けるにはEscキーを押します。

#### Code
プログラムを記述するCellです。  
コードハイライトや、上記の入力補完機能が使用できます。  

#### Markdown
ブログやWikiソフトで使用されるMarkdown記法が使えるCellです。  
実行されると書式が適用されます。  

ドロップダウンにはHeadingという選択肢がありますが、これはMarkdownを使用した見出しの挿入機能です。  

#### Raw NBConvert
入力したものがそのまま保存されるCellです。

### Cellの実行

Cellを実行するには、ページ上部のRunボタンをクリックするか、キーボードでCtrl+Returnを入力します。  
この場合にはアクティブなCellは移動しません。

キーボードでShift+Returnを入力すると、選択中のCellが実行され、次のCellがアクティブになります。  
一番下のCellでShift+Returnを入力すると、新しいCode Cellが追加され、そのCellが選択されます。

Cellメニューを使うと、その他の操作が可能です。

### Cellのコピーアンドペーストとキーボードショートカット

同じNotebook中では、Cellのコピーアンドペースト、カットアンドペーストが可能です。

### Kernelの再起動と停止

ブラウザでNotebookを開くと、サーバー側でそのNotebookに結び付けられているプログラム実行環境（Kernel）が起動され、クライアントとWebSocketで接続されます。  
ファイルの一覧画面ではKernelが実行中のNotebookがわかるように表示される他、実行中のカーネルのみを表示するRunningタブもあります。  

Kernelの実行中は、変数やオブジェクトはKernelに割り当てられたメモリ空間に存在し続けます。  

メモリ空間（オブジェクト空間）をリセットしたい場合には、KernelメニューからRestartを選択します。  
ただのRestart以外に、Code Cellの出力をクリアしたり、Restart後にすべてのCellを実行するオプションなどがあります。  

実行中のCode Cellを止めたい場合には、KernelメニューからInterruptを選択します。  
この場合には、プログラムが停止した時点の変数やオブジェクトが残っています。

### Notebookの保存と終了

編集中のNotebookは定期的に仮保存されCheckpointが1つだけ作られます。  
Revert to Checkpoint を使うと、保存された時点に戻すことが可能です。

編集結果を保存するには、Save and Checkpointを実行します。

Notebookを終了する際には、ブラウザのクローズボタンを使わず、FileメニューからClose and Haltを選択して、Kernelを停止させてください。  
もし、停止し忘れた場合には、ファイル一覧ページでShutdownさせることも可能です。

Kernel実行中のNotebookを閉じてしまった場合、ブラウザを終了しなければ、同じNotebookを開くことで実行中のKernelに接続できることがあります。

# Pythonの基本

## データ型

### 文字列型

文字列型はダブルクォーテーション " あるいはシングルクォーテーション ' で囲んで表します。

どちらも違いがありませんが、原則としてどちらかにそろえるときれいです。

文字列の中に、ダブルクォーテーションあるいはシングルクォーテーションを含める場合には、バックスラッシュによるエスケープが必要となります。エスケープを避けるために、もう一方の引用符を使うことができます。

In [None]:
"これは文字列です"

In [None]:
'He said "Hello".'

データ型を知るにはtype()関数を使います。（関数についての詳細は後述）

In [None]:
type("これは何の型？")

### 数値型

数値型には整数型（int）と浮動小数点型（float）が存在します。整数型は計算の必要に応じて浮動小数点型に自動変換されます。

In [None]:
type(3)

In [None]:
type(2.5)

浮動小数点演算には様々が変換誤差・計算誤差が伴います。Pythonには10進演算をサポートするdecimalモジュールも付属しています。

### ブール（論理）型

ブール型は True と False という予約語によってあらわされます。

In [None]:
type(True)

## 変数と定数

変数名には小文字英数字をアンダースコアでつないだものを使います。

In [None]:
x = 3.5
my_height = 165.3

プログラムの中で値が変わることのない定数の名前は大文字英数字とアンダースコアを使います。

In [None]:
HOST_NAME = "www.bsnnet.co.jp"

## データ構造

### リスト

Pythonのリストは他の言語の配列のようなものです。リストを定義するには角括弧 [] を使い、要素をカンマ , で区切って表します。

In [None]:
a1 = [3, 4, 5]

リストの要素を取り出すには要素の位置を表す添え字を使います。Pythonの添え字は0から始まります。

In [None]:
a1[1]

Pythonのリストには、異なるデータ型の要素を混在させることができます。

In [None]:
a2 = ["名前", 168.1]

リストをリストの要素にするすることも可能です。これにより、多次元の配列を表すことができます。

In [None]:
a3 = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
a3[1][2]

添え字にコロン : を使うことで、添え字の範囲を指定することができます。範囲の右は含まれないことに注意してください。

また、コロン : の左側あるいは右側を省略することも可能です。

In [None]:
a3[0:2]

In [None]:
a3[:1]

### 辞書

辞書は、要素と要素の対応関係を保持して利用するためのデータ構造です。Rubyなどの言語でハッシュと呼ばれているものです。

辞書はブレース {} とコロン : を使って定義されます。コロンの前の部分をキー key 、後の部分を値 value　と呼びます。

辞書を使ってキーを指定して対応する値を得るには、角かっこ [] を使います。

In [None]:
d1 = {"太郎": 4, "花子": 5}
d1["花子"]

### そのほかのデータ構造

#### タプル
タプルはリストに似ていますが、一度定義したものは変更不可となり、変更操作をすると新たなタプルが生成されます。タプルは後述する関数の戻り値として複数の値を返すのに利用されます。

タプルは丸括弧 () を使って定義されます。

In [None]:
tupple = (3, 'a')
x, y = tupple
print(x)
print(y)

#### セット（集合）  
セットは集合を表すデータ構造で、ブレース {} を使って定義されます。セットの要素には重複が許されないという特徴があります。

In [None]:
set_a = {'cat', 'dog', 'horse'}
set_b = {'flog', 'cat'}
print(set_a.intersection(set_b))
print(set_b.union(set_a))
print(set_a.difference(set_b))

## 演算子

### 四則演算
四則演算は他の言語とほぼ同じ記号が利用されます。  

<pre><span style="color: red">
+ 加算  
- 減算  
* 乗算  
/ 除算
</span>
</pre>

In [None]:
8 + 4 * 3 - 1 / 3

### その他の演算
#### べき乗
べき乗は ** を演算子として使用します。

#### 整数の除算  
除算の結果を整数として得たい場合には // 演算子を使用します。
除算の剰余を得るには % 演算子を使用します。 　

#### 代入演算子 
CやJava言語にあるインクリメント x++ デクリメント x-- などの代わりに、代入演算子があります。

a += b は a = a + b と同じ意味を持ちます。x++ は x += 1 と書くことができます。  
同様に -= *= /= などの演算子も利用可能です。

## 基本構文

Pythonで分岐や繰り返しを表す構文を示します。  
Pythonではコードのブロックをインデントを用いて表します。他の言語のような {} や　begin end は必要ありません。

### if文
条件分岐は if elif elseを用いて表します。

    if 条件1:  
        処理1  
    elif 条件2:  
        処理2  
    else:  
        処理3  

### 比較演算子
    a == b           # a が b と等しい  
    a != b           # a が b と異なる  
    a < b            # a が b よりも小さい  
    a > b            # a が b よりも大きい  
    a <= b           # a が b 以下である  
    a >= b           # a が b 以上である  
    a <> b           # a が b と異なる  
    a is b           # a が b と等しい  
    a is not b       # a が b と異なる  
    a in b           # a が b に含まれる  
    a not in b       # a が b に含まれない  
### 論理演算子
    a and b         # a も b も真であれば真
    a or b          # a または b が真であれば真
    not a           # a が偽であれば真
### 真理値の扱い
Pythonの場合、True/False　のリテラル以外に次のような判定が行われることに注意が必要です。

#### 真（True)として扱われるもの
オブジェクトは既定で真として扱われる。  
ただし、__bool__()メソッドが定義されていてFalseを返した場合、或いは、__len__()メソッドが定義されていてゼロを返した場合には偽として扱われる。

#### 偽（False）として扱われるもの
+ None または False
+ 数値でゼロを表すもの
+ シーケンスまたはコレクション（文字列、リスト、辞書、タプル、セット等）で要素が空のもの

### while文
条件が真の間、処理を繰り返す制御構造。

    while 条件:
        処理


In [None]:
i = 0
while i < 10:
    print(i)
    i += 1

### for文
シーケンス（文字列、タプル、リスト）やその他の反復可能（iterable）なオブジェクトの要素ごとに処理を繰り返す場合に使用する。

    for ターゲットリスト in 式リスト:
        処理

In [None]:
for letter in ['a', 'b', 'c']:
    print(letter)

辞書（ディクショナリ）の場合には、keyが取得されます。  

In [None]:
my_dict = {'太郎': 99, '二郎': 88, '花子': 100}

for key in my_dict:
    print(key)

valueを取り出したい場合には、.values()メソッドを使用します。

In [None]:
for value in my_dict.values():
    print(value)

keyとvalueのペアを取り出したい場合には、.items()メソッドを使用します。

In [None]:
for key,value in my_dict.items():
    print(key, ':', value)

### range()関数
整数の列を返すイテレータです。

    range(n)           # 0から始まりn-1までを返す  
    range(n,m)         # nから始まりm-1までを返す  
    range(n,m,s)       # nから始まりsごとにm未満である整数を返す  
    

In [None]:
for i in range(10):
    print(i)

## 内包表記

### リスト内包表記
繰り返し可能オブジェクトの全要素あるいは一部の要素に対して処理を加えた結果を新たなリストとして生成する簡潔な記法です。

In [None]:
numbers = [1, 2, 3, 4, 5]
power2 = [ x**2 for x in numbers]
power2

## 例外処理

プログラムの実行中に起きたエラーでプログラムが中断することを防ぐには、例外処理を記述します。  
Pythonの例外処理の記述形式は次の通りです、

<pre>
try:
    例外を捕捉したい処理ブロック
except 例外クラス名 as 変数名:
    指定された例外が起きた場合の処理
else:
    指定された例外が発生しなかった場合の処理
finally:
    例外が発生してもしなくても実行したい処理
</pre>

## 関数

関数は、定義されたひとかたまりの処理で、戻り値を持つ場合と、そうでない場合もある。  
Pythonに組み込まれた関数もあるが、ユーザーが自分で関数を定義することができる。  

    def user_func(param1, param2, named_param1=None, named_param2=0, **args):
        関数本体
        return xxx

関数の仮引数には、固定（位置指定）引数、名前付き引数がある。名前付き引数には省略時の値を定義することができる。  
仮引数で定義されていない引数を受け取るためのスター引数、ダブルスター引数も利用可能。

In [None]:
def bmi(height=160, weight=50):
    if height > 0:
        bmi_value = weight / (height / 100) ** 2
    else:
        bmi_value = None
    return bmi_value

bmi(165, 60)

## クラス

クラスの定義例は次のようになります。

    class MyClass(ParentClass):                 # 継承の際にはカッコ内に親クラスを記述する
        def __init__(self, param1, param2): # パラメータを受け取りインスタンスを初期化するメソッド
            self.var1 = param1
            self.var2 = param2
        
        def my_method(self, my_var1):
            value = my_var1 * self.var1 + self.var2
            return value

In [None]:
class MyClass():
        def __init__(self, param1, param2): 
            self.var1 = param1
            self.var2 = param2
        
        def my_method(self, my_var1):
            value = my_var1 * self.var1 + self.var2
            return value
        
my_instance = MyClass(2, 3)
my_instance.my_method(4)

## モジュール

他のファイルにある関数やクラスを利用するにはimport文を使用します。  
import文には次のようなバリエーションがあります。

    import モジュール名  
    from モジュール名 import 関数名・クラス名  
    import モジュール名 as 別名  




## ファイルの入出力

### テキストファイルの読み込み

In [None]:
f = open('sample.txt', 'r', encoding='shift_jis')
txt = f.read()
f.close()
txt

### テキストファイルの書き出し

In [None]:
f = open('output.txt', 'w', encoding='utf-8')
f.write('このファイルはPythonで出力されました。\n')
f.write('このファイルの文字コードはUTF-8です。\n')
f.close()

### with文を使ったファイル操作
with文を使うことで、確実にファイルをクローズすることができます。

In [None]:
with open('output.txt', 'r', encoding='utf-8') as f:
    txt = f.read()
print(txt)

## Pythonのコーディング規約

PythonにはPEP8と呼ばれるコーディング規約があります。  
コーディングの際に参考にすると良いでしょう。

http://pep8-ja.readthedocs.io/ja/latest//

コーディング規約に沿っているかどうかをチェックするツールなどもあります。

# 練習問題

## FizzBuss

簡単な練習問題をやってみましょう。いわゆるFizzBuss問題です。  
下記のようなルールに従って1から指定された数nまでを出力（print）する関数 fizzbuzz(n)を定義してください。  

- iが3で割り切れる場合にはFizzと出力する。
- iが5で割り切れる場合にはBuzzと出力する。
- iが3でも5でも割り切れる場合にはFizzBuzzと出力する。

上記のいずれでもない場合にはiを出力する。