# Pythonのプログラムの書き方

* Windows,Mac,Linuxで使うことができる
* 互換性が高く使い回しができる
* インタープリターである (対話モード) 
* 実際のコード画面である

### スクリプト画面
<img src="script.png" width="900px">

* これだと非常にわかりにくい
* Pythonで書ける便利な環境を使う
* Jupyter Notebook (あるいはJupyter Lab)、Colaboratoryがオススメである
* 今回はJupyter Notebookを使う

# 百問は一見にしかず

どんなことができるか、経験してみる

# 四則演算
* 足し算，引き算，掛け算，割り算のことである。
* 商や剰余も求めることができる。
* 指数計算もできる。

In [None]:
#1+2

In [None]:
#3-2

In [None]:
#5*2

In [None]:
#5**2

In [None]:
#9/5

In [None]:
#9//5

In [None]:
#9%5

|メソッド|作用|
|:-:|:-:|
|足し算|+|
|引き算|-|
|掛け算| * |
|割り算|/|
|商|//|
|乗余|%|
|べき乗| ** |

# 変数
* 変数を使うことで，計算結果や各種データを保存することができる。保存された変数は後で使うこともできる。
* 変数は決めることができるがルールがあるので注意する。
* 変数として使ってはいけないものがあるので注意する。

In [None]:
price = 100

* priceという変数(名)に100を代入する
* `=`は`代入`を指示する。(同じという意味ではない)

In [None]:
price

プライスを実行するとpriceに格納された値が出力される

In [None]:
price+10

priceに10を加えるので110が出力される

変数への上書き

In [None]:
#この時点のpriceの確認
price

In [None]:
price = 200

priceは変数名として定義されている。現時点ではpriceは100という数値に置き換えられるが、上のコードを実行すると、priceは200に置き換わる。つまり、priceの中身が変わる。

In [None]:
price

In [None]:
price =100

In [None]:
price

priceが変更された、上書きされた。

変数同士の計算

In [None]:
price_a = 10
price_b = 20

In [None]:
price_a + price_b

変数は数値などの代わりに用いるのが一般的である。

In [None]:
price_c = price_a + price_b

変数名を使って計算したものを変数名に代入することができる。

ただし、変数名をあらかじめ定義する必要がある。

# 型(タイプ)

* 先ほどの5や1.8などの数値を，`整数`と`小数`に区別されることを知っておかなければならない。前者を`int`型，後者を`float`型という。
* シングルクォテーション(')もしくはダブルクォテーション(")で囲まれた値を`文字列型(str型)`という。
* Pythonでは型によって処理の種類が決まめられており，int型やfloat型は四則演算が適用される。文字列型は，文字の途中を置き換えたり，文字同士の連結などができる。

# 文字列①
`str型`はシングルクォテーション(')もしくはダブルクォテーション(")で囲む。どちらを用いても構わない，好みの問題である。

In [None]:
name = "理学療法士"

nameという変数名に`理学療法士`を代入する

In [None]:
name

In [None]:
text = "私は，'理学療法士'です。"

textという変数名に文字を代入する

In [None]:
text

文字列に`'`や`"`が含まれる場合は含まれない方を文字列型と指定するコードに用いる。

In [None]:
text1 = "Hello"
text2 = "World"

In [None]:
text1 + text2

文字列同士の結合は`+`を使う。

In [None]:
text1 = ''

`''`に書くと空文字というものができる。これは文字のない文字形式という不思議なものである。
あとから文字を追加する場所を確保するためによく使われる。

In [None]:
text1+"wakayama"

In [None]:
text1*3

`*`と数字の組み合わせで文字列を繰り返すことができる

In [None]:
text1*0

`*0`で空文字に戻る。(滅多に使わない)

数値から文字列への変換

In [1]:
num = 10
ten = str(num)

In [2]:
num - num

0

In [3]:
ten

'10'

In [4]:
ten-ten

TypeError: unsupported operand type(s) for -: 'str' and 'str'

組み込み関数である`str()`で10を文字列型にしているので，tenという変数には文字列型が存在する。

文字列から数値への変換

文字列型に数値のみが含まれていれば，`int()`，`float()`数値に変換することができる。

In [None]:
int(ten)

文字数のカウント

`len()`を使って長さを得ることで文字数を調べることができる。スペースも含まれるので注意する。

In [None]:
len('Hello')

In [None]:
len('Hello World')

# 文字列②

`シーケンス型`というグループがある。シーケンス型とは順番にデータが格納されているものを指し，文字列型はこれに該当する。

シーケンス型のデータに対して行える便利な操作がある。この操作は非常によく使うので是非とも覚えてもらいたい。

インデクシングとスライシング

indexとは目盛りや指針という意味であり，指すというニュアンスがある。Pythonでは`[index]`と書いて，シーケンス型のデータの特定の位置を指すことができる。これをインデクシングという。

インデクシングでは，１箇所を指す。複数を指したい場合には`:`を使う。これをスライシングという。

`[1:4]`ように書く。

In [None]:
text = "今日は天気が良いです。"

textに`今日は・・・`の連続文字を代入する。

In [None]:
"今日は天気が良いです。"[0]
# or text[0]

連続文字の一番目の文字だけを出力する

In [None]:
"今日は天気が良いです。"[1]
# or text[1]

連続文字の二番目の文字だけを出力する

In [None]:
"今日は天気が良いです。"[-1]
# or text[-1]

連続文字の最後の文字だけを出力する

In [None]:
"今日は天気が良いです。"[-2]
# or text[-2]

連続文字の最後から二番目の文字だけを出力する

In [5]:
text[40]

NameError: name 'text' is not defined

文字数よりも大きい数だとエラーになる

スライシングのイメージ
<img src="fig001.png" width="500px">

スライシングの例

In [None]:
"今日は天気が良いです。"[2:5]
# or text[2:5]

In [None]:
# "今日は天気が良いです。"[0:5]
# or text[0:5]

`0`番目は省略して`[:5]`とすることもできる。

In [None]:
"今日は天気が良いです。"[5:11]
# or text[5:11]

スライシングは`[start:end]`として書く。

(start)番目から<font color="red">(end-1)</font>番目が取り出される。

一番最後も省略することができ，`[5:]`と書くこともできる。

In [None]:
"今日は天気が良いです。"[1:11:2]
# or text[1:11:2]

In [None]:
"今日は天気が良いです。"[::2]
# or text[::2]

`[start:end:step]`と指定することで，stepの数飛ばしで文字を抽出することができる。

## 文字列のメソッド
* 型には属性名と呼ばれるものがある。
* `.属性名`でアクセスすることができる。
* 丸括弧`()`をつけて呼び出せるものがあり，これをメソッドという。
* 例えば，titleメソッドは最初の文字を大文字にする。
* upperメソッドはすべての文字を大文字にする。

In [None]:
# titleの使い方
name = "taro"
name.title()

In [None]:
# upperの使い方
name = "wakayama"
name.upper()

よく使うメソッド

|メソッド|作用|
|:-:|:-:|
|count|単語の出現回数を返す|
|index|単語の位置を返す，単語がなければエラー|
|find|単語の位置を返す，単語がなければエラー|
|strip|先頭及び末尾の空白を除去する|
|startswith|その単語で始まっていればTrue,そうでなければFalse|
|endswith|その単語で終わっていればTrue,そうでなければFalse|
|split|文字列をリストに分割する|
|join|リストを結合して文字列にする|

# リスト①

In [None]:
my_list = ["hello", 10, True, False, 11.5]

In [None]:
empyty_list = []

`角括弧([])`の中に`カンマ(,)`区切りで格納したいデータを書く。

数値や文字列などどんな型でもよい。

In [None]:
str_list = list("hello")

In [None]:
リストに文字列を渡すと，一文字ずつのリストが作成される。

In [None]:
foods = ["カレー", "チャーハン", "寿司", "牛丼"]

In [None]:
foods[1]

In [None]:
foods[::-1]

リストはシーケンス型であるので，スライシングやインデクシングができる。

リストの反転は`[::-1]`とすれば反転される。よく使うテクニックなので覚えておくとよい。

リストに良く用いる関数

|関数名|概要|使い方|
|:-:|:-:|:-:|
|len|長さを返す|len([1,2,3,4,5])|
|max|最大の要素を返す|max([1,2,3,4,5])|
|min|最小の要素を返す|min([1,2,3,4,5])|
|sum|合計を返す|sum([1,2,3,4,5])|
|sorted|ソートしたいリストを返す|sorted([1,2,3,4,5])|
|sorted|(逆順)引数にreverse=Trueを追加|sorted([1,2,3,4,5],reverse = Ture)|

# 条件分岐 if文①

if文の構文

```
if 条件式:
    処理
```

* 条件式の部分は，TrueもしくはFalseが入る。
* 処理の前には必ず4つのスペースを入れる。

In [None]:
your_name = "佐藤"
if your_name.startswith("佐藤"):
    print("あなたは佐藤さんです")

your_nameに`佐藤`を代入する

もし、あなたが`佐藤`さんならば、`あなたは佐藤さんです`と表示する。

条件を加える場合は，elifやelseを使う。

In [None]:
your_name = 
if your_name.startswith("佐藤"):
    print("あなたは佐藤さんです")
elif your_name.startswith("田中"):
    print("こんにちわ，田中さん")
else:
    print("知らない人です")

* 条件式にはTrue/Falseが入る。条件式のところに比較演算子でboolを得ることもできる。
* 比較演算子は表の通りである。

|演算子|意味|
|:-:|:-:|
|<|より小さい|
|<=|以下|
|>|より大きい|
|>=|以上|
|==|等しい|
|!=|等しくない|
|is|同一のオブジェクトである|
|is not|同一のオブジェクトでない|
|in|含む|

* 複数の条件の組み合わせによって条件式を成り立たせる書き方がある。

|演算子|意味|
|:-|:-|
|x or y|xとyのどちらかがTrueならば，True|
|x and y|xとyともにTrueならば，True|
|not x|xがFalseならば，True|

# for文①

データの集まりから順番にデータを取り出すのがfor文の考え方である。

for文の基本の書き方

```
for i in データの集まり:
    処理
```
処理の前はインデント(4つの半角スペース)を入れてブロックを作る

In [None]:
numbers = [1,2,3,4,5]
for i in numbers:
    print(i)

# リスト②

飛ばします。

# for文②

# 関数文
時間がないので飛ばします。が、最も重要な概念です。

最近はライブラリが豊富になって使う機会は減ってきましたが、それでも重要であり、プログラムを用いた処理や分析をしようと思う方は早く乗り越えてもらいたいところです。ここを乗り越えれば比較的早く使いこなせると思います。

# ライブラリ

* ライブラリには，標準ライブラリとサードパティライブラリがある。標準ライブラリでは解決しない問題を，サードパーティライブラリを使って問題に取り組むことができる。
* Pythonではサードパーティライブラリが豊富である。


よく用いるライブラリ
* pandas
* numpy
* matplotlib

# [実践]重心動揺計の解析

In [None]:
# 便利で必須のライブラリをインポートする
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 使う必要はないかもしれないが，一応入れておくライブラリ。
import os
import glob

必要なライブラリを使える状態にする。インポートする。

Anacodaをインストールすると、これら主要なライブラリは自動的に使える状態になる。


In [None]:
別途インストールすることもできる。
```
!pip install `インストールしたいパッケージ名`
!conda install `インストールしたいパッケージ名`
```

In [None]:
os.getcwd()

解析に直接関係しないがよく使う

ディレクトリの確認

In [None]:
os.listdir()

解析に直接関係しないがよく使うテクニック

current directoryのファイル(解析に使うファイルがあるかどうか。)

In [None]:
df = pd.read_csv('20180302_8.csv',header=None,encoding="shift-JIS")

データを読み込む

In [None]:
df.head(10)

読み込まれているか確認する

In [None]:
dat0 = df.iloc[7:,:3]

データ範囲の抽出

In [None]:
dat1 = dat0.values.astype(np.float)

データのタイプの変更(計算できる状態にする)

In [None]:
fig = plt.figure(figsize=(5,5))
plt.plot(dat1[:,1],dat1[:,2],c="r")
plt.xlim(-1.6,0.4)
plt.ylim(-6.2,-4.2)
plt.grid()

重心動揺波形の表示

## ホワイトノイズ

* 様々な計測を行う上でノイズは必ず含まれ，その処理が重要となる。
* ノイズの除去（スムージング）の方法は様々である。
* その中でも，移動平均，FFT(高速フーリエ変換)がよく使われる。
* 計測機器に付随するソフトでもノイズ除去を行うが，何を使っているか不明なものもある。
* Pythonでは強力なnumpy，scipyに上記計算処理メソッドがすでに用意されている(フリーで)。

In [None]:
# フィルタリング１（ガウジアンフィルタ）
p = stats.norm.pdf(np.arange(-1, 1+10/window, 10/window))
kernel = p / sum(p)
datgaus = np.convolve(dat[:,1],kernel,mode="same")

# フィルタリング2（移動平均）
window = 60
w = np.ones(window)/window
datmean = np.convolve(dat[:,1], w, mode='same')

フィルタリングするためのコードも短い。

In [None]:
# ライブラリのインポート
from scipy.ndimage import gaussian_filter1d

def Gausianshow(dat):
    time_vec = np.arange(0,dat[:,1].size*0.01,0.01)
    sigdatax = gaussian_filter1d(dat[:,1],sigma=6)
    sigdatay = gaussian_filter1d(dat[:,2],sigma=6)

    fig = plt.figure(figsize=(20,5))
    ax1 = fig.add_subplot(211)
    ax2 = fig.add_subplot(212)
    ax1.plot(time_vec,dat[:,1],c="gray")
    ax1.plot(time_vec,sigdatax,c="red",alpha=0.5)
    ax2.plot(time_vec,dat[:,2],c="gray")
    ax2.plot(time_vec,sigdatay,c="red",alpha=0.5)

    fig = plt.figure(figsize=(10,5))
    ax3 = fig.add_subplot(121)
    ax4 = fig.add_subplot(122)
    ax3.plot(dat[:,1],dat[:,2],c="gray")
    ax4.plot(sigdatax,sigdatay,c="red",alpha=0.5)
    ax3.set_xlim(-1.6,0.4)
    ax3.set_ylim(-6.2,-4.2)
    ax3.grid()
    ax4.set_xlim(-1.6,0.4)
    ax4.set_ylim(-6.2,-4.2)
    ax4.grid()

In [None]:
Gausianshow(dat1)

In [None]:
from scipy import fftpack

In [None]:
# FFTを用いたフィルタリング

def NewFFT(data,cutoff_hz,samplingdist = 0.01):
    time_vec = np.arange(0, data.size*samplingdist, samplingdist)
    samp_freq = fftpack.fftfreq(data.size, d = samplingdist)
    sig_fft = fftpack.fft(data)
    pidxs = np.where(samp_freq>0)
    freqs = samp_freq[pidxs]
    power = np.abs(sig_fft)[pidxs]
    kc = int( np.round( cutoff_hz * data.size *samplingdist ) )
    freq = freqs[kc]

    sig_fft[np.abs(samp_freq)>freq]=0

    main_sig = fftpack.ifft(sig_fft).real
    
    return time_vec,main_sig


In [None]:
def FFTshow(dat):
    time_vec,sigdatax = NewFFT(dat[:,1],5)
    time_vec,sigdatay = NewFFT(dat[:,2],5)

    fig = plt.figure(figsize=(20,5))
    ax1 = fig.add_subplot(211)
    ax2 = fig.add_subplot(212)
    ax1.plot(time_vec,dat[:,1],c="gray")
    ax1.plot(time_vec,sigdatax,c="red",alpha=0.5)
    ax2.plot(time_vec,dat[:,2],c="gray")
    ax2.plot(time_vec,sigdatay,c="red",alpha=0.5)

    fig = plt.figure(figsize=(10,5))
    ax3 = fig.add_subplot(121)
    ax4 = fig.add_subplot(122)
    ax3.plot(dat[:,1],dat[:,2],c="gray")
    ax4.plot(sigdatax,sigdatay,c="red",alpha=0.5)
    ax3.set_xlim(-1.6,0.4)
    ax3.set_ylim(-6.2,-4.2)
    ax3.grid()
    ax4.set_xlim(-1.6,0.4)
    ax4.set_ylim(-6.2,-4.2)
    ax4.grid()

In [None]:
# FFTによるフィルタリング
FFTshow(dat)

# 筋電図の解析

In [None]:
## libraryのインポート
import numpy as np
import matplotlib.pyplot as plt
from scipy import signal

In [None]:
## データの抽出のための関数の定義
def dataset(dat,start=0):
    a = dat[start:]
    b = a.size
    return a[:2**np.log2(b).astype(np.int)]

In [None]:
## データの読み込み
with open("RTmemdata_TSND151-AP09181552_2020-02-28_112636.348.csv","r") as d:
    dat = d.readlines()
    
## データの読み込み
myd = [i.replace("\n","").split(",")[1:] for i in dat if i[0]=="e"]

## 型の再定義
df = np.array(myd).astype(np.int)[:,:3]

## データの抽出
df2 = dataset(df[:,1],3000)
df3 = dataset(df[:,2],3000)

In [None]:
## 短時間フーリエ変換(short-term Fourier transform)
sig = df2
f,t,Zxx = signal.stft(sig,fs=1000,nperseg = 2**15)

In [None]:
## 作図
ffrange = np.argwhere((f>=20)&(f<=250))[:,0]
fig = plt.figure(figsize=(10,5))
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)
time = np.arange(0, sig.size*1/1000, 1/1000)
ax1.pcolormesh(t,f[ffrange],np.abs(Zxx)[ffrange],vmin=0,vmax=50,cmap="magma",shading="gouraud")
ax2.plot(time,sig)

# まとめ

* デジタル化の促進に合わせたデータ計測・解析手法の導入
* データ管理手法の変化
* 固定観念に捉われない発想

Pythonのことをもっと知りたい方
* Anacondaのインストール$\rightarrow$Pythonの動作環境を構築する
* キーワードをPython・・・，としてググる$\rightarrow$欲しい情報はかなり高い確率でヒットする