# 関数とモジュール

## セクション1: 関数
Pythonでは`def`を使って関数を定義できます。
関数によって、コードの再利用を簡単にできるようになります。  
また、決まったまとめることで、コード全体の処理の見通しが良くなります。

### 関数の定義と呼び出し

関数は以下のような構造で構成されています。

引数ごとの型とdocstringは処理に影響を与えないので必須ではありません。
ただし、書くことでその関数がどういう意図で作られたかを記載でき、コードを見返したときや別の人がコードの処理を確認するタイミングでの可読性が向上します。

```python
def 関数名(引数1: 引数1の型, 引数2: 引数2):
    """
    関数についての説明(docstring)
    """

    # 関数の処理
    ... 

    # 処理結果の返却
    return output
```


In [1]:
# 関数の定義
def greet(name):
    """
    指定した名前に挨拶を返す関数

    Parameters
    ----------
    name: str
        挨拶をする相手の名前
    """

    # 挨拶文の作成
    # 文字列は + で結合できる
    greeting_text = "Hello, " + name + "!"

    return greeting_text

# 関数を呼び出す
print(greet("Alice"))
print(greet("Bob"))
print(greet("Charlie"))

Hello, Alice!
Hello, Bob!
Hello, Charlie!


このように、関数を利用することで一定の処理をまとめることができます。

関数はいくつかの引数を受け取ることもできます。  
例として、`greet`関数の挨拶文も変更できるようにします。

関数実行時に引数名を指定しない場合、自動的に1番目の引数から代入されていきます。  
明示的に引数を指定して代入することもでき、特に引数が複数ある場合に便利です。


In [2]:
# 関数の定義
def custom_greet(greeting, name):
    """
    指定した名前に挨拶を返す関数

    Parameters
    ----------
    greeting: str
        挨拶文
    name: str
        挨拶をする相手の名前
    """

    # 挨拶文の作成
    # 文字列は + で結合できる
    greeting_text = greeting + ", " + name + "!"

    return greeting_text

# 関数を呼び出す
print(custom_greet("Hello", "Alice"))

# 明示的に引数を指定して代入
print(custom_greet(name="Bob", greeting="Good morning"))

Hello, Alice!
Good morning, Bob!


### デフォルト引数
関数の引数にはデフォルトの値を設定することができます。  
今詳しくは言及しないですが、副作用があるので配列や辞書などデータを格納する構造をデフォルト引数に設定するのはやめましょう。

デフォルト値を持つ引数は、デフォルト値を持たない引数の後に定義する必要があります。

In [3]:
# 関数の定義
def custom_greet(greeting, name="there"):
    """
    指定した名前に挨拶を返す関数

    Parameters
    ----------
    greeting: str
        挨拶文
    name: str, default 'there'
        挨拶をする相手の名前
    """

    # 挨拶文の作成
    greeting_text = greeting + ", " + name + "!"
    return greeting_text

# 名前を指定せずに呼び出す。
print(custom_greet("Hello"))


Hello, there!


### 可変長引数
引数の数を固定せず、任意の数の引数を渡すことができます。
二つの方法があります。

1. 引数名を指定せずに受け取る方法: `*`で定義
2. 引数名ともに受け取る方法: `**`で定義

一つ目のように引数名を指定しない引数を位置引数、引数名を指定する引数をキーワード引数と呼びます。

In [4]:
# 与えられた名前の人たちに挨拶をする
def greet_all(*names):
    """
    指定した挨拶を与えられた名前の全員に行う

    Parameters
    ----------
    names: str
        挨拶をする人の名前
    """

    for name in names:
        print("Hello, " + name + "!")

greet_all("Alice", "Bob", "Charlie")

Hello, Alice!
Hello, Bob!
Hello, Charlie!


位置可変長引数はタプル、キーワード可変長引数は辞書で引数に渡されています。  
それをPythonに組み込まれている`type`関数を利用して確認します。

In [5]:
def check_type(*args, **kwargs):
    """
    可変長引数の型を確認する.
    """

    print("*argsの型: ", type(args))
    print("*argsの値: ", args)
    print("**kwargsの型: ", type(kwargs))
    print("**kwargsの値: ", kwargs)

check_type("arg1", "arg2", kwarg1="kwarg1", kwarg2="kwarg2")

*argsの型:  <class 'tuple'>
*argsの値:  ('arg1', 'arg2')
**kwargsの型:  <class 'dict'>
**kwargsの値:  {'kwarg1': 'kwarg1', 'kwarg2': 'kwarg2'}


### 関数の戻り値について
関数は複数の値を返却することができます。  
一応リストやタプル、辞書などを利用して、一つの戻り値として代替することはできます。

複数の戻り値がある場合、戻り値はタプルとして返却されます。  
代入時にそれぞれの値の変数を宣言することで、戻り値をそれぞれ変数にダイレクトに代入できます。


例として、二つの数字を入力として受け取り、四則演算結果を返却する関数を実装します。  

In [6]:
def basic_calculations(num1, num2):
    """
    与えられた二つの数字をもとに、四則演算の結果を返却する.
    """

    sum_result = num1 + num2
    diff_result = num1 - num2
    product_result = num1 * num2

    # 0で割れない
    if num2 == 0:
        quotient_result = None
    else:
        quotient_result = num1 / num2

    return sum_result, diff_result, product_result, quotient_result

# 2と４の四則演算結果
print(basic_calculations(2, 4))

# それぞれの変数に直接代入することができる。
sum_result, diff_result, product_result, quotient_result = basic_calculations(2, 4)
print("和: ", sum_result)
print("差: ", diff_result)
print("積: ", product_result)
print("商: ", quotient_result)

(6, -2, 8, 0.5)
和:  6
差:  -2
積:  8
商:  0.5


### docstring
情報をドキュメントとして残すことができます。  
処理に影響は与えないですが、コードの可読性の向上やコード開発時の参照などいくつかの利点があります。

いくつかの決まったフォーマットがあり、GoogleスタイルとNumpyスタイルへのドキュメントを記載しておきます。

- Google: https://google.github.io/styleguide/pyguide.html
- Numpy: https://numpydoc.readthedocs.io/en/latest/format.html

## セクション2: モジュールとパッケージ

### モジュールの理解
Pythonでは関連する関数や変数、クラスなどを一つにまとめて管理することができます。  
これをモジュールといい、これによって同じ処理を複数のプログラムで利用できます。

モジュールには大きく分けてPython標準のモジュールとサードパーティのモジュールが存在します。
標準のモジュールとしてよく使うのは

- `datetime`: 日時の計算のためのモジュール
- `os`: ファイルシステムを操作するためのモジュール

などがあり、データ分析や機械学習の文脈としては以下のサードパーティ製のモジュールが一般的に使われています。

- `numpy`: 高度な数学計算のためのモジュール
- `pandas`: 表計算のためのモジュール
- `matplotlib`: グラフ描画のためのモジュール
- `scikit-learn`: 機械学習に関する基本的な機能を網羅したモジュール

### モジュールの利用
モジュールを利用するには、`import`ステートメントを使ってPythonスクリプトに取り込む必要があります。  
また`from`を利用してモジュールの中でも一部だけ取り組むこともできます。

#### モジュール内の機能へのアクセス
モジュールにはさまざまな関数や変数、クラスが含まれています。一般的なモジュールは以下のような階層構造をしています。
```
mymodule
┣━ pkg1
┃  ┣━ func1.py
┃  ┃  ┗━ greet
┃  ┗━ func2.py
┃     ┣━ add
┃     ┗━ diff
┗━ pkg2
   ┗━ func3.py
       ┣━ read_text
       ┗━ write_text
```
パッケージに含まれる機能を利用するには、その機能がどこにあるかを把握する必要があります。  
Pythonではこの階層構造を辿るためにドット（.）記法を使用します。  

この記法は、モジュール名やオブジェクト名の後にドットを置き、続けて属性名やメソッド名を記述することで、その属性やメソッドを参照します。

例えば、`greet`関数にアクセスするためには以下のようにアクセスします。

```python
# パターン1
import mymodule
mymodule.pkg1.func1.greet()

# パターン2
from mymodule.pkg1 import func1
func1.greet()
```

#### `datetime`モジュールを利用した日付の計算
例として、datetimeモジュールを取り込み、日付に関する機能を利用します。

datetimeモジュールでは、今日の日付や今の時間を取得するための関数があります。
- 今日の日付: `datetime.date.today()`
- 今の時間: `datetime.datetime.now()`

In [7]:
# datetimeのimport
import datetime

# 今日の日付
today = datetime.date.today()

# 今の時間
now = datetime.datetime.now()

print("今日の日付は, ", today)
print("今の時間は, ", now)

今日の日付は,  2024-06-09
今の時間は,  2024-06-09 18:02:59.040012


また日付についての演算をすることができます。  
日付の演算には`datetime.timedelta`を利用します。

In [8]:
# 日時計算のための機能のみ追加で取り込む
from datetime import timedelta

# 基準の日を定義
base_date = datetime.date(2024, 11, 1)

# 30日前の計算
print(base_date, "の30日前の日付は,", base_date - timedelta(days=30))

2024-11-01 の30日前の日付は, 2024-10-02


このようにモジュールを利用して、特定の領域において便利な機能を利用することができます。

### モジュールの作成

Pythonでモジュールを作成するのは非常にシンプルで`.py`ファイル作成するだけでそのままimportすることができます。  
`import`を実行する際に取り込む範囲は`sys`モジュールで確認することができます。

TODO
- `__init__.py`の挙動
- パッケージのビルド


サンプルとして、greet関数を`src/mymodule/greet.py`に定義しました。  
この関数を利用してみます。

In [9]:
# srcディレクトリが検索対象にない場合に追加
import os
import sys

module_path = os.path.abspath("../src") 
if module_path not in sys.path:
    sys.path.append(module_path)

In [10]:
# importするときには`.py`は省く
# ここのgreetはgreet関数ではなく、greet.pyのgreet
from mymodule import greet

# greet.pyの中のgreet()にアクセスする
print(greet.greet("Alice"))

Hello, Alice!


## セクション3: オーソドックスなサードパーティパッケージ紹介

### データ分析
1. NumPy
    - 概要: NumPyは、数値計算を効率的に行うための基本的なパッケージで、主に配列や行列の計算に使用されます。高性能な多次元配列オブジェクトとこれを操作するためのツールを提供します。
    - 基本的な使用例: 配列の作成、配列を用いた算術計算、統計計算の実行など。
2. pandas
    - 概要: pandasはデータ分析と操作のための強力なライブラリで、特に表形式のデータや異なるデータ型を含む時間系列データの操作に適しています。
    - 基本的な使用例: CSVファイルの読み込み、データの絞り込みや集計、データのクリーニングと前処理。
3. Matplotlib
    - 概要: Matplotlibは、Pythonでデータをグラフィカルに可視化するためのライブラリです。静的、アニメーション、インタラクティブな可視化をサポートします。
    - 基本的な使用例: 各種グラフの作成（折れ線グラフ、棒グラフ、散布図など）。
4. scikit-learn
    - 概要: scikit-learnは機械学習のためのライブラリで、分類、回帰、クラスタリングなど、多くの機械学習アルゴリズムを簡単に利用できます。
    - 基本的な使用例: データの正規化、機械学習モデルの訓練と評価、予測の実行。
5. Seaborn
    - 概要: SeabornはMatplotlibに基づいており、統計的データ可視化をより簡単かつ美しく行うことができます。主にデータセットのトレンドを視覚的に表現するのに適しています。
    - 基本的な使用例: ヒートマップ、時間系列データの可視化、分布の可視化。

### Web操作
1. requests
2. BeautifulSoup4
3. Selenium