# 研究用Pythonコーディング規約

- Feb 2024
- Simon H. Kuwahara

---

## 目的

この文書は、ラボのPythonコーディング規約を定義するものである。この規約は、ラボのPythonプロジェクトにおいて、あくまでもプロエンジニアではなくアマチュアが使う前提で

- システムを破壊しないための順守事項を定める
- コードの品質を担保し、可読性と保守性を向上させる
- いつ、だれ、なんのプロジェクト、を明確にする

---

## 環境

- Python 3 (目安は最新の一個前のバージョン)
- Windows 11
- VSCode
  - Python/Jupyter公式拡張機能
  - GitHub Copilot
  - Black Formatter
  - Data Wrangler
  - Rainbow CSV
  - Markdown All in One
  - 他はお好みで

---

## ドキュメント、ワークフロー、ツール

### REDMEを必ず書くこと

**人のコードは自分のコード**：なんだこのくそコードは？と思ったら、1ヶ月前に書いた自分のコードだった、というあるある。

自分のコードですら読めないのに、他人のコードなんざなおさら読めたものではないので、他人のことを考えたドキュメント作成やコーディングを心がけること。

READMEは:

- ファイル名は`README.md`または`README`
- プロジェクトフォルダーのルードディレクトリに配置する
- markdown形式で記述する
- 全く関係のない第三者が説明なしで研究を完璧に再現できるように必要な情報を全て記述する

### 冒頭コメント

あんまり書きすぎると面倒、、、というのもあるが、それ以前にうちのラボではコードをファイル１枚で扱うような使い方をしているから冒頭コメントが必要になる。

大前提として、単一のファイルではなく、レポジトリ単位で扱うこと。レポジトリ単位で扱えばいちいち全てのファイルに詳細を書かなくてもREADMEに情報を集約できる。

ファイルの冒頭コメントには以下を記述するのが良いのではないかと思う。

- Pythonバージョン
- OS
- 日付
- 作成者
- プロジェクト名
- その他必要な情報

例

In [None]:
# Python 11.0.1
# Windows 11 22H2
# Feb. 1, 2024
# Jane Doe
# 〇〇社共同プロジェクト

### スパゲッティノートブックは禁ずる

仕事場は綺麗にしておくこと。

ジュピターノートブックは作業が終わったら必ず綺麗に掃除して残すか消せ。

後で使うかもしれないと思って残しておくと、あっという間にゴミ集積場ができる。

プロジェクト内に解読不能なゴミは残すな。絶対にだ。


### Office使用禁止

原則としてWordとExcelは禁ずる。研究で使う場面はほとんどないくせにプログラミングとの相性が最悪すぎる。

- Word: 90%のことはマークダウンが適切。マークダウンで書けないなら大抵複雑過ぎる。
  - メモやドキュメント目的：**マークダウン**を使うこと。
  - 論文や複雑な文書目的：LaTeXを使うこと。**Overleaf**を使うとめちゃ簡単。
- Excel: Excelファイルはデータ処理を再現できないのとコードで処理しづらいので避けること。
  - データ目的：**csv**, txt, tsv, json, xmlなどを使うこと
  - みんなで共有したいテーブル：**Googleスプレッドシート**を使ってリンクをドキュメントに貼ること

### Windows設定

以下のWindowsレジストリを変更しておくこと。レジストリをいじる時は無関係なものを触らないように注意すること。

#### パスの最大長を260文字から32767文字に変更する。

- registry: `Computer\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem\LongPathsEnabled (Type: REG_DWORD)`
- 設定値をこの値に変更すること: 1

#### 管理者権限の実行にパスワード入力を要求する。

- registry: `HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Policies\System\ConsentPromptBehaviorAdmin`
- 設定値をこの値に変更すること: 1

#### パワーシェル実行ポリシーを変更する

実行ポリシーが`Restricted`になっているとPowerShellスクリプトでエラーを吐く。
その場合は`Set-ExecutionPolicy`コマンドで実行ポリシーを変更する必要がある。

- [Microsoft公式](https://learn.microsoft.com/ja-jp/powershell/module/microsoft.powershell.core/about/about_execution_policies?view=powershell-7.4)
- [参考ブログ](https://qiita.com/kikuchi/items/59f219eae2a172880ba6)

```powershell
# PowerShell
Set-ExecutionPolicy RemoteSigned
```

### Python環境

`./python_environments.md`を参照すること。

仮想環境を作ったほうが良いのは事実ではある。

でも個人的意見としてはコンフリクトが起きないような簡単な環境なら、仮想環境を使わなくても直接pipでインストールしても良いのではないかと思う。

### blackのフォーマットチェックに合格すること

原則として**PEP8に従うこと**。PEP8に違反するコードは急速にコードベースを汚染するので、正当な理由なくPEP8を逸脱することは認めない。

そこで`black`は、Pythonのコードフォーマッタが便利。

設定をしておけば保存時に自動でPEP8に適合しているかチェックして自動修正してくれるので、コードを書く際には気にすることなく書ける。そして、フォーマットチェック引っかかったら修正すれば良い。

よって、`black`の導入は義務とし、フォーマットチェックを通過しないコードは研究で使用することを禁ずる。

vscodeの場合、Black Formatterエクステンションをインストールし、プロジェクトディレクトリ下の`.vscode/settings.json`に以下を追加することで、自動フォーマットが可能となる。このレポジトリの`.vscode/settings.json`を参照されたし。

```json
{
    "python.formatting.provider": "black"
}
```

他のエディタを使用する場合は、`pip install black`で`black`をインストールし、powershellから以下のコマンドでフォーマットを実行する。

```powershell
# PowerShell
black your_file.py
```

---

## PEP8

全部覚えるのは無理なので、特に知っておくと良いと思われるPEP8のルールを以下に列挙する。

基本的には`black`のフォーマットチェックに引っかかったら調べて直すで良いと思う。

### 命名規則

| object | naming | example |
| --- | --- | --- |
| 変数 | snake_case | `my_variable` |
| 変数（定数） | ALL_CAPS | `MY_CONSTANT` |
| 関数 | snake_case | `my_function` |
| クラス | CapWords | `MyClass` |
| ファイル名 | snake_case | `my_file.py` |



---

## デザインパターン、アンチパターン

### 環境変数は原則変更しないこと

離れたフォルダーにあるPythonファイルを`import`するときに、`sys.path.append`を使いたくなるかもしれないが、それはやめること。

**ミスると環境が壊れるから。**

どうしても環境変数を変更したい場合は、必ずコンテキストマネージャを使うこと。

例

In [3]:
from func import helper_functions
dir(helper_functions)

['AddPath',
 'HelperFunctions',
 'JumpDir',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'json',
 'os',
 're',
 'sys',

In [None]:
lib_path = os.path.join('path', 'to', 'lib')
with helper_functions.AddPath(lib_path):
	module = __import__('my_module')

### ファイル区切り文字は`os.path.join`を使うこと

ファイル区切り文字はUNIX系OSとWindowsで異なるため、`/`や`\`を使うと環境に依存するコードになる。

ファイル区切り文字は`os.path.join`を使うこと。

例

In [None]:
import os

# 以下のようにパスを組み立てる
file_pass = os.path.join("scripts", "example_files", "hoge.txt")

# 以下のように具体的にパスを書くのはダメ
file_pass = "scripts\example_files\hoge.txt" # Linux/Macでは動かない
file_pass = "scripts/example-files/hoge.txt" # Windowsでは動かない

### 絶対パスは原則使わないこと

絶対パスは、環境に依存するため、原則使わないこと。

相対パスを使うこと。

Pythonファイルのあるフォルダーを知るには

In [None]:
import os

# Pythonファイルのみ、jupyter notebookの場合は動かない
script_dir = os.path.dirname(__file__)
print(script_dir)


ジュピターノートブックの場合はカレントディレクトリしかわからないので、`cd`(change directory)は原則使わないこと。

どうしてもカレントディレクトリを変更したい場合は、コンテキストマネージャを使うなど、`cd`に失敗した場合のエラーハンドリングを行うこと。

カレントディレクトリを取得するには

In [8]:
import os
cur_dir = os.getcwd()
print(cur_dir)

/home/bluqueen/Dropbox (Danlab)/personal/Development/python-beginner-jp


### 終了しないループを書かないこと

可能な限り`for`を使い、不必要に`while`を使わないこと。

特に`while True:`を使うことは禁ずる。必ずフラグを設定し、フラグを立てたらループを抜けるようにすること。

例

In [None]:
condition = False
exit_loop = False # ループ脱出フラグ
while not exit_loop:

    # conditionが変わる処理

    # 何かしらループ脱出の条件
    if condition:
        exit_loop = True

### べた書きせずにクラスに入れること

`import`と定数定義以外は原則としてプログラムをべた書きしないこと

- 関数を使う
- クラスに入れる
- エントリーポイント`if __name__ == "__main__"`の中に入れる

この理由は、スコープを限定して変数の衝突を防ぐためである。

In [None]:
from . import hoge

class Fuga:
	def __init__(self):
		self.hoge = hoge.Hoge()

	def main(self):
		# 何かしらの処理
		pass

# エントリーポイント
if __name__ == "__main__":
	fuga = Fuga()
	fuga.main()

### マジックナンバーを使わないこと

### インデントを深くしないこと

In [None]:
# インデントが深くなる
for i in range(10):
	if i == 5:
		# 何かしらの処理
		# 何かしらの処理
		# 何かしらの処理

# if escapeでインデントを減らす
for i in range(10):
	if i != 5:
		break
	# 何かしらの処理
	# 何かしらの処理
	# 何かしらの処理

### キーワードを深く知る

In [9]:
# singleton false vs falsity
if not []:
   print("this will be printed")
if [] is False:
   print("this won't")

this will be printed


### その他

上記以外のことについては一般常識で判断すること。ソフトウェア開発の現場ではないので、あまり厳密にコーディング規約を定めない。

- テストコードは必要か？

ほぼ不要。しょせん研究現場なので。どうしてもよく使う複雑な関数だったりするならあっても良いが、そんなに大事ならきちんとPythonパッケージにすべき。

- 多重継承？

わざわざルールは設けないが、普通に考えて明らかなアンチパターンは避けること。経験値がものを言ったりもするのでわからなかったら強い人に聞くこと。

- 変数の命名？

わかりやすい名前をつけるのは結構難しい。PEP8に従うこと以外は特にルールは設けない。一貫性があってわかりやすい名前をつけること。現在のツールは変数名を変えるときに自動で変えてくれるので、変数名を変えることに抵抗を持たないこと。自動入力機能が豊富なので、わかりやすいなら長い変数名をつけることに抵抗を持たないこと。