# Pythonについて

## Pyhtonを学ぶメリット

- インタプリタ型言語で初心者が学習しやすい言語です。一方、高度で複雑なプログラミングも可能です。
- 数値計算の外部ライブラリ（Numpyなど）、グラフ出力の外部ライブラリ（matplotlibなど）や、データ処理・機械学習の外部ライブラリ（pandas、sklearnなど）が多くの人により開発・公開されています。
- 近年、AIや機械学習を目的としてプログラミング言語を学習する人が増えていますが、数学系やデータ分析系のライブラリが豊富に存在しているPythonが選択されることが多く、利用者を増やしています。プログラミング言語の人気ランキングでもPythonは上位に位置しています。


## 主なデータ型（整数、小数、文字列、bool、日付）
### 整数

C言語やJavaのint型には桁数の制限がありますが、桁数に制限がありません。


- 例１

In [1]:
# コメントを記述する場合、「#」を記述します

# 数値の0を表示
print(0)

# 2の16乗を計算して表示（「**」はべき乗を計算する演算子です）
n = 2 ** 16
print(n)

# 2の200乗を計算して表示
n = 2 ** 200
print(n)

0
65536
1606938044258990275541962092341162602522202993782792835301376


### 小数

C言語のdouble型（倍精度浮動小数点数）に相当します。

- 例１

In [2]:
print(3.14)

3.14


- 例２

In [3]:
# 1を3で割った値
print(1 / 3)

0.3333333333333333


### 文字列

シングルクォート（'）かダブルクォート（"）の間に文字を入力します。


- 例１

In [4]:
print("abc")
print('xyz')

abc
xyz


- 例２

数値と文字列は扱い方が異なります。
「1+2」は数値の加算を意味し、「'1' + '2'」は文字列の連結を表します。

In [5]:
# 数値の加算と文字列の連結
print(1 + 2)
print('1' + '2')

3
12


### bool

TrueまたはFlaseで表します


- 例１

In [6]:
# 論理型
print(True)
print(False)
print(1 == 0)
print(0 == 0)

True
False
False
True


### 日付

Pythonで日付を利用する際は、標準ライブラリ「datetime」をインポートします。

- 例１

In [7]:
# 現在日時を表示する

import datetime
print(datetime.datetime.now())

2022-03-01 17:46:48.928319


- 例２

In [8]:
# 年月日を指定して日付を作成する

print(datetime.date(2021, 2, 14))

2021-02-14


- 例３

In [9]:
# 年月日時分秒を指定して日時を作成する

print(datetime.datetime(2022, 5, 31, 18, 55, 30))

2022-05-31 18:55:30


## 変数

繰り返し使用したり、後で使いたい数値や文字列などを格納する場合に変数を使用します。
標準ライブラリのtype関数を使うとオブジェクトの型を確認できます。

- 例１

In [10]:
# 数値を格納した変数
n = 100
print(n, type(n))

# 文字列を格納した変数
s = '100'
print(s, type(s))

100 <class 'int'>
100 <class 'str'>


## 主な演算子（算術演算子（四則演算など）、比較演算子、論理演算子）

### 算術演算子

|演算子|例|説明|
|-|-|-|
|\+|a + b|足し算|
|\-|a - b|引き算|
|\*|a * b|掛け算|
|\*\*|a ** n|aをn回掛けた数（べき乗）|
|\/|a / b|割り算|
|\/\/|a // b|aをbで割った商の整数値|
|\%|a % b|aをbで割った時の割り切れなかった余り|

### 比較演算子

|演算子|例|説明|
|-|-|-|
|\<|a < b|左の値が右の値より小さい時に、真|
|\>|a > b|左の値が右の値より大きい時に、真|
|\<=|a <= b|左の値が右の値以下の時に、真|
|\>=|a >= b|左の値が右の値以上の時に、真|
|\=\=|a == b|2つの値がイコールの時に、真|
|\!\=|a != b|2つの値がイコールでない時に、真|

### 論理演算子

|演算子|例|説明|
|-|-|-|
|and|a and b|aとbを両方満たす時に、真|
|or|a or b|aまたはbを満たす時に、真|
|not|not a|aを満たさない時に、真|

- 例１

In [11]:
# 算術演算子の使用例

# 足し算
print("1+2は？",1 + 2)
# 2の16乗
print("2の16乗は？",2 ** 16)

# 比較演算子の使用例
a = 100
b = 200
print("aはbより小さい？", a < b)
print("aはbに等しい？",a == b)
print("aはbより大きい？",a > b)

# 論理演算子の使用例
print("aは100 または bは100？", a == 100 or b == 100)
print("aは100 かつ bは100？", a == 100 and b == 100)

1+2は？ 3
2の16乗は？ 65536
aはbより小さい？ True
aはbに等しい？ False
aはbより大きい？ False
aは100 または bは100？ True
aは100 かつ bは100？ False


## データ構造（リスト、スライス、辞書）

以下のデータを例に説明します。
- 札幌市の区名と人口（令和2年9月）

|区名|人口|
|-|-|
|中央区|247434|
|北区|288226|
|東区|264664|
|白石区|212795|
|厚別区|125122|
|豊平区|224422|
|清田区|113555|
|南区|136417|
|西区|219023|
|手稲区|141774|



### リスト

リストとは複数のデータを一括で扱うための仕組みです。



- 例１

In [12]:
# 要素を指定したリスト（札幌市の区名）を作成する例
sapporo_areas = ["中央区", "北区", "東区", "白石区",
                 "厚別区", "豊平区", "清田区",
                 "南区", "西区", "手稲区"]
print(sapporo_areas)

['中央区', '北区', '東区', '白石区', '厚別区', '豊平区', '清田区', '南区', '西区', '手稲区']


- 例２

In [13]:
# 遠し番号を生成するrange関数と組み合わせてリストを作成する例
nums = list(range(10))
print(nums)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


- 例３

In [14]:
# インデックスを指定してリストの要素にアクセスできます。
# リストのインデックスは0から始まります
print(sapporo_areas[0])
print(sapporo_areas[1])
print(sapporo_areas[2])

中央区
北区
東区


### スライス

スライスは、リストの一部を取り出すことです。
リストの添え字に「開始位置:終了位置」を指定すると、リストの一部を取り出すことができます。
開始位置は0から始まります。
<span style="color: red; ">終了位置の要素は含まれません。</span>

- 例１

In [15]:
# 先頭から３番目までの要素を取り出します。
print(sapporo_areas[0:3])

['中央区', '北区', '東区']


- 例２

In [16]:
# 開始位置を省略すると先頭から取り出します。
print(sapporo_areas[:5])

['中央区', '北区', '東区', '白石区', '厚別区']


- 例３

In [17]:
# 終了位置を省略すると最後まで取り出します。
print(sapporo_areas[5:])

['豊平区', '清田区', '南区', '西区', '手稲区']


### 辞書

辞書は、キーと値のペアでデータを管理する仕組みです。

- 例１

In [18]:
# 札幌市の区名と人口
sapporo_area_populations = {"中央区":247434, "北区":288226, "東区":264664, "白石区":212795,
                            "厚別区":125122, "豊平区":224422, "清田区":113555,
                            "南区":136417, "西区":219023, "手稲区":141774}
print(sapporo_area_populations)

{'中央区': 247434, '北区': 288226, '東区': 264664, '白石区': 212795, '厚別区': 125122, '豊平区': 224422, '清田区': 113555, '南区': 136417, '西区': 219023, '手稲区': 141774}


- 例２

In [19]:
# 区名を指定して人口にアクセスできます。
print(sapporo_area_populations["中央区"])
print(sapporo_area_populations["豊平区"])
print(sapporo_area_populations["手稲区"])

247434
224422
141774


- 例３

In [20]:
# 存在しない区名は指定できません
print(sapporo_area_populations["新宿区"])

KeyError: '新宿区'

## 制御構造

### ブロック

Pythonでは制御構文のブロックは、インデント（字下げ）で決まります。
C言語やJavaでは「｛」から「｝」までがブロックと認識されますが、Pythonでは同じ字下げをブロックとして認識します。

<pre>
// Javaの例
int n = 100;
if ((n % 2) == 0) {
    System.out.println("偶数です");
    System.out.println("奇数ではない");
} else {
    System.out.println("奇数です");
    System.out.println("偶数ではない");
}
</pre>

<pre>
# Pythonの例
n = 100
if (n % 2) == 0:
    print("偶数です")
    print("奇数ではない")
else:
    print("奇数です")
    print("偶数ではない")
</pre>



- 例１

In [21]:
# インデント（字下げ）が揃っていないとエラーになります

n = 100
if (n % 2) == 0:
    print("偶数です")
     print("奇数ではない")
else:
    print("奇数です")
    print("偶数ではない")

IndentationError: unexpected indent (1696981422.py, line 6)

### for文

for文は一定の回数分（リストの要素数分、１０回など）繰り返す構文です。

- 例１

In [22]:
# リストの要素を全て表示
for area_name in sapporo_areas:
    print(area_name)   

中央区
北区
東区
白石区
厚別区
豊平区
清田区
南区
西区
手稲区


- 例２

In [23]:
# リストの要素を５番目まで表示
for n in range(5):
    print(sapporo_areas[n])   

中央区
北区
東区
白石区
厚別区


### if文

if文は、条件が成立する場合（または成立しない場合）にブロックを実行する構文です。


- 例１

In [24]:
# 人口20万人未満の区名と人口を表示します
# 辞書をfor文に指定すると、キーが取得できます

for area in sapporo_area_populations:
    if (sapporo_area_populations[area] < 200000):
        print(area, sapporo_area_populations[area])

厚別区 125122
清田区 113555
南区 136417
手稲区 141774


- 例２

In [25]:
# 中央区の人口を表示します。

for key in sapporo_area_populations:
    if (key == "中央区"):
        print(key, sapporo_area_populations[key])

中央区 247434


- 例３

In [26]:
# 中央区以外の人口を表示します。

for key in sapporo_area_populations:
    if (key != "中央区"):
        print(key, sapporo_area_populations[key])

北区 288226
東区 264664
白石区 212795
厚別区 125122
豊平区 224422
清田区 113555
南区 136417
西区 219023
手稲区 141774


- 例４

In [27]:
# 中央区または南区の人口を表示します。

for key in sapporo_area_populations:
    if (key == "中央区" or key == "南区"):
        print(key, sapporo_area_populations[key])

中央区 247434
南区 136417


- 例５

In [28]:
# もっとも人口の多い区を表示します。(ロジックで最大値を求める)

area_name = ""
area_populations = 0

for key in sapporo_area_populations:
    if area_populations < sapporo_area_populations[key]:
        # 人口が多かったら区名と人口を変数に代入
        area_name = key
        area_populations = sapporo_area_populations[key]

print(area_name, area_populations)

北区 288226


In [29]:
# もっとも人口の多い区を表示します。（辞書で最大値を求める）

max_key = max(sapporo_area_populations, key=sapporo_area_populations.get)
print(max_key, sapporo_area_populations[max_key])

北区 288226


### 演算子の優先順位

演算子には優先順位が定義されています。
- 算術演算は比較演算よりも優先
- 比較演算は論理演算よりも優先
- かっこ「()」で囲むとより優先される

- 例１

In [30]:
# 東、西、南、北区で人口20万人以上を表示します。（正しくない表示）

for key in sapporo_area_populations:
    if (key == "東区" or key == "西区" or key == "南区" or key == "北区"
        and sapporo_area_populations[key] > 200000):
        print(key, sapporo_area_populations[key])

北区 288226
東区 264664
南区 136417
西区 219023


南区は表示されないはずですが、andはorより優先されるため南区も表示されました。

- 例２

or条件をand条件より優先させるため、かっこで囲みました。

In [31]:
# 東、西、南、北区で人口20万人以上を表示します。（正しい表示）

for key in sapporo_area_populations:
    if ((key == "東区" or key == "西区" or key == "南区" or key == "北区")
        and sapporo_area_populations[key] > 200000):
        print(key, sapporo_area_populations[key])

北区 288226
東区 264664
西区 219023


## 関数

まとまった処理を関数として定義できます。
何回も呼び出す処理を関数にしておくと、同じ処理を何度も記述しないで済みます。

Pythonの標準機能とて用意されている組み込み関数（print()など）もありますが、
自分で新たな関数を定義することもできます。関数を定義するには「def」キーワードを使用します。
関数には、引数（関数に渡すパラメータ）と戻り値（関数の処理結果）を定義することができます。
引数や戻り値のない関数も定義することができます。

- 例１

以下は、引数として半径(r)を指定して、戻り値として円の面積(ar)を返す関数の例です。

In [32]:
# 半径を指定して円の面積を求める
def AreaOfCircle(r):
    ar = r * r * 3.14
    return ar

- 例２

円の面積を求める関数を呼び出して戻り値を変数に代入後に表示します。
関数の利用者は、円の面積を求める公式を知らなくても円の面積を取得できます。

In [33]:
# 半径5の円の面積を表示する
area_circle = AreaOfCircle(5)
print("半径5の円の面積: ", area_circle)

半径5の円の面積:  78.5


## オブジェクト

データは全てオブジェクトとして表されます。
組み込み関数 id() を実行すると、オブジェクトのidを確認できます。
同じ値を格納していてもオブジェクトは別になることがあります。

- 例１

文字列オブジェクトを２個作成しましたが、同じ文字列定数を参照しているのでオブジェクトの実体は１個です。

In [34]:
# 文字列オブジェクト２個のオブジェクトidを確認

s1 = "abc"
s2 = "abc"

print(s1, id(s1))
print(s2, id(s2))

abc 2413724294448
abc 2413724294448


- 例２

文字列オブジェクトを１個追加します。s2の値を加工して、新しいs3オブジェクトを作成しました。

In [35]:
# 文字列オブジェクト３個のオブジェクトidを確認

s3 = s2.rstrip("c") + "c"

print(s1, id(s1))
print(s2, id(s2))
print(s3, id(s3))

abc 2413724294448
abc 2413724294448
abc 2411687102640


### オブジェクトのデータ属性とメソッド

オブジェクトは属性（専用の変数や関数）を持っています。
オブジェクトの専用変数はデータ属性と呼ばれ、オブジェクトの専用関数はメソッドと呼ばれます。
オブジェクトが持つ属性は、組み込み関数 dir() を実行すると一覧表示できます。

- 例１

小数オブジェクトの属性一覧を表示します。

In [36]:
# 円周率の小数オブジェクトの属性
n = 3.14
print(dir(n))

['__abs__', '__add__', '__bool__', '__ceil__', '__class__', '__delattr__', '__dir__', '__divmod__', '__doc__', '__eq__', '__float__', '__floor__', '__floordiv__', '__format__', '__ge__', '__getattribute__', '__getformat__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__int__', '__le__', '__lt__', '__mod__', '__mul__', '__ne__', '__neg__', '__new__', '__pos__', '__pow__', '__radd__', '__rdivmod__', '__reduce__', '__reduce_ex__', '__repr__', '__rfloordiv__', '__rmod__', '__rmul__', '__round__', '__rpow__', '__rsub__', '__rtruediv__', '__set_format__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__truediv__', '__trunc__', 'as_integer_ratio', 'conjugate', 'fromhex', 'hex', 'imag', 'is_integer', 'real']


- 例２

文字列オブジェクトの属性一覧を表示します。オブジェクト型が変わると、オブジェクトの属性も変わります。

In [37]:
# 電話番号の文字列オブジェクトの属性
s = "011-123-4567"
print(dir(s))

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


- 例３

文字列を分割するメソッド split() を呼び出して、電話番号をハイフンで分割します。

In [38]:
print(s.split("-"))

['011', '123', '4567']


### モジュール

用途ごとにデータ型をまとめたものをモジュールといいます。
モジュールをimportするとPythonプログラムから利用することができます。

- 例１

モジュール datetime をimportして、変数 data_today に当日日付を代入します。

In [39]:
# 当日を表すオブジェクトを、変数data_todayに格納
import datetime
data_today = datetime.date.today()
print(data_today, type(data_today))

2022-03-01 <class 'datetime.date'>


- 例２

オブジェクトdata_todayのデータ属性（year, month, day）を表示します。
データ属性にアクセスする際は「オブジェクト.データ属性名」のように記述します。

In [40]:
# データ属性（year, month, day）を表示
print(data_today.year)
print(data_today.month)
print(data_today.day)

2022
3
1


- 例３

オブジェクトdata_todayのメソッドweekday()を呼び出して曜日（月曜=0、火曜=1、…、日曜=6）を表示します。
メソッドを呼び出す際は「オブジェクト.メソッド名()」のように記述します。
メソッドweekday()には引数がありませんが、引数のあるメソッドを呼び出す際は適宜引数を指定する必要があります。

In [41]:
# メソッド weekday() を呼び出し、曜日（月曜=0、火曜=1、…、日曜=6）を表示
print(data_today.weekday())

1
