<a href="https://colab.research.google.com/github/sanoakr/rumath-network/blob/main/python_tutorial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Google Colab で開く"/></a>

# Python のデータ型：数・文字列・リスト
## はじめに
ここでは、Pythonの3つの基本的で重要なデータ型「数」「文字列」「リスト」について概観します。より詳しい内容は、本日の演習課題を通して学んで下さい。

「数」では、整数 int型と実数 float型について説明します。C言語での int型と double型にそれぞれ対応します。

「文字列」では、文字列を扱う string型について説明します。C言語での文字型配列 char[]がこれに対応します。

「リスト」では、1次元の要素の並びを扱う list型について説明します。C言語での int[] や char[] などの配列変数に対応しますが、動的型付けをもつ Python では1つのリスト型に異なる型の要素を含むことができます。

## 数（int型・float型）
Python で数を扱うための基本的なデータ型は以下の2つです。
1. 整数型 int
1. 浮動小数点型（実数型） float

それぞれ、C言語での int型と double型に対応します。

In [10]:
a = 12
print(a)
print(type(a))

x = 3.14
print(x)
print(type(x))

12
<class 'int'>
3.14
<class 'float'>


C言語では、int型が保持できる整数の範囲は、-2147483648 から 2147483647 までです(32ビット環境の場合）。Python の int型は、この範囲を超える整数を保持することができます。

In [11]:
a = 3
for i in range(10):
    a = a ** 2
    print(a)

9
81
6561
43046721
1853020188851841
3433683820292512484657849089281
11790184577738583171520872861412518665678211592275841109096961
139008452377144732764939786789661303114218850808529137991604824430036072629766435941001769154109609521811665540548899435521
19323349832288915105454068722019581055401465761603328550184537628902466746415537000017939429786029354390082329294586119505153509101332940884098040478728639542560550133727399482778062322407372338121043399668242276591791504658985882995272436541441
373391848741020043532959754184866588225409776783734007750636931722079040617265251229993688938803977220468765065431475158108727054592160858581351336982809187314191748594262580938807019951956404285571818041046681288797402925517668012340617298396574731619152386723046235125934896058590588284654793540505936202376547807442730582144527058988756251452817793413352141920744623027518729185432862375737063985485319476416926263819972887006907013899256524297198527698749274196276811060702333710356481


また、C言語と同様に整数型と浮動小数点型を含む演算は、自動的に浮動小数点型に変換されて計算されます。

In [12]:
a = 123
x = 4.56
print(type(a), type(x))

y = a + x
print(type(y), y)

<class 'int'> <class 'float'>
<class 'float'> 127.56


C言語にはない演算子としては、べき乗を表す ** や、整数の割り算を表す // があります。

In [13]:
print(2 ** 10)
print(10 // 3, 10 % 3)

1024
3 1


ここでは詳しく説明しませんが、Pythonでは他にも標準で用意されている数値型があります。たとえば、10進数を正確に表現できる Decimal型や、複素数を扱う complex型などです。

In [25]:

# 計算機は浮動小数点数を正確に扱えないため、0.1 を 10 回足しても　1 にならないが、
a = 0
for i in range(10):
    a = a + 0.1
print(a)

# Decimal を使うと、正確に計算できる
from decimal import Decimal
a = 0
for i in range(10):
    a = a + Decimal('0.1')
print(a)


0.9999999999999999
1.0


In [29]:
# 複素数, 虚数単位は j
c1 = 2 + 3j
c2 = 3 + 4j
print(type(c1), print(c2))
print(c1 + c2)
print(c1 * c2)

(3+4j)
<class 'complex'> None
(5+7j)
(-6+17j)


## 文字列（string型）
C言語で文字列を扱う場合、文字型配列 char[] と文字列の終わりを表すヌル文字 '\0'（終端文字） を用いて文字列を表現しました。Pythonでは、文字列を表すための string型が用意されています。

文字列を表すリテラルは、シングルクォート ' かダブルクォート " で囲みます。文字列の終わりを表すヌル文字は不要です。

In [30]:
s1 = 'Hello'
s2 = "Python"
print(type(s1), type(s2))
print(s1, s2)

<class 'str'> <class 'str'>
Hello Python


文字列リテラルは、三連引用符 """ で囲むこともできます。改行文字を含む長い文字列を表現するのに便利です。

In [31]:
s = '''Good morning Python
Hello Python
Good night Python'''
print(s)

Good morning Python
Hello Python
Good night Python


string型は、文字列の結合や繰り返しを演算として表現することができます。C言語で、文字列操作関数（string.h の strcat() など）を呼び出していたことに比べると、とても簡潔に文字列を扱うことができます。

In [36]:
s1 = 'Hello,' ' my '  # 文字列リテラルは勝手に連結される
s2 = 'Python!!'
print(s1 + s2)
print(s1 * 3 + s2 *2)


Hello, my Python!!
Hello, my Hello, my Hello, my Python!!Python!!


また、文字列の一部を取り出すための添字演算子 [] も用意されています。C言語で、文字列を文字型配列として扱っていたときと同様の添字演算が可能です。これは Python のリストとも共通の機能です。リストについては次の節で説明します。

In [38]:
s = 'Hello, Python!'
print(s[0])
print(s[1])
print(s[2])
print(s[-1]) # 負のインデックスは末尾からの位置

H
e
l
!


文字列の長さは、len() 関数で取得できます。

In [41]:
print(s)
print(len(s))

Hello, Python!
14


## リスト（list型）
Python では、1次元の要素の並びを扱う list型が用意されています。C言語で、配列変数を用いて1次元の要素の並びを扱っていたときと同様の機能を持ちます。

list型のリテラルは、角括弧 [ ] で囲みます。要素の並びは、カンマで区切ります。C言語では、配列変数の初期化リテラルとして、要素の並びを波括弧 { } で囲むことが表現しました。Python の { } 表現は、他の型（辞書型や集合型）のリテラル表現となりますので注意が必要です。

In [50]:
l = [1, 2, 3, 4, 5]
print(l)

[1, 2, 3, 4, 5]


リストの要素へは、添字演算子 [] を用いてアクセスします。C言語で、配列変数を用いて1次元の要素の並びを扱っていたときと同様の機能を持ちます。

Python で添字番号に負の数を指定すると、リスト末尾からの相対位置を指定したことになります。（C言語で添字番号に負の数を指定すると（大抵の場合）Segmentation fault などのエラーとなります。）

また、string型と同様に、リストの長さは len() 関数で取得できます。

In [51]:
print(l[0], l[-1])         # 最初の要素と最後の要素
for i in range(len(l)):    # 0 から len(l) - 1 までのループ
    print(l[i])

1 5
1
2
3
4
5


C言語と同様に要素への代入も可能です。

In [54]:
l = [1, 2, 3, 4, 5]
l[2] = 99
l[-1] = 555
print(l)

[1, 2, 99, 4, 555]


その他、Python のリストでは個別の要素のみではなく、スライスと呼ばれる範囲指定による要素の取り出しや代入も可能です。スライスでは、添字番号の代わりに、コロン : を用いて範囲を指定します。範囲指定は、開始位置:終了位置:ステップ という形式で指定します。開始位置と終了位置は省略可能です。ステップは省略すると 1 となります。ステップが負の値の場合、終了位置は開始位置よりも小さくなるように指定します。

In [56]:
l = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(l[2:5])  # 2 から 4 までの要素
print(l[2:])   # 2 から最後までの要素
print(l[:5])   # 最初から 4 までの要素
print(l[:])    # 全要素
print(l[::2])  # 全要素を 2 つ飛ばしで
print(l[::-1]) # 全要素を逆順に

l[1:3] = [100, 200, 300] # スライスに代入
print(l)

[3, 4, 5]
[3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 3, 5, 7, 9]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
[1, 100, 200, 300, 4, 5, 6, 7, 8, 9, 10]


このスライス記法は文字列にも適用できます。文字列のスライスは、文字列の一部を取り出すための機能です。

In [57]:
s = 'Hello, Python!'
print(s[2:5])  # 2 から 4 までの文字
print(s[2:])   # 2 から最後までの文字
print(s[:5])   # 最初から 4 までの文字
print(s[:])    # 全文字
print(s[::2])  # 全文字を 2 つ飛ばしで
print(s[::-1]) # 全文字を逆順に

llo
llo, Python!
Hello
Hello, Python!
Hlo yhn
!nohtyP ,olleH


C言語では通常、配列変数のサイズは固定です。C言語で配列変数のサイズを変更しようとすると realloc() などの関数を用いて、メモリの再割り当てを行う必要があります。

一方、Python のリストはサイズ可変です。リストのサイズを変更するには、append() などのメソッドを用いて要素を追加したり、pop() や del(), remove() などのメソッドを用いて要素を削除することができます。

In [63]:
l = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

l.append(11)  # 末尾に追加
print(l)
l.pop(-2)     # 末尾から 2 番目の要素を削除
print(l)
l.remove(7)   # 7 を削除
print(l)
del(l[1])     # 1 番目の要素を削除
print(l)
del(l[1:4])   # 1 から 3 番目の要素を削除
print(l)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 11]
[1, 2, 3, 4, 5, 6, 8, 9, 11]
[1, 3, 4, 5, 6, 8, 9, 11]
[1, 6, 8, 9, 11]


ここまででも、Python のリスト型はC言語の配列と比較して、柔軟な機能を持っていることがわかります。しかし、Python が動的型付けをもつ言語であることから想像されるように、実はリストの要素には、異なる型の要素を混在させることができます。これは、C言語の配列変数にはできないことです。

ただし、1つのリストに異なる型を混在させると、バグの温床になったり、そのリストの要素を取り出す際に要素の型を判別する必要があります。要素の型が混在したリストを利用は、Python のプログラムを書く上であまり推奨されません。

In [66]:
li = [1, 2, 3, 4, 5]
ls = ['Apple', 'Banana', 'Orange']

# リストの連結
list = li + ls
print(list)

[1, 2, 3, 4, 5, 'Apple', 'Banana', 'Orange']


このような要素型が混在したリストに対して、以下のような処理を行うと、

In [69]:
sum = 0
for i in list:
    sum = sum + i
print(sum)

TypeError: unsupported operand type(s) for +: 'int' and 'str'

数値と文字列の + 演算は定義されていないため、当然エラーとなります。したがって、こういった型のチェックが必要となります。Pythonでは、変数にどのような型が入っているかを把握するのはプログラマの責任です。

In [72]:
sum = 0
for i in list:
    if type(i) is int:
        sum = sum + i
print(sum)

15
