# データ構造

今までは、ブール値、整数、浮動小数点数、文字列という基本データ型を説明しました。ここからは、これらの基本データ型を要素としてまとめて取り扱うデータとしての構造について説明します。

## タプル(tuple)

タプルは、固定長で変更不可能(immutable)な一連のPythonオブジェクトの集合です。タプルでは、構成する要素としてあらゆる型のデータを指定できます。

### タプルの作成

タプルを作成するには、色々な方法があります。

- コンマで値を区切ります

In [1]:
tup= 4, 5, 6
tup

(4, 5, 6)

- 構成する要素をコンマで区切り全体を括弧```(...)```で囲みます

In [2]:
tup= (4, 5, 6)

- ```tuple```関数で他のシーケンスとイテレータを使ってタプルに変換する

In [4]:


  robustr_tuple=tuple("string")
str_tuple

('s', 't', 'r', 'i', 'n', 'g')

In [6]:
tup+str_tuple

(4, 5, 6, 's', 't', 'r', 'i', 'n', 'g')

- タプルのタプルも作成できます

In [3]:
nested_tuple= (4, 5, 6), (7, 8)
nested_tuple

((4, 5, 6), (7, 8))

- ```+```による連結する

In [None]:
tup+str_tuple

(4, 5, 6, 's', 't', 'r', 'i', 'n', 'g')

- ```*```による繰り返し

In [None]:
tup*3

(4, 5, 6, 4, 5, 6, 4, 5, 6)

### タプルの操作

- 文字列と同じように、タプルの要素は```[]```で参照できます。

In [None]:
tup[0]

4

In [None]:
nested_tuple[0]

(4, 5, 6)

In [7]:
nested_tuple[0][0]

4

- ```len```タプルを構成する要素を数えます。

In [8]:
len(tup)

3

- タプルを書き換えることはできないです。

In [9]:
tup[0]=1

TypeError: 'tuple' object does not support item assignment

## リスト
リストは、可変長で変更可能(mutable)な一連のPythonオブジェクトの集合です。つまり、タプルとは異なり、リスト内容は直接に変更できます。

### リストの作成
- 構成する要素をコンマで区切り全体をかき括弧```[...]```で囲みます

In [95]:
list_a=['Weber', 'Weber', 'Parsons', 'Marx', 'Giddens', 'Durkheim']
list_a

['Weber', 'Weber', 'Parsons', 'Marx', 'Giddens', 'Durkheim']

- ```list```関数で他のシーケンスとイテレータを使ってタプルに変換する

```{margin}
リストとタプルは意味的に似ているので、多くの使い方を相互に使うことができます。
```

In [20]:
list_b=list(tup)
list_b

[4, 5, 6]

### リストの操作

リストはミュータブルであるため、新しい要素を追加したり、既存の要素を削除、置換したりできます。

- ```append```による末尾への要素の追加

In [15]:
list_a.append(4)
list_a

['Weber', 'Weber', 'Parsons', 'Marx', 'Giddens', 'Durkheim', 4]

- ```insert```による特定の位置に要素を挿入

```{margin}
リストとタプルにおける要素の型は一緒でなくでも構いません。
```

In [18]:
list_a.insert(1, "Marx")
list_a

['Weber',
 'Marx',
 'Marx',
 'Weber',
 'Weber',
 'Parsons',
 'Marx',
 'Giddens',
 'Durkheim',
 4]

- ```extend```によるリストの連結

In [21]:
list_a.extend(list_b)
list_a

['Weber',
 'Marx',
 'Marx',
 'Weber',
 'Weber',
 'Parsons',
 'Marx',
 'Giddens',
 'Durkheim',
 4,
 4,
 5,
 6]

- スライスによるリストの要素を書き換え

In [22]:
list_a[5]= "Marx"
list_a

['Weber',
 'Marx',
 'Marx',
 'Weber',
 'Weber',
 'Marx',
 'Marx',
 'Giddens',
 'Durkheim',
 4,
 4,
 5,
 6]

In [23]:
list_a[5:]= ["Marx","Durkheim","Parsons"]
list_a

['Weber', 'Marx', 'Marx', 'Weber', 'Weber', 'Marx', 'Durkheim', 'Parsons']

- ```remove```による値を指定した要素を削除

```{margin}
削除しよう要素が複数ある場合、remove()は最初に見つかった要素だけ削除する
```

In [96]:
list_a.remove("Marx")
list_a

['Weber', 'Weber', 'Parsons', 'Giddens', 'Durkheim']

- ```del```による特定の位置の要素を削除


In [47]:
del list_a[1]
list_a

['Weber', 'Parsons', 'Marx', 'Giddens', 'Durkheim']

- ```pop```による指定して要素を取り出し、削除する方法

In [90]:
list_a.pop(0)

'Marx'

- ```=```による代入

In [48]:
list_a[1]="Giddens"
list_a

['Weber', 'Giddens', 'Marx', 'Giddens', 'Durkheim']

- ```in```による要素の有無を確認

In [49]:
'Weber' in list_a

True

In [50]:
'Merton' in list_a

False

- ```sort```による要素の並べ替え

```sort```メソッドはリスト内の要素を並べ替えます。 引数に何も指定しなければ昇順でとなります。

要素が文字列なら、アルファベット順でソードされます。

In [51]:
list_a.sort()
list_a

['Durkheim', 'Giddens', 'Giddens', 'Marx', 'Weber']

```reverse=True```引数を追加すれば降順になります・

In [52]:
list_a.sort(reverse=True)
list_a

['Weber', 'Marx', 'Giddens', 'Giddens', 'Durkheim']

## セット(set)

セット(set)は、重複しない要素の集合です。

### セットの作成

```{margin}
セットは一意な要素の集合なので、作成する際同じ要素は複数がいる場合、一つしか含まれないです。
```

- 構成する要素をコンマで区切り全体を波括弧```{...}```で囲みます

In [53]:
set_a={1,2,2,4}
set_a

{1, 2, 4}

- ```set()```関数で作成する。

In [54]:
set_b=set(['Durkheim', 'Giddens', 'Marx', 'Marx','Parsons', 'Weber'])
set_b

{'Durkheim', 'Giddens', 'Marx', 'Parsons', 'Weber'}

### セットの操作

- ```len()```による要素数の取得

In [None]:
len(set_a)

3

- ```add()```による要素の追加

In [55]:
set_b.add('Merton')
set_b

{'Durkheim', 'Giddens', 'Marx', 'Merton', 'Parsons', 'Weber'}

- ```remove()```による要素の削除

In [56]:
set_b.remove('Merton')
set_b

{'Durkheim', 'Giddens', 'Marx', 'Parsons', 'Weber'}

### セットの集合演算
セットは、数学的な集合演算をサポートします。

- セットの和

In [97]:
set_b.union(set_a)

{1, 2, 4, 'Durkheim', 'Giddens', 'Marx', 'Parsons', 'Weber'}

- セットの積は、両方のセットに存在する要素が含まれます。

In [58]:
set_b.intersection(set_a)

set()

## 辞書(dict)

辞書（dictionary）は、キー（key）と値（value）のペアを格納するデータ構造です。キーはユニークである必要があり、値は重複して格納することができます。

辞書はミュータブルなので、キーと値要素を追加、削除、変更することは可能です。

### 辞書の作成

辞書は波括弧```{}```で囲まれ、キーと値のペアはコロン:で区切って並べ、```{key:value}```という形で作れます。

- 辞書にキーとして使用できるのは、イミュータブル型(例えば、整数、浮動小数点数、文字列、タプルなど)しか使用できません。
- 辞書のキーはユニークである必要があります。


```{margin}
```{}```でキーと値を持たない空辞書を作れます。
```

In [75]:
nation={
    "Marx": "German",
    "Weber": "German",
    "Durkheim":"France",
    "Parsons":"America"
}

In [60]:
birth=dict(Marx=1818, Weber=1864, Durkheim=1858, Parsons=1902)

In [72]:
birth=dict([("Marx",1818), ("Weber",1864), ("Durkheim",1858), ("Parsons",1902)])

### 辞書に要素の追加・変更

- キーを使って要素を参照し、値を代入することで辞書に要素を追加できます。

In [77]:
nation["Merton"]="America"

In [149]:
nation

{'Marx': 'German',
 'Weber': 'German',
 'Durkheim': 'France',
 'Parsons': 'America',
 'Merton': 'America',
 'Goffman': 'America',
 'Habermas': 'Germany'}

- キーはユニークでなければならないので、キーを複数回使った場合、最後の値が辞書に保留されます。

In [65]:
birth["Merton"]=1911 # 間違い

In [82]:
birth

{'Marx': 1818,
 'Weber': 1864,
 'Durkheim': 1858,
 'Parsons': 1902,
 'Merton': 1910}

In [81]:
birth["Merton"]=1910 # 正しい値

In [107]:
birth

{'Marx': 1818,
 'Weber': 1864,
 'Durkheim': 1858,
 'Parsons': 1902,
 'Merton': 1910}

### 要素の取得

- 辞書のもっとも一般的な用途は、キーを指定して、対応する値を取り出すことです。

In [84]:
nation["Durkheim"]

'France'

In [85]:
nation.get("Durkheim")

'France'

- ```keys()```によるすべてのキーの取得

In [87]:
nation.keys()

dict_keys(['Marx', 'Weber', 'Durkheim', 'Parsons', 'Merton'])

- ```values()```によるすべての値の取得

In [101]:
birth.keys()

dict_keys(['Marx', 'Weber', 'Durkheim', 'Parsons', 'Merton'])

In [108]:
birth.values()

dict_values([1818, 1864, 1858, 1902, 1910])

In [98]:
nation.values()

dict_values(['German', 'German', 'France', 'America', 'America'])

- ```items()```によるキー・値ペアの取得

In [99]:
nation.items()

dict_items([('Marx', 'German'), ('Weber', 'German'), ('Durkheim', 'France'), ('Parsons', 'America'), ('Merton', 'America')])

- ```len()```による長さの取得

In [100]:
len(nation)

5

- ```update()```による辞書の結合

```{margin}
第2辞書が第1辞書と同じキーを持っている場合、```update()```による第2辞書の値が保留されます。
```

In [104]:
nation2=dict(Goffman="America", Giddens="England", Habermas="Germany")

In [105]:
nation.update(nation2)
nation

{'Marx': 'German',
 'Weber': 'German',
 'Durkheim': 'France',
 'Parsons': 'America',
 'Merton': 'America',
 'Goffman': 'America',
 'Giddens': 'England',
 'Habermas': 'Germany'}

- ```del```による指定したキーを持つ要素の削除

In [106]:
del nation['Giddens']
nation

{'Marx': 'German',
 'Weber': 'German',
 'Durkheim': 'France',
 'Parsons': 'America',
 'Merton': 'America',
 'Goffman': 'America',
 'Habermas': 'Germany'}

````{tab-set}
```{tab-item} 実習問題1
下の表が社会学者の没年を示している。社会学者の名前をキー、没年を値として辞書を作ってください。

| 名前     | 没年 |
|----------|---------|
| Marx     | 1883    |
| Weber    | 1864    |
| Durkheim | 1917    |

```
```{tab-item} 実習問題2
```Merton```の没年である```2003```を先の辞書に追加してください。
```
```{tab-item} 実習問題3
```Marx```の享年を計算してください。
```

````

In [146]:
nation

{'Marx': 'German',
 'Weber': 'German',
 'Durkheim': 'France',
 'Parsons': 'America',
 'Merton': 'America',
 'Goffman': 'America',
 'Habermas': 'Germany'}

In [127]:
dead={"Marx":1883,"Weber":1864, "Durkheim":1917}
dead

{'Marx': 1883, 'Weber': 1864, 'Durkheim': 1917}

In [130]:
death=dict(Marx=1883, Weber=1864, Durkheim=1917)
death

{'Marx': 1883, 'Weber': 1864, 'Durkheim': 1917}

In [131]:
death["Merton"]=2003
death

{'Marx': 1883, 'Weber': 1864, 'Durkheim': 1917, 'Merton': 2003}

In [132]:
death["Marx"]-birth["Marx"]

65

## シーケンス

これまで色々なデータ型そして操作方法を勉強しました。その中に、集約する要素が一定の順序で並んでいて、その順序(インデックス)を使ってその要素を指定できる種類のオブジェクトを**シーケンス**といいます。

シーケンスであるデータ型は以下の特徴があります。

- インデックスで要素にアクセスができます
- スライス:要素をインデックスで範囲指定し、まとめて取得することができます
- 長さの取得ができます
- 要素の出現回数:```count()```メソッド を使うことで指定した要素がシーケンスに何個格納されているか調べることができます

````{tab-set}
```{tab-item} 問題
今まで紹介されたデータ型の中に、シーケンスであるデータ型は何ですか

```

````

In [138]:
a="strawberry"
a.count("r"),len(a)

(3, 10)

文字列はカウントできる→シーケンスである！

In [142]:
list_a=list(a)
list_a.count("r")

3

In [143]:
tuble_a=tuple(a)
tuble_a.count("r")

3

In [148]:
set_a=set(a)
set_a.count("r")

AttributeError: 'set' object has no attribute 'count'

In [147]:
nation['America']

KeyError: 'America'