# Pythonの集合（set）を理解しよう

## はじめに

こんにちは！これからPythonプログラミングを学ぶ皆さんに、Pythonの集合（set）について説明します。集合は、Pythonにおける重要なデータ構造の一つであり、重複のない要素を格納することができます。集合を理解することは、Pythonでプログラムを書く上で非常に重要です。

## 集合の基本

集合は、重複のない要素を格納するデータ構造です。集合は、中括弧`{}`を使って定義します。

In [1]:
# 集合の例
fruits = {"りんご", "バナナ", "オレンジ", "りんご"}
print(fruits)  # 出力結果：{'オレンジ', 'バナナ', 'りんご'}


{'バナナ', 'りんご', 'オレンジ'}


上記の例では、`fruits`という集合を定義しています。集合には、重複する要素（"りんご"）を含めることができますが、実際に集合が作成される際には、重複する要素は取り除かれます。

## 集合の特徴

集合には、以下のような特徴があります。

1. 重複する要素を持たない
2. 要素の順序は保持されない
3. 要素の追加、削除が可能
4. 集合同士の演算（和集合、積集合、差集合など）が可能

## リストや文字列から集合への変換

リストや文字列を集合に変換するには、`set()`関数を使用します。これを型変換（タイプキャスティング）と呼びます。


In [2]:
# リストから集合への変換
numbers_list = [1, 2, 3, 2, 4, 1, 5]
numbers_set = set(numbers_list)
print(numbers_set)  # 出力結果：{1, 2, 3, 4, 5}

# 文字列から集合への変換
chars = "abracadabra"
chars_set = set(chars)
print(chars_set)  # 出力結果：{'a', 'b', 'c', 'd', 'r'}

{1, 2, 3, 4, 5}
{'b', 'c', 'r', 'd', 'a'}


上記の例では、`numbers_list`というリストを`set()`関数を使って集合に変換しています。また、`chars`という文字列を`set()`関数を使って集合に変換しています。変換後の集合では、重複する要素が取り除かれていることがわかります。

## 集合のメソッド

集合には、便利なメソッドが用意されています。以下は、よく使われる集合のメソッドの一部です。

### add(要素)

`add()`メソッドは、集合に新しい要素を追加します

In [3]:
# add()メソッドの例
fruits = {"りんご", "バナナ", "オレンジ"}
fruits.add("ぶどう")
print(fruits)  # 出力結果：{'オレンジ', 'ぶどう', 'バナナ', 'りんご'}

{'ぶどう', 'バナナ', 'りんご', 'オレンジ'}


### remove(要素)

`remove()`メソッドは、集合から指定した要素を削除します。指定した要素が集合内に存在しない場合は、`KeyError`が発生します。

In [4]:
# remove()メソッドの例
fruits = {"りんご", "バナナ", "オレンジ"}
fruits.remove("バナナ")
print(fruits)  # 出力結果：{'オレンジ', 'りんご'}

fruits.remove("ぶどう")  # KeyError: 'ぶどう'

{'りんご', 'オレンジ'}


KeyError: 'ぶどう'

### discard(要素)

`discard()`メソッドは、集合から指定した要素を削除します。ただし、指定した要素が集合内に存在しない場合でもエラーは発生しません。

In [5]:
# discard()メソッドの例
fruits = {"りんご", "バナナ", "オレンジ"}
fruits.discard("ぶどう")  # 集合内に存在しない要素を指定
print(fruits)  # 出力結果：{'オレンジ', 'バナナ', 'りんご'}

{'バナナ', 'りんご', 'オレンジ'}


### pop()

`pop()`メソッドは、集合からランダムに要素を取り出し、その要素を集合から削除します。集合が空の場合は、`KeyError`が発生します。

In [6]:
# pop()メソッドの例
fruits = {"りんご", "バナナ", "オレンジ"}
fruit = fruits.pop()
print(fruit)  # 出力結果：ランダムに取り出された要素
print(fruits)  # 出力結果：残りの要素

バナナ
{'りんご', 'オレンジ'}


### clear()

`clear()`メソッドは、集合内のすべての要素を削除します。

In [7]:
# clear()メソッドの例
fruits = {"りんご", "バナナ", "オレンジ"}
fruits.clear()
print(fruits)  # 出力結果：set()

set()


### len()

`len()`関数は、集合内の要素数を返します。

In [8]:
# len()関数の例
fruits = {"りんご", "バナナ", "オレンジ"}
print(len(fruits))  # 出力結果：3

3


### 集合の演算

集合には、数学的な演算も用意されています。以下は、主な集合の演算です。

#### 和集合（union）

和集合は、2つの集合のすべての要素を含む新しい集合を返します。和集合は、`|`演算子または`union()`メソッドを使って計算できます。

In [9]:
# 和集合の例
set1 = {"りんご", "バナナ", "オレンジ"}
set2 = {"オレンジ", "ぶどう", "メロン"}
set_union = set1 | set2
print(set_union)  # 出力結果：{'オレンジ', 'メロン', 'ぶどう', 'バナナ', 'りんご'}

{'ぶどう', 'オレンジ', 'りんご', 'メロン', 'バナナ'}


#### 積集合（intersection）

積集合は、2つの集合の共通の要素を含む新しい集合を返します。積集合は、`&`演算子または`intersection()`メソッドを使って計算できます。

In [10]:
# 積集合の例
set1 = {"りんご", "バナナ", "オレンジ"}
set2 = {"オレンジ", "ぶどう", "メロン"}
set_intersection = set1 & set2
print(set_intersection)  # 出力結果：{'オレンジ'}

{'オレンジ'}


#### 差集合（difference）

差集合は、ある集合から別の集合の要素を取り除いた新しい集合を返します。差集合は、`-`演算子または`difference()`メソッドを使って計算できます。

In [11]:
# 差集合の例
set1 = {"りんご", "バナナ", "オレンジ"}
set2 = {"オレンジ", "ぶどう", "メロン"}
set_difference = set1 - set2
print(set_difference)  # 出力結果：{'バナナ', 'りんご'}

{'バナナ', 'りんご'}


#### 対称差集合（symmetric difference）

対称差集合は、2つの集合のどちらか一方にのみ属する要素からなる新しい集合を返します。対称差集合は、`^`演算子または`symmetric_difference()`メソッドを使って計算できます。

In [12]:
# 対称差集合の例
set1 = {"りんご", "バナナ", "オレンジ"}
set2 = {"オレンジ", "ぶどう", "メロン"}
set_symmetric_difference = set1 ^ set2
print(set_symmetric_difference)  # 出力結果：{'メロン', 'ぶどう', 'バナナ', 'りんご'}

{'ぶどう', 'りんご', 'メロン', 'バナナ'}


### 部分集合（subset）と上位集合（superset）

ある集合が別の集合の部分集合であるかどうかを確認するには、`issubset()`メソッドを使用します。また、ある集合が別の集合の上位集合であるかどうかを確認するには、`issuperset()`メソッドを使用します。

In [13]:
# 部分集合と上位集合の例
set1 = {"りんご", "バナナ"}
set2 = {"りんご", "バナナ", "オレンジ"}
print(set1.issubset(set2))  # 出力結果：True
print(set2.issuperset(set1))  # 出力結果：True

True
True


上記の例では、`set1`は`set2`の部分集合であり、`set2`は`set1`の上位集合であることがわかります。

### frozenset

`frozenset`は、不変な集合を表すデータ型です。`frozenset`は、一度作成すると要素の追加、削除、変更ができません。

In [14]:
# frozensetの例
fruits = frozenset(["りんご", "バナナ", "オレンジ"])
print(fruits)  # 出力結果：frozenset({'オレンジ', 'バナナ', 'りんご'})

fruits.add("ぶどう")  # AttributeError: 'frozenset' object has no attribute 'add'

frozenset({'バナナ', 'オレンジ', 'りんご'})


AttributeError: 'frozenset' object has no attribute 'add'

`frozenset`は、集合の要素として使用したり、辞書のキーとして使用したりすることができます。

## 集合の応用例

集合は、様々な場面で活用することができます。以下は、集合を使った応用例です。

### 重複する要素の削除

リストから重複する要素を取り除く場合、集合に変換してから再度リストに変換することで実現できます。

In [15]:
# 重複する要素の削除
numbers = [1, 2, 3, 2, 4, 1, 5]
unique_numbers = list(set(numbers))
print(unique_numbers)  # 出力結果：[1, 2, 3, 4, 5]

[1, 2, 3, 4, 5]


### 2つのリストの共通の要素を取得

2つのリストから共通の要素を取得する場合、集合の積集合を利用することができます。

In [16]:
# 2つのリストの共通の要素を取得
friends1 = ["太郎", "花子", "次郎", "明美"]
friends2 = ["太郎", "明美", "健太"]
common_friends = list(set(friends1) & set(friends2))
print(common_friends)  # 出力結果：['明美', '太郎']

['太郎', '明美']


### 集合内の要素の存在判定

集合内に特定の要素が存在するかどうかを判定する場合、`in`演算子を使用します。

In [17]:
# 集合内の要素の存在判定
fruits = {"りんご", "バナナ", "オレンジ"}
print("バナナ" in fruits)  # 出力結果：True
print("ぶどう" in fruits)  # 出力結果：False

True
False


## まとめ

本ホームページでは、Pythonの集合（set）について説明しました。集合は、重複のない要素を格納するデータ構造であり、要素の順序は保持されません。

集合は、リストや文字列から`set()`関数を使って作成することができます。また、`add()`メソッドを使って要素を追加したり、`remove()`メソッドや`discard()`メソッドを使って要素を削除したりすることができます。

集合には、和集合、積集合、差集合、対称差集合などの数学的な演算が用意されています。これらの演算を使うことで、複数の集合から必要な要素を取り出すことができます。

また、`issubset()`メソッドを使って部分集合を確認したり、`issuperset()`メソッドを使って上位集合を確認したりすることができます。

`frozenset`は、不変な集合を表すデータ型であり、集合の要素や辞書のキーとして使用することができます。

集合は、重複する要素の削除や、2つのリストの共通の要素を取得するなど、様々な場面で活用することができます。

これからPythonを学ぶ皆さんは、集合の基本的な操作を身につけ、プログラムの中で効果的に活用していきましょう。集合は、データの重複を排除し、効率的にデータを管理するための強力なツールです。

問題1
あなたは友達と一緒に旅行に行き、訪れた都市を記録することにしました。以下の都市を訪れたとします。

東京, 京都, 大阪, 名古屋, 東京, 福岡, 京都, 札幌, 東京

訪れた都市の重複を取り除き、都市の数を数えるPythonコードを書いてください。

解答例(Pythonコード):

In [18]:
cities = ["東京", "京都", "大阪", "名古屋", "東京", "福岡", "京都", "札幌", "東京"]

unique_cities = set(cities)

print("訪れた都市:", unique_cities)
print("訪れた都市の数:", len(unique_cities))

訪れた都市: {'札幌', '京都', '東京', '福岡', '名古屋', '大阪'}
訪れた都市の数: 6




出力結果:
```
訪れた都市: {'札幌', '名古屋', '大阪', '東京', '京都', '福岡'}
訪れた都市の数: 6
```

解説:
この問題では、重複する要素を取り除くために集合を使っています。

`cities`というリストには、訪れた都市の名前が格納されています。このリストには、重複する都市（東京、京都）が含まれています。

`set()`関数を使って`cities`リストを集合に変換し、`unique_cities`変数に代入しています。集合への変換により、重複する都市が自動的に取り除かれます。

`print()`を使って、`unique_cities`を出力することで、重複が取り除かれた都市のリストを確認できます。

さらに、`len()`関数を使って`unique_cities`の要素数を取得し、訪れた都市の数を出力しています。

このように、集合を使うことで、重複する要素を簡単に取り除くことができます。

問題2
あなたは、友達と一緒に果物狩りに行きました。あなたが収穫した果物と、友達が収穫した果物は以下の通りです。

あなた: りんご, バナナ, オレンジ, ぶどう
友達: オレンジ, ぶどう, メロン, スイカ

両方が収穫した果物（共通の果物）を見つけ、出力するPythonコードを書いてください。

解答例(Pythonコード):

In [19]:
your_fruits = {"りんご", "バナナ", "オレンジ", "ぶどう"}
friend_fruits = {"オレンジ", "ぶどう", "メロン", "スイカ"}

common_fruits = your_fruits & friend_fruits

print("両方が収穫した果物:", common_fruits)

両方が収穫した果物: {'ぶどう', 'オレンジ'}




出力結果:
```
両方が収穫した果物: {'ぶどう', 'オレンジ'}
```

解説:
この問題では、2つの集合の共通の要素を見つけるために、積集合を使っています。

`your_fruits`という集合には、あなたが収穫した果物の名前が格納されています。同様に、`friend_fruits`という集合には、友達が収穫した果物の名前が格納されています。

`&`演算子を使って、`your_fruits`と`friend_fruits`の積集合を計算し、`common_fruits`変数に代入しています。積集合は、両方の集合に共通する要素のみを含む新しい集合を返します。

`print()`を使って、`common_fruits`を出力することで、両方が収穫した果物（共通の果物）を確認できます。

このように、集合の積集合を使うことで、2つの集合の共通の要素を簡単に見つけることができます。