# 集合
集合はリストと同じく複数のデータを集めたものですが、集合には順序がなく、同じデータを複数含みません。

In [None]:
s = set([3,1,4,1,5,9,2,6,5,3,5,8,9,7,9,3,2])
s

集合に1つ要素を追加するにはaddを使います。

In [None]:
s.add(10)
s

集合の演算を試してみましょう。

In [None]:
a = set([2,4,6,8,10,12,14,16,18,20])
b = set([3,6,9,12,15,18])
a | b                           #a or b   和集合

In [None]:
a & b                           #a and b  交差

In [None]:
a - b                           #差集合

In [None]:
b - a                           #差集合

In [None]:
a ^ b                           #排他

In [None]:
((a^b) | (a&b)) - (a|b)

かけ算や足し算演算子は何に使えるのでしょうか。マニュアルを読む限り、+と\*は使えないようです。

In [None]:
s+11

ある要素が集合に含まれるかどうかは、in演算子で調べます。

In [None]:
if 2 in a:
    print("yes")

集合には文字列も入れられますが、辞書と同じように、定数しか入れられません。(実のところ、辞書と集合はほとんど同じものです。集合は、値を指定できない辞書です)

集合のそれぞれの要素を二乗してみます。

In [None]:
for e in a:
    print(e,e*e)

集合aの要素をそれぞれ2乗したものを要素とする、新しい集合を作ります。

In [None]:
L = [e*e for e in a]
a2 = set(L)
a2

集合aの要素をキーとし、2乗したものを値とする、新しい辞書を作ります。

In [None]:
d = dict()
for e in a:
    d[e] = e*e
print(d)

集合は、実際には値を指定できない辞書と同じものです。ですから、集合と同じ機能を、辞書で実現することもできます。また、がんばればリストでも同じことはできます。

例えば、辞書をつかって、3の倍数の集合のようなものを作るには、次のようなコードが書けるでしょう。

a = dict()
for i in range(0,100,3):
    a[i] = 1
for i in sorted(a):
    print(i)

リストで実現するなら、

In [None]:
a = []
for i in range(0,100,3):
    a.append(i)
for i in a:
    print(i)

実際、FortranやC言語のような古い言語には辞書も集合もないので、リスト(配列)で集合を表現するしかありません。

でも、これらの「なんちゃって集合」で、和集合や差集合の機能を実現しようとすると、いちいち自分で関数定義をしなければいけないので、そこにバグを仕込んでしまう可能性が高まるうえ、読みにくく複雑でしかも遅いプログラムになってしまいます。

試しに集合演算をリストだけで書いてみることにしましょう。

In [None]:
def union(a,b):
    c = []
    for i in a:
        if i not in c:
            c.append(i)
    for i in b:
        if i not in c:
            c.append(i)
    return c


def diff(a,b):
    c = []
    for i in a:
        if i not in b:
            c.append(i)
    return c


def intersection(a,b):
    c = []
    for i in a:
        if i in b:
            c.append(i)
    return c


a = [i for i in range(0,100,2)]
b = [i for i in range(0,100,3)]
print(union(a,b))
print(diff(a,b))
print(intersection(a,b))

集合を使うなら、関数定義は不要で、演算子だけで表現できます。

In [None]:
a = set([i for i in range(0,100,2)])
b = set([i for i in range(0,100,3)])
print(a|b)
print(a-b)
print(a&b)

## 練習問題
### 問題1
100未満の整数の集合n1, 100未満の偶数の集合n2, 100未満の3の倍数の集合n3, 100未満の5の倍数の集合n5などを作り、集合演算で素数の集合を作って下さい。(素数に1を含んでも構いません)

In [None]:
n1=set([x for x in range(100)])
n1

### 問題2
てきとうな文字列を入力させ、その文字列の中で使われたアルファベット(A〜Z、a〜z)と使われなかったアルファベットをそれぞれ表示するプログラムを作って下さい。