# **プログラミング基礎第14回**
集合と確率

---

## 集合

### 集合(Set)とは
- 集合とは
    - 要素(element)の集まり
    - メンバーや元の集まりと呼ぶこともある
- 要素に関する特性
    - 集合に含まれるかという質問に明確に答えられる
    - 集合の中に重複はない
    - 順序づけ は考えない
- この授業では基本的に有限集合を扱う
    - つまり、値の種類が有限個

### FiniteSet クラス
Python は組み込み型 `set` で集合を扱えるが、
この授業では SymPy モジュールの `FiniteSet` クラスを使う

In [1]:
from sympy import FiniteSet

In [2]:
s = FiniteSet(2, 4, 6)
s

{2, 4, 6}

いろいろな型の値を要素に持つことができる
- SymPy は数式処理ライブラリなので、文字列の要素には対応しない
- 組み込み型 `set` は文字列に対応するがその他の機能が少ない

In [3]:
FiniteSet(2, 4, 9.8, True) # 整数と実数と bool 値

{2, 4, 9.8, True}

### リストからの集合の作成
- リストは要素が重複してもよく、要素の順序が意味を持つ
- リストの要素を集合にすると重複がなくなる
- FiniteSet は要素が昇順に並ぶがその順序を利用してはならない

In [4]:
members = [1,4,2,3,3,4,5] # 重複を持つリスト
FiniteSet( * members ) # アスタリスク指定

{1, 2, 3, 4, 5}

`FiniteSet(*members)`は `FiniteSet(1,4,2,3,3,4,5)` を意味する

### アスタリスク付き実引数
引数の数が可変の関数では、リストやタプルの実引数にアスタリスク(*) をつけると要素を並べたことになる
#### そのまま引数とした場合

In [5]:
a = [1,2,3,4,5]
print( a )
print(range(5) )

[1, 2, 3, 4, 5]
range(0, 5)


#### アスタリスク付きの引数の場合

In [6]:
print( *a )
print( *range(5) )

1 2 3 4 5
0 1 2 3 4


### アスタリスク付き実引数と FiniteSet
`FiniteSet` もアスタリスクの指定ができる

In [7]:
FiniteSet( * range (1,6))

{1, 2, 3, 4, 5}

In [8]:
FiniteSet( * [x**2 for x in range(1,6)])

{1, 4, 9, 16, 25}

`print()`を使うと表示が変わる

In [9]:
a = FiniteSet ( * range(1,6))
b = FiniteSet( *[x**2 for x in range(1,6)])
print(a)
print(b)
print( *a )
print( *b )

{1, 2, 3, 4, 5}
{1, 4, 9, 16, 25}
1 2 3 4 5
1 4 9 16 25


### 集合の特徴の確認
集合の要素に順序関係はない

In [10]:
FiniteSet(4, 2, 6)

{2, 4, 6}

集合の要素に重複はない

In [11]:
FiniteSet(4, 2, 6, 4, 3, 2)

{2, 3, 4, 6}

集合sの要素数をsの濃度と呼び、`|s|`と表す

In [12]:
s = FiniteSet(1, 1.5, 3)
print('|s| = ', len(s))

|s| =  3


### 要素の取得
集合の要素を取り出す(順序は保証されない)

In [13]:
s = FiniteSet(4, 2, 6)
for elem in s:
    print(elem, end=' ')

2 4 6 

リスト内包表記でリストにしても良い

In [14]:
s = FiniteSet(4, 2, 6)
s2 = [ elem for elem in s ]
print(s2)

[2, 4, 6]


リストに変換しても良い

In [15]:
s = FiniteSet(4, 2, 6)
list(s)

[2, 4, 6]

### 集合の基本演算
ある要素が集合にあるかどうか

In [16]:
s = FiniteSet(4,2,6)
4 in s

True

2つの集合が等しい(要素が同じ)かどうか

In [17]:
s1 = FiniteSet(4,2,6)
s2 = FiniteSet(4,6,2,2)
s1 == s2

True

### さまざまな集合
#### 空集合

In [18]:
s = FiniteSet()
s

EmptySet

#### 全体集合
- 全体集合にはすべてのものを含む理論上のものと、範囲を限定したものがある
- 計算では有限集合を全体集合とすることが多い

In [19]:
from sympy import UniversalSet
u = UniversalSet
u

UniversalSet

In [20]:
s = FiniteSet(True, 3)
s in u

True

### 補集合 complement
集合sに含まれない要素の集合をsの補集合という

In [21]:
u = FiniteSet( * range(1, 10)) # 全体集合と仮定
s = FiniteSet ( * range(2, 10, 2))
print(u)
print(s)
print(u - s) #sの補集合

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{2, 4, 6, 8}
{1, 3, 5, 7, 9}


In [22]:
from sympy import Complement
c = Complement(u,s)
print(c)

{1, 3, 5, 7, 9}


### 部分集合 subset
集合sの全要素が集合tに含まれるとき,sはtの部分集合である
#### 部分集合の判定

In [23]:
u = FiniteSet(1, 2, 3, 4) # 全体集合と仮定
s = FiniteSet(3, 2)
print(u)
print(s)

{1, 2, 3, 4}
{2, 3}


In [24]:
s.is_subset(u)

True

In [25]:
u.is_subset(s)

False

### 空集合 empty set と部分集合
空集合はあらゆる集合の部分集合である

In [26]:
u = UniversalSet # 理論上の全体集合
a = FiniteSet(1, 2, 3, 4) # 有限個の集合
e = FiniteSet() # 空集合
e.is_subset(u)

True

In [27]:
e.is_subset(a)

True

In [28]:
e.is_subset(e)

True

### 上位集合 superset
集合tが 集合sの全要素を含むとき、tはsの上位集合である

In [29]:
u = UniversalSet
a = FiniteSet(1,3,2,4)
b = FiniteSet(2,3)
e = FiniteSet() # 空集合
u.is_superset(a)

True

In [30]:
a.is_superset(b)

True

In [31]:
b.is_superset(e)

True

### 真部分集合と真上位集合
- 集合sの全要素が集合tに含まれ、かつtがsにない要素を1つ以上持つとき、特にsはtの真部分集合であるという
- 逆に、集合tが集合sの全要素を含み、かつtがsにない要素を1つ以上持つとき、特にtはsの真上位集合であるという

In [32]:
a = FiniteSet(1,2,3,4)
b = FiniteSet(4,2,1,3)
c = FiniteSet(2,3)
c.is_proper_subset(a)

True

In [33]:
b.is_proper_subset(a)

False

In [34]:
a.is_proper_superset(c)

True

### べき集合 power set
集合sのすべての部分集合の集合をsのべき集合という

In [35]:
s = FiniteSet(1,2)
ps = s.powerset()
ps

FiniteSet(EmptySet, {1}, {2}, {1, 2})

集合sのべき集合の濃度は 2<sup>|s|</sup>

In [36]:
s = FiniteSet(1,2)
ps = s.powerset()
print(len(ps))
s3 = FiniteSet(1,2,3)
s4 = FiniteSet(1,2,3,4)
print(len(s3.powerset()))
print(len(s4.powerset()))

4
8
16


### 和集合 (union)

In [37]:
a = FiniteSet(1,3,4)
b = FiniteSet(2,4,6)
a.union(b)

{1, 2, 3, 4, 6}

### 共通部分 (intersection)

In [38]:
a = FiniteSet(1,3,4)
b = FiniteSet(2,4,6)
a.intersect(b)

{4}

### 差集合 (difference)

In [39]:
a = FiniteSet(1,3,4)
b = FiniteSet(2,4,6)
a-b

{1, 3}

### 直積

In [40]:
a = FiniteSet(1,2)
b = FiniteSet(3,4)
p = a*b
p

ProductSet({1, 2}, {3, 4})

In [41]:
p = FiniteSet(1,2) * FiniteSet(3,4)
for e in p:
    print(e, end=' ')

(1, 3) (2, 3) (1, 4) (2, 4) 

## 例

### サイコロ2回
サイコロを2回振ったときの出た目の合計とその集合

In [42]:
t1 = FiniteSet(1,2,3,4,5,6) # サイコロの目
t2 = t1**2 # 直積で2回振った際の目の組み合わせを表現
t2list = [ a+b for a,b in t2 ]
print(t2list )
t2sum = FiniteSet( *t2list )
print(t2sum)

[2, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 11, 11, 12]
{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}


### 数学の問題

In [43]:
a = FiniteSet( *[ 2*n for n in range(1,5+1)])
print('集合A=', a)
expr = [('(1)', 4 in a),
        ('(2)', 5 not in a),
        ('(3)', 3 in a),
        ('(4)', 6 in a),
        ('(5)', 8 not in a)]
print('誤り:', *[ q for q,e in expr if not e ])

集合A= {2, 4, 6, 8, 10}
誤り: (3) (5)


## 確率

### Fraction クラス
- 有理数は実数表現よりも分数の方が良い扱いやすいことがある
    - 分子と分母が整数の分数で表せる数
    - 有限小数または循環小数となる
- fractions モジュールの Fraction クラスの使用

In [44]:
from fractions import Fraction
a = Fraction(1, 2) # 1/2
print( type(a) )
print( a )
b = Fraction(1, 3) # 1/3
c = a + b # 5/6
print(f'{c}, {1-c}')

<class 'fractions.Fraction'>
1/2
5/6, 1/6


### 確率の計算
標本空間で結果がすべて等しく起こりやすい(一様分布が仮定できる)ならば、 事象Aの生起する確率 P(A) は以下で計算できる

In [45]:
def Prob(e, u):
    return Fraction(len(e), len(u))

u = FiniteSet( * range (1,101)) # 標本空間
a = FiniteSet( * range(4,101,4)) # 事象
print(Prob(a, u) )

1/4


### 積事象の確率(同時確率)

In [46]:
u = FiniteSet( * range (1,101)) # 標本空間
a = FiniteSet( * range(4,101,4)) # 事象 a
b = FiniteSet( * range (3,101,3)) #事象 b
print(Prob(a&b, u))

2/25


### 和事象の確率

In [47]:
u = FiniteSet( * range (1,101)) # 標本空間
a = FiniteSet( * range(4,101,4)) #事象 a
b = FiniteSet( *range (3,101,3)) #事象 b
p1 = Prob(a|b, u)
p2 = Prob(a, u) + Prob(b, u) - Prob(a&b, u)
print(f'{p1}, {p2}') # 同じ値であることを確認

1/2, 1/2


### 余事象の確率

In [48]:
u = FiniteSet( *range (1,101) ) # 標本空間
a = FiniteSet( * range(4,101,4)) # 事象 a
p1 = Prob(u-a, u)
p2 = 1 - Prob(a,u)
print(f'{p1}, {p2}') # 同値を確認

3/4, 3/4


### 準備:素数判定

In [49]:
def is_prime(number):
    if number == 1:
        return False
    for factor in range(2, number//2+1):
        if number % factor == 0:
            return False
    return True

In [50]:
if is_prime( 20220713 ):
    print("素数です")

素数です


### 素数のでる確率

In [51]:
space = FiniteSet( * range(1, 20+1))
primes = [ num for num in space if is_prime(num) ]
event = FiniteSet( *primes )
p = Prob(event, space)
print(f'標本空間:{space}')
print(f'事象: {event}')
print(f'確率: {p}')

標本空間:{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}
事象: {2, 3, 5, 7, 11, 13, 17, 19}
確率: 2/5


### 奇数または素数の確率

In [52]:
s = FiniteSet(1,2,3,4,5,6) # 6面のサイコロ
a = FiniteSet(1,3,5) # 奇数
b = FiniteSet(2,3,5) #素数
e = a | b
print(e)
p = Prob(e, s)
print(f'奇数または素数の確率:{p}')

{1, 2, 3, 5}
奇数または素数の確率:2/3


### 奇数かつ素数の確率

In [53]:
s = FiniteSet(1,2,3,4,5,6) # 6面のサイコロ
a = FiniteSet(1,3,5) # 奇数
b = FiniteSet(2,3,5) #素数
e = a & b
print(e)
p = Prob(e, s)
print(f'奇数かつ素数の確率:{p}')

{3, 5}
奇数かつ素数の確率:1/3


## まとめ
学んだことを箇条書きにして簡単な説明を書いておこう
- 集合の用語:
  - **集合**: 要素の集まり。
  - **要素**: 集合の中身。
  - **有限集合**: 要素が有限個の集合。
  - **空集合**: 要素がない集合 (∅)。
  - **全体集合**: 考えている範囲のすべての要素からなる集合 (U)。
  - **部分集合**: ある集合の全要素が、別の集合に含まれている状態。
  - **上位集合**: ある集合が、別の集合の全要素を含んでいる状態。
  - **べき集合**: ある集合の、全ての部分集合からなる集合。
- 集合の特徴
  - 要素(element)の集まり
  - メンバーや元の集まりと呼ぶこともある
- 集合の演算
  - 集合に含まれるかという質問に明確に答えられる
  - 集合の中に重複はない
  - 順序づけ は考えない
- 確率の用語:**
  - **標本空間**: 起こりうる全結果の集合。
  - **事象**: 標本空間の部分集合。
  - **同様に確からしい**: 全ての結果が同じ確率で起こる状態。
- 事象の確率:
  - 一様分布が仮定できるなら`fraction(len(標本空間),len(事象))`
- FiniteSet
  - sympyモジュールにある数学的な集合を扱うためのクラス。
  - 重複・順序なしの要素を保持する。
  - リストから作るにはアスタリスク * が必要
- Fraction
  - fractionsモジュールにある分数を扱うためのクラス。
  - 割り切れない数も正確に表現できる