# 파이썬으로 풀어보는 수학

## 5장 집합과 확률

### 1. 집합은 무엇인가 ?

집합(set)은 개별 객체의 모음(collection)입니다.
통상 객체를 원소(element)나 구성원(member)라고 부릅니다.
집합과 모음의 다른점으로는 집합은 동일한 2개의 원소를 가질 수 없습니다.

`SymPy`를 사용해 파이썬에서 집합으로 작업하는 방법에 대해서 살펴보겠습니다.

### 2. 집합 생성

수학기호로 집합을 표현할 때는 `{ 2, 4, 6 }`와 같이 중괄호를 사용합니다.
파이썬에서는 `FiniteSet` 클래스를 사용하여 표현할 수 있습니다.

In [3]:
from sympy import FiniteSet

s = FiniteSet(2, 4, 6)
s

{2, 4, 6}

In [4]:
type(s)

sympy.sets.sets.FiniteSet

동일한 집합에 정수, 분수, 부동소수점수를 같이 저장할 수도 있습니다.

In [6]:
from fractions import Fraction

FiniteSet(1, 1.5, Fraction(1,5))

{1/5, 1, 1.5}

`카디널리티(cardinality)`란 집합의 구성원 수를 의미합니다.
`len()`함수를 이용해 계산이 가능합니다.

In [7]:
len(s)

3

`대상 집합에 숫자가 존재하는지 여부`는 `in`연산자를 사용해 알 수 있습니다.

In [8]:
3 in s

False

In [9]:
4 in s

True

`공집합(empty set)`을 생성하기 위해서는 인자가 없이 생성하면 됩니다.

In [10]:
FiniteSet()

EmptySet()

`리스트`나 `튜플`을 인자로 전달해서 집합을 생성할 수도 있습니다.

In [12]:
members = [1, 2, 3]
FiniteSet(*members)

{1, 2, 3}

앞서 언급했듯이 집합 내에는 중복된 값을 허용하지 않습니다.
같은 값을 여러번 넣어도 한 번만 추가되고 나머지는 모두 무시됩니다.

In [16]:
s = FiniteSet(1, 3, 2, 3)
s

{1, 2, 3}

그리고, 입력 순서와 저장되는 순서는 무관합니다.
집합 내의 구성원에 대한 순서는 별도로 저장하고 있지 않기 때문입니다.

In [18]:
for m in s:
    print(m)

1
2
3


두 집합의 구성원이 서로 다른 순서로 저장되더라도, 모든 요소들이 같다면 두 집합은 같은 집합으로 취급합니다.

In [19]:
s = FiniteSet(3, 5, 7)
t = FiniteSet(5, 7, 3)
s == t

True

###  3. 부분집합, 초집합, 파워집합

집합 s의 모든 구성원이 집합 t의 구성원일 경우 s는 t의 `부분집합(subset)`이라고 정의합니다.
파이썬에서는 `is_subset()` 함수를 사용해서 확인이 가능합니다.

In [20]:
s = FiniteSet(1)
t = FiniteSet(1, 2)

s.is_subset(t)

True

In [21]:
t.is_subset(s)

False

In [22]:
s.is_subset(s)

True

공집합은 모든 집합의 부분집합이며, 모든 집합은 자기 자신이 부분집합입니다.

`초집합(superset)`은 부분집합의 반대 개념으로 집합t가 집합s의 모든 구성원을 포함할 경우 집합t는 집합s의 초집합이라고 부릅니다.
파이썬에서는 `is_superset()` 함수를 사용해서 확인이 가능합니다.

In [23]:
s.is_superset(t)

False

In [24]:
t.is_superset(s)

True

In [25]:
s.is_superset(s)

True

`파워집합(powerset)`은 모든 가능한 부분집합입니다.
모든 집합은 `2 ** cadinality` 만큼의 부분집합을 가집니다. (공집합, 자기자신을 포함)
파이썬에서는 `powerset()` 함수를 사용해 찾아낼 수 있습니다.

In [26]:
s = FiniteSet(1, 2, 3)
ps = s.powerset()
ps

{EmptySet(), {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}

In [27]:
len(ps)

8

동일하지 않은 집합t와 집합s가 있을 경우,
집합s가 집합t의 부분 집합일 경우 집합t는 집합s의 초집합이라고 할 수 있습니다.
`is_proper_subset()` , `is_proper_superset()` 함수를 사용해서 부분집합, 초집합 관계를 확인 할 수 있습니다.

In [28]:
t = FiniteSet(1, 2, 3, 5)
s.is_proper_subset(t)

True

In [29]:
t.is_proper_superset(s)

True

In [30]:
s.is_proper_subset(s)

False

In [31]:
s.is_proper_superset(s)

False

### 4. 집합 연산

#### 합집합

두 집합의 모든 구성원을 포함하는 집합입니다. (중복된 구성원은 하나만 포함됩니다.)

In [1]:
from sympy import FiniteSet

s = FiniteSet(1, 2, 3)
t = FiniteSet(2, 4, 6)

s.union(t)

{1, 2, 3, 4, 6}

#### 교집합

두 집합에 공통적으로 존재하는 구성원들로만 이루어진 집합입니다.

In [2]:
s.intersect(t)

{2}

#### 카르테지안 곱

두 집합의 구성원들을 택해 모든 가능한 쌍으로 구성된 집합입니다.

카르테지안 곱의 카디널리티는 개별 집합의 카디널리티의 곱입니다.

In [4]:
p = s*t
p

{1, 2, 3} x {2, 4, 6}

In [5]:
for e in p:
    print(e)

(1, 2)
(1, 4)
(1, 6)
(2, 2)
(2, 4)
(2, 6)
(3, 2)
(3, 4)
(3, 6)


In [6]:
len(p) == len(s) * len(t)

True

지수연산자를 이용해서 설정한 횟수만큼의 곱도 가능합니다.

In [7]:
u = FiniteSet(1, 2)
p = u**3
p

{1, 2} x {1, 2} x {1, 2}

In [8]:
for e in p:
    print(e)

(1, 1, 1)
(1, 1, 2)
(1, 2, 1)
(1, 2, 2)
(2, 1, 1)
(2, 1, 2)
(2, 2, 1)
(2, 2, 2)


#### 다중변수 집합에 공식 적용

다음 수식은 추의 길이별 주기값을 구하는 수식입니다.

![수식 추의주기](./image/DoingMathWithPython.Ch05.equation.01.png)

- T : 추가 한번 왕복하는데 소요되는 시간
- L : 추의 길이
- 상수값 : pi, g(지역의 중력가속도 : 대략 9.8 m/s^2)

길이에 따라 추의 주기가 어떻게 변하는지 알고 싶다면 위 수식에 `L`값을 변경해가면서 입력해보면 됩니다.

In [10]:
from sympy import FiniteSet, pi

def time_period(length):
    g = 9.8
    T = 2 * pi * (length / g)**0.5
    return T

L = FiniteSet(15, 18, 21, 22.5, 25)
for e in L:
    t = time_period(e/100)
    print('Length: {0} cm Time Period: {1:.3f} s'.format(float(e), float(t)))

Length: 15.0 cm Time Period: 0.777 s
Length: 18.0 cm Time Period: 0.852 s
Length: 21.0 cm Time Period: 0.920 s
Length: 22.5 cm Time Period: 0.952 s
Length: 25.0 cm Time Period: 1.004 s


입력으로 사용된 집합의 값이 cm 단위이기 때문에 함수에 전달시 100으로 나누어서 전달하였습니다.

서로 다른 3곳(중력이 다른 곳)에서 실험을 한다고 가정해 보겠습니다.
(적도 : 9.78 , 북극 9.83, 호주 9.8)

In [14]:
def time_period(length, g):
    return 2 * pi * (length / g)**0.5

L = FiniteSet(15, 18, 21, 22.5, 25)
G = FiniteSet(9.8, 9.78, 9.83)

print('{0:^15}{1:^15}{2:^15}'.format('Length(cm)','Gravity(m/m^2)','Time Period(s)'))
for e in L * G:
    t = time_period(e[0]/100, e[1])
    print('{0:^15}{1:^15}{2:^15.3f}'.format(float(e[0]),float(e[1]), float(t)))

  Length(cm)   Gravity(m/m^2) Time Period(s) 
     15.0           9.78           0.778     
     15.0            9.8           0.777     
     15.0           9.83           0.776     
     18.0           9.78           0.852     
     18.0            9.8           0.852     
     18.0           9.83           0.850     
     21.0           9.78           0.921     
     21.0            9.8           0.920     
     21.0           9.83           0.918     
     22.5           9.78           0.953     
     22.5            9.8           0.952     
     22.5           9.83           0.951     
     25.0           9.78           1.005     
     25.0            9.8           1.004     
     25.0           9.83           1.002     


### 5. 확률

- **실험**(experiment) : 각각 가능한 확률에 대한 테스트, 실험을 한 번 실행하는 것을 시도(trial)이라고 함. 예를 들어 주사위 던지기, 카드 뽑기
- **표본공간**(`S`) : 모든 가능한 실험 결과들의 집합. 예를 들어  6면 주사위를 한 번 던진 경우 표본공간 `S = {1, 2, 3, 4, 5, 6}`
- **사건**(`E`) : 표본공간의 부분집합. 예를 들어 6면 주사위의 표본공간 중 숫자 3이 나올 확률

![수식 확률](./image/DoingMathWithPython.Ch05.equation.02.png)

특정 사건이 일어날 확률(`P(E)`)는 해당 사건의 개수(`n(E)`)를 전체 표본공간의 개수(`n(S)`)로 나눈 값입니다.
주사위를 던져서 3이 나올 확률은 다음과 같습니다.

> S = { 1, 2, 3, 4, 5, 6 }
E = { 3 }
n(S) = 6
n(E) = 1
P(E) = 1 / 6

이를 함수로 작성해 보겠습니다.

In [15]:
def probability(space, event):
    return len(event) / len(space)

위 함수를 이용해서 1 ~ 20 사이의 숫자 중 소수(Prime number)일 확률을 구해보도록 하겠습니다.

In [17]:
def check_prime(number):
    if n != 1:
        for factor in range(2,number):
            if number % factor == 0:
                return False
    else:
        return False
    return True

space = FiniteSet(*range(1,21))
primes = []
for n in space:
    if check_prime(n):
        primes.append(n)
event = FiniteSet(*primes)
probability(space, event)

0.4

In [18]:
event

{2, 3, 5, 7, 11, 13, 17, 19}

#### 사건A나 사건B의 확률

A 사건과 B 사건의 집합을 합집합(`union`)한 다음에 확률을 계산하면 됩니다.

- S : 6면주사위를 1번 던짐 -> { 1, 2, 3, 4, 5, 6 }
- A : 소수 -> { 2, 3, 5 }
- B : 홀수 -> { 1, 3, 5 }

일 경우의 사건 A나 B일 확률은 다음과 같습니다.

In [19]:
S = FiniteSet(*range(1,7))
A = FiniteSet(2, 3, 5)
B = FiniteSet(1, 3, 5)

len(A.union(B)) / len(S)

0.6666666666666666

#### 사건 A 이면서 사건 B일 확률

두 집합의 교집합(`intersect`)의 확률을 계산하면 됩니다.

In [20]:
len(A.intersect(B)) / len(S)

0.3333333333333333

### 6. 랜덤 숫자 생성

파이썬에서 랜덤숫자를 생성하려면 먼저 표준 라이브러리 `random`을 포함시켜야 합니다.
주로 사용되는 랜덤함수는 다음의 2가지 정도만 알아도 됩니다.
- randint(from, to) : from 에서 to 사이의 숫자를 리턴합니다. int값을 넣어줘야 합니다.
- random() : 0에서 1사이의 부동소수점 숫자를 생성합니다.

주사위를 굴려서 총합이 20될 때까지 몇 번을 던져야 하는지를 랜덤을 통해서 구현해 보겠습니다.

In [24]:
import random

target_score = 20

def roll():
    return random.randint(1,6)

def play_game():
    score = 0
    num_rolls = 0
    while score < target_score:
        dice = roll()
        num_rolls += 1
        print('Rolled: {0}'.format(dice))
        score += dice

    print('Score of {0} reached in {1} rolls'.format(score, num_rolls))

play_game()

Rolled: 6
Rolled: 6
Rolled: 1
Rolled: 5
Rolled: 2
Score of 20 reached in 5 rolls


In [25]:
play_game()

Rolled: 6
Rolled: 4
Rolled: 3
Rolled: 1
Rolled: 5
Rolled: 6
Score of 25 reached in 6 rolls


#### 목표점수 달성이 가능한가 ?

이번에는 목표로 한 점수가 최대던지기 횟수 내에 달성이 가능한지 그 여부 및 확률을 계산해주는 프로그램을 작성해 보겠습니다.

In [6]:
from sympy import FiniteSet
from random import randint

def find_prob(target_score, max_rolls):
    dice = FiniteSet(*range(1,7))
    space = dice**max_rolls
    eventNum = 0
    for e in space:
        n = sum(list(e))
        if (n >= target_score):
            eventNum += 1
    return eventNum / len(space)

find_prob(10,2)

0.16666666666666666

In [7]:
find_prob(20, 3)

0.0

주사위를 3번 던져서 최고값은 18이므로 20이 나올 수 있는 확률은 0% 입니다.