# Basic Probability

### Permutation

In [2]:
from itertools import permutations

In [12]:
# ML 모델 학습을 위해 N개의 데이터를 넣을 때
# epoch마다 학습 데이터를 넣을 순서를 섞어서(shuffling) 진행

arr = [2, 3, 4]

print(permutations(arr, 2))

result = list(permutations(arr, 2))
print(result)

# import itertools
# list(itertools.permutations(arr, 2))

<itertools.permutations object at 0x0000022AFF250810>
[(2, 3), (2, 4), (3, 2), (3, 4), (4, 2), (4, 3)]


### Combination

In [14]:
# 예시 : 샴 네트워크(siamese network)
# 두 개의 이미지가 유사하면 1 아니면 0 출력
# N개의 데이터가 있다면 매번 2개의 이미지를 뽑아서 입력으로 넣는다,

from itertools import combinations

print(combinations(arr, 2))

result = list(combinations(arr, 2))
print(result)

<itertools.combinations object at 0x0000022AFF250180>
[(2, 3), (2, 4), (3, 4)]


### Permutation with Repetiton

In [20]:
from itertools import product

print(product(arr, repeat=2))

result = list(product(arr, repeat=2))
print(result)

<itertools.product object at 0x0000022AFF2129C0>
[(2, 2), (2, 3), (2, 4), (3, 2), (3, 3), (3, 4), (4, 2), (4, 3), (4, 4)]


### Combination with Repetiton

In [24]:
# 딥러닝에서 학습된 여러 모델의 결과를 활용하여 최종적인 결과를 생성하는
# 앙상블(ensemble) 방법
# 서로 다른 딥러닝 아키텍처에서 중복을 허용하여 딥러닝 모델을 학습
# 순서는 중요하지 않음

from itertools import combinations_with_replacement

print(combinations_with_replacement(arr, 2))

result = list(combinations_with_replacement(arr, 2))
print(result)

<itertools.combinations_with_replacement object at 0x0000022AFF329030>
[(2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4)]


## 확률 변수와 확률 분포

##### **확률 변수**
- 시행(trial)에 의해서 나오는 결과가 사건(event)
- **확률 변수**란, 사건으로 인해 그 값이 확률적으로 정해지는 변수
- **확률 변수**는 대문자 X, **확률 변수**가 취할 수 있는 값은 소문자 x
- **확률 변수**가 취할 수 있는 모든 x의 집합을 상태 공간(state space)
- **확률 함수**란, 확률 변수에 따라서 확률 값을 부여하는 함수 P
- 주사위 두 개 던지기 P(X=3) = 1/36
<br>
<br>
- **딥러닝 분야에서의 사건**
- 데이터는 사건으로 이해

##### **확률 분포**
- 확률 분포 함수의 대표적인 것으로는 *1. 확률 질량 함수*, 2. *확률 밀도 함수*  
<br>
<br>
- **이산 확률 분포** : 확률변수 X의 값을 셀 수 있는 경우
- **확률 질량 함수** : 이산 확률 변수가 특정한 값을 가질 확률 출력 함수  
<br>
<br>
- 딥러닝의 분류(classification) 모델의 출력은 확률 분포에 해당
- 이미지 x가 주어졌을 때 클래스 y의 확률은 **P(y|x)**
- X의 값에 따라 Y의 확률 분포가 변경되므로 **조건부 확률**
- 코끼리의 이미지 x가 주어진 경우
- P(Y=새|X=x) = 0.06, P(Y=코끼리|X=x) = 0.87, P(Y=벌|X=x) = 0.07  
<br>
<br>
- **연속 확률 변수** : 확률변수 X의 값이 무한한 경우
- **확률 밀도 함수** : 연속 확률 변수가 주어진 구간 내에 포함될 확률 출력

## 이산 확률 분포

##### 베르누이 시행(Bernoulli Trial)
- 결과가 두 가지 중 하나로만 나오는 시행
<br>
<br>
##### 베르누이 확률 분포
- **X~Bern(x;µ)**
- 모수(parameter)는 세미콜론(;) 기호로 구분하여 표기
- 베르누이 확률 분포의 모수 µ는 1이 나올 확률
![image.png](attachment:image.png)
<br>
<br>
##### 이항 분포 
- 성공 확률이 µ인 베르누이 시행을 N번 반복
- **X~Bin(x;N,µ)**
![image-2.png](attachment:image-2.png)
<br>
<br>
##### 포아송 분포
- 일정한 시간 내 발생하는 사건의 발생 횟수에 대한 확률 계산
- 단위 시간에 어떤 사건이 발생할 기댓값이 λ일 때, 그 사건이 x회 일어날 확률
- **확률 밀도 함수**
    - f(x;λ) = (e^-λ * λ^x) / x!
    - 포아송 분포의 평균 λ

## 연속 확률 분포
- 확률변수 X가 취할 수 있는 값이 무한한 경우, 이를 연속 확률 변수라고 한다.
- 대표적인 예시: **정규분포**
- 특정한 값 x에 대한 정확한 확률 값 표현 불가능
- 특정 구간에 대한 확률로 표현

##### 확률 밀도 함수
- 연속확률변수가 주어진 구간 내에 포함될 학률(PDF)
- f(x)는 확률, dx는 구간 길이
- 구간 (a, b)에 대한 면적
- 한 점에 대한 확률은 0

##### 균등 분포
- 특정 구간 내 값들이 나타날 가능성이 균등
- X~U(a, b)

##### [참고] 이산 균등 분포
- 균등 분포는 이산확률변수에 대해서 같은 확률을 가질 때 정의

##### 정규 분포
- 기계학습 분야에서 매주 자주 등장
- **1. 평균, 2. 표준편차**로 결정
- 평균을 중심으로 좌우 대칭인 종 모양
- 관측되는 값의 약 98%가 ±2σ 범위 안에 속한다
- 현실 세계의 많은 데이터가 정규 분포로 매우 가깝게 표현되는 경향
- 그래서 현실 세계에서 수집된 데이터의 분포를 근사할 때 자주 사용

##### 정규 분포의 확률밀도함수
- 공학 분야에서는 가우시안(Gaussian) 분포로 부르기도 한다.
- 평균(μ)과 분산(σ^2)에 의해 모양 결정
![image.png](attachment:image.png)

##### 표준 정규 분포
- 평균이 0, 표준편차가 1인 정규분포

##### 지수 분포
- 특정 시점에서 어떤 사건이 일어날 때까지 걸리는 시간을 측정할 때 사용
- **포아송 분포**는 **발생 획수**에 대한 확률
- **지수 분포**는 **대기 시간**에 대한 확률
- **확률 밀도 함수**
    - f(x) = λe^(-λx) (x>=0), λ: 단위 시간 동안 평균 사건 발생 횟수
- [예시] 24시간에 4회 해킹 발생, 3시간 동안 발생하는 해킹의 확률은?
    - λ = 4/24, (0, 3) 구간에 대해 적분
- **무기억성**: 특정 시점에서부터 소요되는 시간은 과거로부터 영향을 받지 않음
- **한계**: 현실 세계에서의 다양한 사례를 모델링하기에는 지나치게 단순한 경향

##### [참고] 이미지 데이터에 대한 확률 분포
- **생성 모델**: 이미지의 분포를 근사해 있을 법한 이미지 생성