<h2>개인 구글 드라이브와 colab 연동 </h2>

In [52]:
from google.colab import drive
drive.mount("/gdrive", force_remount=True)

Mounted at /gdrive


<h2>라이브러리 설치 </h2>

In [53]:
!pip install hmmlearn



In [54]:
import numpy as np
from hmmlearn import hmm

states = ["Rainy", "Cloudy", "Sunny"]
n_states = len(states)

observations = ["Boots", "Shoes"]
n_observations = len(observations)

# 시작 확률 : 처음 상태에서 발생 가능성 Rainy Cloudy Sunny
start_probability = np.array([0.2, 0.5, 0.3])

# 전이 확률 : 현재 state에서 다음 state로 갈 확률
transition_probability = np.array([
  [0.4, 0.3, 0.3],#Rainy에서 Rainy, Cloudy, Sunny로 갈 확률
  [0.2, 0.6, 0.2],
  [0.1, 0.1, 0.8]
])

# 관측 확률 : 현재 state에서 observation 가능한 확률
emission_probability = np.array([
  [0.8, 0.2], #Rainy에서 Boots, Shoes를 observation할 확률
  [0.5, 0.5],
  [0.1, 0.9]
])

#원래 위 확률들은 training data에서 계산해서 얻어와야 하는 것들임
#예를들어 state Rainy에서 state Rainy로 가는 확률은 Maximum Likelihood Estimation 같은 것으로 한다. 예를들어 (Rainy->Rainy)/(오늘 Rainy인 날짜수)으로 0.4 도출해야함

# 모델 만들기
model = hmm. CategoricalHMM(n_components=n_states) # hmm의 CategoricalHMM 클래스 이용하고 매개변수로 state 수를 넘기기
model.startprob_ = start_probability # 초기 시작 확률
model.transmat_ = transition_probability # 전이 확률
model.emissionprob_ = emission_probability # 관측 확률을 모두 model 객체의 해당 값에 대입


# 관측 입력
input = [0, 0, 1,1] # Boots, Boots, Shoes, Shoes로 인덱스 제공

# HMM 모델 호출
hmm_input = np.atleast_2d(input).T # input이 현재 1차원 형태의 1x4인데 2차원 형태의 4x1 벡터 형태로 바꿔야하므로 T 이용

logprob, sequence = model.decode(hmm_input) # model.decode(hmm_input)를 하면 비터비 알고리즘을 이용해서 가장 큰 확률값(logprob)와 순서(sequence)를 튜플로서 반환해줌
#이 때 가장 큰 확률을 곱으로 표현하는 게 아닌 log를 통해서 합으로 변형해서 확률값인 logprob를 반환함
#이는 곱은 속도가 오래 걸려서 합으로 속도를 향상시키고 0을 곱해서 무의미한 값을 만드는 것을 방지하기 위함

print("Input :", ", ".join(map(lambda x: observations[x], input))) # 입력으로 observation의 sequence를 출력
print("Output:", ", ".join(map(lambda x: states[x], sequence))) # 출력으로는 state의 sequence를 출력
print("Prob. :", logprob) # 각 확률이 합을 제공

Input : Boots, Boots, Shoes, Shoes
Output: Rainy, Rainy, Sunny, Sunny
Prob. : -4.609853133892472


In [55]:
import numpy as np
from hmmlearn import hmm

states = ["Rainy", "Sunny"]
n_states = len(states)

observations = ["Walk", "Shop", "Clean"]
n_observations = len(observations)

# 시작 확률 : 처음 상태에서 발생 가능성 Rainy Sunny
start_probability = np.array([0.6, 0.4])

# 전이 확률 : 현재 state에서 다음 state로 갈 확률
transition_probability = np.array([
  [0.7, 0.3],#Rainy에서 Rainy, Sunny로 갈 확률
  [0.4, 0.6]
])

# 관측 확률 : 현재 state에서 observation 가능한 확률
emission_probability = np.array([
  [0.1, 0.4, 0.5], #Rainy에서 walk, shop, clean를 observation할 확률
  [0.6, 0.3, 0.1]
])

#원래 위 확률들은 training data에서 계산해서 얻어와야 하는 것들임
#예를들어 state Rainy에서 state Rainy로 가는 확률은 Maximum Likelihood Estimation 같은 것으로 한다. 예를들어 (Rainy->Rainy)/(오늘 Rainy인 날짜수)으로 0.4 도출해야함

# 모델 만들기
model = hmm. CategoricalHMM(n_components=n_states) # hmm의 CategoricalHMM 클래스 이용하고 매개변수로 state 수를 넘기기
model.startprob_ = start_probability # 초기 시작 확률
model.transmat_ = transition_probability # 전이 확률
model.emissionprob_ = emission_probability # 관측 확률을 모두 model 객체의 해당 값에 대입


# 관측 입력
input = [0, 0, 2, 1] # walk walk clean shop

# HMM 모델 호출
hmm_input = np.atleast_2d(input).T # input이 현재 1차원 형태의 1x4인데 2차원 형태의 4x1 벡터 형태로 바꿔야하므로 T 이용

logprob, sequence = model.decode(hmm_input) # model.decode(hmm_input)를 하면 비터비 알고리즘을 이용해서 가장 큰 확률값(logprob)와 순서(sequence)를 튜플로서 반환해줌
#이 때 가장 큰 확률을 곱으로 표현하는 게 아닌 log를 통해서 합으로 변형해서 확률값인 logprob를 반환함
#이는 곱은 속도가 오래 걸려서 합으로 속도를 향상시키고 0을 곱해서 무의미한 값을 만드는 것을 방지하기 위함

print("Input :", ", ".join(map(lambda x: observations[x], input))) # 입력으로 observation의 sequence를 출력
print("Output:", ", ".join(map(lambda x: states[x], sequence))) # 출력으로는 state의 sequence를 출력
print("Prob. :", logprob) # 각 확률이 합을 제공

Input : Walk, Walk, Clean, Shop
Output: Sunny, Sunny, Rainy, Rainy
Prob. : -5.331171191419115
