1. y=-0.1x^4+2x^2+x+2 의 최대값을 제시된 방법으로 구하시오

1) 미분법을 이용

In [3]:
from scipy.optimize import minimize_scalar
import numpy as np

# 4차 함수 정의
def f(x):
    return -0.1 * x**4 + 2 * x**2 + x + 2

# 함수 f(x)를 최대화하는 x를 찾는 함수 정의
def find_max():
    # 함수 f(x)의 음수를 최소화하는 x를 찾음 (최대값을 찾기 위해)
    result = minimize_scalar(lambda x: -f(x), method='bounded', bounds=(-10, 10))
    if result.success:
        return result.x, f(result.x)  # 최대값을 가진 x와 해당 위치에서의 함수 값 반환
    else:
        return None, None  # 해를 찾을 수 없는 경우 None 반환

# 최대값 찾기
max_x, max_val = find_max()

# 결과 출력
if max_x is not None:
    print("최대값을 가지는 x:", max_x)
    print("최대값:", max_val)
else:
    print("최대값을 찾을 수 없습니다.")


최대값을 가지는 x: 3.2805585009159755
최대값: 15.222484335028529


2) 뉴톤법을 이용 초기값 (x=-5)

In [5]:
import sympy as sp

# 초기값 설정
x = -5

# 함수 정의
f = -0.1 * sp.Symbol('x')**4 + 2 * sp.Symbol('x')**2 + sp.Symbol('x') + 2

# 함수 f(x)를 미분하여 f'(x)를 구함
f_prime = sp.diff(f, sp.Symbol('x'))

# 뉴턴-랩슨 반복
for _ in range(10):  # 일정 횟수 반복
    # 현재 위치에서의 함수값과 미분값 계산
    fx = f.subs(sp.Symbol('x'), x)
    fx_prime = f_prime.subs(sp.Symbol('x'), x)
    
    # 다음 위치 계산
    x = x - fx / fx_prime
    
# 최대값에서의 x값과 최대값 계산
max_x = x
max_val = f.subs(sp.Symbol('x'), max_x)

# 결과 출력
print("뉴턴-랩슨 방법을 이용한 최대값의 x:", max_x)
print("최대값:", max_val)


뉴턴-랩슨 방법을 이용한 최대값의 x: -4.33096985608591
최대값: 0


3) 경사하강법 (초기값 x=-5, 학습율 : 최대값 찾을때까지)

In [52]:
import sympy as sp

# 초기값 설정
x = -5
learning_rate = 0.001  # 학습율

# 함수 정의
f = -0.1 * sp.Symbol('x')**4 + 2 * sp.Symbol('x')**2 + sp.Symbol('x') + 2

# 함수를 최대화하는 방향으로 경사 상승법 반복
for _ in range(1000):  # 일정 횟수 반복 또는 수렴할 때까지
    # 현재 위치에서의 함수값과 그래디언트 계산
    fx = f.subs(sp.Symbol('x'), x)
    gradient = sp.diff(f, sp.Symbol('x')).subs(sp.Symbol('x'), x)
    
    # 경사 상승법 업데이트
    x = x + learning_rate * gradient
    
# 최대값 계산
max_val = f.subs(sp.Symbol('x'), x)

# 결과 출력
print("경사 하강법을 이용한 최대값의 x:", x)
print("최대값:", max_val)


경사 하강법을 이용한 최대값의 x: -3.02978713142119
최대값: 8.90290890349659


4) 유전알고리즘

In [6]:
import numpy as np
import random

# 주어진 함수 정의
def objective_function(x):
    return -0.1*x**4 + 2*x**2 + x + 2

# 후보해 생성
def initialize_population(num_candidates):
    population = []
    for _ in range(num_candidates):
        candidate = np.random.uniform(-10, 10)  # 임의의 범위에서 후보해 생성
        population.append(candidate)
    return population

# 선택 연산
def selection(population):
    fitness_scores = [objective_function(candidate) for candidate in population]
    max_fitness_index = np.argmax(fitness_scores)
    return population[max_fitness_index]

# 교차 연산
def crossover(parent1, parent2):
    crossover_point = random.uniform(0, 1)  # 교차점 비율을 0에서 1 사이에서 무작위로 선택
    child = crossover_point * parent1 + (1 - crossover_point) * parent2  # 1점 교차
    return child

# 돌연변이 연산
def mutation(candidate):
    mutation_point = random.uniform(0, 1)  # 돌연변이 발생할 위치 선택
    mutation_amount = random.uniform(-1, 1)  # 돌연변이 양 선택
    candidate += mutation_amount * mutation_point
    return candidate

# 유전 알고리즘 실행
def genetic_algorithm(num_generations):
    num_candidates = 4
    population = initialize_population(num_candidates)
    
    for generation in range(num_generations):
        parent1 = selection(population)
        parent2 = selection(population)
        child = crossover(parent1, parent2)
        
        if random.random() < 0.1:  # 돌연변이 확률 0.1
            child = mutation(child)
        
        population.append(child)
    
    best_solution = selection(population)
    return best_solution

# 유전 알고리즘 실행 및 결과 출력
best_solution = genetic_algorithm(num_generations=100)
print("최대값:", objective_function(best_solution))
print("해:", best_solution)


최대값: 15.221518475964455
해: 3.2952474741190385


3. 2개의 통신사

In [58]:
import numpy as np

# 전이 확률 행렬
transition_matrix = np.array([[0.6, 0.4], [0.2, 0.8]])

# 현재 시점에서 각 통신사에 가입한 상태 벡터
current_state_A = np.array([1, 0])  # A통신사에 가입
current_state_B = np.array([0, 1])  # B통신사에 가입

def predict_next_state(current_state, transition_matrix):
    # 다음 시점에서 각 통신사에 가입할 확률 계산
    next_state = np.dot(current_state, transition_matrix)
    return next_state

# 예측을 3번 반복
for i in range(3):
    # A통신사에 가입한 상태에서 다음 시점에서 각 통신사에 가입할 확률
    next_state_prob_A = predict_next_state(current_state_A, transition_matrix)
    print(f"{i+1}번째 예측 - 다음 시점에서 A통신사에 가입할 확률:", next_state_prob_A)
    current_state_A = next_state_prob_A
    
for i in range(3):

# B통신사에 가입한 상태에서 다음 시점에서 각 통신사에 가입할 확률
    next_state_prob_B = predict_next_state(current_state_B, transition_matrix)
    print(f"{i+1}번째 예측 - 다음 시점에서 B통신사에 가입할 확률:", next_state_prob_B)

    # 다음 시점 예측을 현재 상태로 업데이트
    
    current_state_B = next_state_prob_B


1번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.6 0.4]
2번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.44 0.56]
3번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.376 0.624]
1번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.2 0.8]
2번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.28 0.72]
3번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.312 0.688]


In [59]:
import numpy as np

# 전이 확률 행렬
transition_matrix = np.array([[0.6, 0.4],
                               [0.2, 0.8]])

# 전이 확률 행렬의 전치행렬
transition_matrix_transpose = transition_matrix.T

# 고유값과 고유벡터 계산
eigenvalues, eigenvectors = np.linalg.eig(transition_matrix_transpose)

# 안정 상태 분포는 고유값이 1인 고유벡터
stable_distribution = eigenvectors[:, np.argmax(np.abs(eigenvalues))].real
stable_distribution /= stable_distribution.sum()

print("A통신사의 장기 시장점유율:", stable_distribution[0])
print("B통신사의 장기 시장점유율:", stable_distribution[1])


A통신사의 장기 시장점유율: 0.3333333333333333
B통신사의 장기 시장점유율: 0.6666666666666667


4. 은닉마아코프 모델

In [17]:
import numpy as np

# 전이 확률 행렬
transition_matrix = np.array([[0.7, 0.2, 0.1], [0.2, 0.5, 0.3], [0.1, 0.1, 0.8]])

# 전이 확률 행렬의 전치행렬
transition_matrix_transpose = transition_matrix.T

# 고유값과 고유벡터 계산
eigenvalues, eigenvectors = np.linalg.eig(transition_matrix_transpose)

# 안정 상태 분포는 고유값이 1인 고유벡터
stable_distribution = eigenvectors[:, np.argmax(np.abs(eigenvalues))].real
stable_distribution /= stable_distribution.sum()

print("첫날에 비가 올 확률:", stable_distribution[0])
print("첫날에 구름이 낄 확률:", stable_distribution[1])
print("첫날에 해가 뜰 확률:", stable_distribution[2])


첫날에 비가 올 확률: 0.3043478260869564
첫날에 구름이 낄 확률: 0.21739130434782591
첫날에 해가 뜰 확률: 0.47826086956521774


In [37]:
import numpy as np

# 전이 확률 행렬
transition_matrix = np.array([[0.5, 0.3, 0.2],[0.2, 0.6, 0.2],[0.1, 0.2, 0.7]])

# 현재 시점에서 각 통신사에 가입한 상태 벡터
current_state_A = np.array([1, 0, 0])  # A통신사에 가입
current_state_B = np.array([0, 1, 0])  # B통신사에 가입
current_state_C = np.array([0, 0, 1])  # B통신사에 가입

def predict_next_state(current_state, transition_matrix):
    next_state = np.dot(current_state, transition_matrix)
    return next_state

for i in range(3):
    next_state_prob_A = predict_next_state(current_state_A, transition_matrix)
    print(f"{i+1}번째 예측 - 다음 시점에서 A통신사에 가입할 확률:", next_state_prob_A)
    current_state_A = next_state_prob_A
    
for i in range(3):
    next_state_prob_B = predict_next_state(current_state_B, transition_matrix)
    print(f"{i+1}번째 예측 - 다음 시점에서 B통신사에 가입할 확률:", next_state_prob_B)
    current_state_B = next_state_prob_B
    
for i in range(3):
    next_state_prob_C = predict_next_state(current_state_C, transition_matrix)
    print(f"{i+1}번째 예측 - 다음 시점에서 B통신사에 가입할 확률:", next_state_prob_C)
    current_state_C = next_state_prob_C


1번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.5 0.3 0.2]
2번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.33 0.37 0.3 ]
3번째 예측 - 다음 시점에서 A통신사에 가입할 확률: [0.269 0.381 0.35 ]
1번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.2 0.6 0.2]
2번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.24 0.46 0.3 ]
3번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.242 0.408 0.35 ]
1번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.1 0.2 0.7]
2번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.16 0.29 0.55]
3번째 예측 - 다음 시점에서 B통신사에 가입할 확률: [0.193 0.332 0.475]


In [34]:
import numpy as np

# 전이 확률 행렬 
transition_matrix = np.array([[0.996501, 0.001568, 0.001931],
                              [0.002749, 0.995678, 0.001573],
                              [0.003518 ,0.001864 ,0.994618]])

# 전이 확률 행렬의 전치행렬
transition_matrix_transpose = transition_matrix.T

# 고유값과 고유벡터 계산
eigenvalues, eigenvectors = np.linalg.eig(transition_matrix_transpose)

# 안정 상태 분포는 고유값이 1인 고유벡터
stable_distribution = eigenvectors[:, np.argmax(np.abs(eigenvalues))].real
stable_distribution /= stable_distribution.sum()

print("첫날에 비가 올 확률:", stable_distribution[0])
print("첫날에 구름이 낄 확률:", stable_distribution[1])
print("첫날에 해가 뜰 확률:", stable_distribution[2])


첫날에 비가 올 확률: 0.4708001275974967
첫날에 구름이 낄 확률: 0.27879779538167526
첫날에 해가 뜰 확률: 0.2504020770208281


In [None]:
# 시험문제
[[0.7, 0.2, 0.1], [0.2, 0.5, 0.3], [0.1, 0.1, 0.8]]
[[0.3, 0.7], [0.5, 0.5], [0.8, 0.2]]
# 수업 자료
[[0.5, 0.3, 0.2],[0.2, 0.6, 0.2],[0.1, 0.2, 0.7]]
[[0.4, 0.6], [0.6, 0.4], [0.8, 0.2]]
# 유튜브
[[0.5, 0.3, 0.2],[0.4, 0.2, 0.4],[0.0, 0.3, 0.7]]
[[0.9, 0.1], [0.6, 0.4], [0.2, 0.8]]

# 미래상태 예측 3-2
[[0.996501, 0.001568, 0.001931],[0.002749, 0.995678, 0.001573],[0.003518 ,0.001864 ,0.994618
]]

In [None]:
# 은닉마아코프모델(확률평가) 부분에서
# 상태전이확률 A = [[0.5, 0.3, 0.2],[0.2, 0.6, 0.2],[0.1, 0.2, 0.7]], 1행부터 3행의 이름은 각각 비, 구름, 해 이고, 1열부터 3열까지의 각 이름은 비, 구름, 해야.
# 각 상태에서 방출 확률 B = [[0.4, 0.6],[0.6,0.4],[0.8,0.2]] 이고 1행부터 3행의 이름은 각각 비, 구름, 해 이고, 1열, 2열의 이름은 각각 좋음, 나쁨 이라고 했을 때
# 임의의 날의 날씨가 비, 구름, 해 순서가 나올 확률을 구하는 과정을 설명해줘

In [40]:
import numpy as np

# 전이 확률 행렬 
transition_matrix = np.array([[0.5, 0.3, 0.2],[0.4, 0.2, 0.4],[0.0, 0.3, 0.7]])

# 전이 확률 행렬의 전치행렬
transition_matrix_transpose = transition_matrix.T

# 고유값과 고유벡터 계산
eigenvalues, eigenvectors = np.linalg.eig(transition_matrix_transpose)

# 안정 상태 분포는 고유값이 1인 고유벡터
stable_distribution = eigenvectors[:, np.argmax(np.abs(eigenvalues))].real
stable_distribution /= stable_distribution.sum()

print("안정 상태 분포:", stable_distribution)


안정 상태 분포: [0.21818182 0.27272727 0.50909091]


In [43]:
import numpy as np
from scipy.linalg import fractional_matrix_power

# 전이 확률 행렬 
transition_matrix = np.array([[0.5, 0.3, 0.2],[0.4, 0.2, 0.4],[0.0, 0.3, 0.7]])

# 전이 확률 행렬의 거듭제곱을 이용하여 안정 상태 분포 계산
stable_distribution = fractional_matrix_power(transition_matrix, 10000)
stable_distribution /= stable_distribution.sum()

print("안정 상태 분포:", stable_distribution)


안정 상태 분포: [[0.07272727 0.09090909 0.16969697]
 [0.07272727 0.09090909 0.16969697]
 [0.07272727 0.09090909 0.16969697]]


In [50]:
import numpy as np

# 전이 확률 행렬 
transition_matrix = np.array([[0.5, 0.3, 0.2],
                              [0.2, 0.6, 0.2],
                              [0.1, 0.2, 0.7]])

# 초기 상태 설정
initial_state = np.array([0.33, 0.33, 0.33])

# 안정 상태 분포 계산
tolerance = 1e-6
diff = 1
while diff > tolerance:
    next_state = np.dot(initial_state, transition_matrix)
    diff = np.linalg.norm(next_state - initial_state)
    initial_state = next_state

stable_distribution = initial_state

print("안정 상태 분포:", stable_distribution)


안정 상태 분포: [0.22628597 0.36771454 0.3959995 ]


In [36]:
import numpy as np

# 전이 확률 행렬 
transition_matrix = np.array([[0.5, 0.3, 0.2],
                              [0.2, 0.6, 0.2],
                              [0.1, 0.2, 0.7]])

# 전이 확률 행렬의 전치행렬
transition_matrix_transpose = transition_matrix.T

# 고유값과 고유벡터 계산
eigenvalues, eigenvectors = np.linalg.eig(transition_matrix_transpose)

# 안정 상태 분포는 고유값이 1인 고유벡터
stable_distribution = eigenvectors[:, np.argmax(np.abs(eigenvalues))].real
stable_distribution /= stable_distribution.sum()

print("첫날에 비가 올 확률:", stable_distribution[0])
print("첫날에 구름이 낄 확률:", stable_distribution[1])
print("첫날에 해가 뜰 확률:", stable_distribution[2])


첫날에 비가 올 확률: 0.22857142857142893
첫날에 구름이 낄 확률: 0.3714285714285713
첫날에 해가 뜰 확률: 0.3999999999999999


In [51]:
import numpy as np

def viterbi(A, B, initial_prob, observations):
    T = len(observations)
    N = A.shape[0]

    # 초기화
    delta = np.zeros((N, T))
    psi = np.zeros((N, T), dtype=int)

    # 초기화 단계
    delta[:, 0] = initial_prob * B[:, observations[0]]
    psi[:, 0] = 0

    # 재귀적으로 delta 와 psi 채우기
    for t in range(1, T):
        for j in range(N):
            delta[j, t] = np.max(delta[:, t-1] * A[:, j]) * B[j, observations[t]]
            psi[j, t] = np.argmax(delta[:, t-1] * A[:, j])

    # 최적 상태 시퀀스 추적
    states = np.zeros(T, dtype=int)
    states[T-1] = np.argmax(delta[:, T-1])

    for t in range(T-2, -1, -1):
        states[t] = psi[states[t+1], t+1]

    return states

# 상태전이확률과 방출확률 설정
A = np.array([[0.5, 0.3, 0.2],
              [0.2, 0.6, 0.2],
              [0.1, 0.2, 0.7]])

B = np.array([[0.4, 0.6],
              [0.6, 0.4],
              [0.8, 0.2]])

# 초기 확률
initial_prob = np.array([1/3, 1/3, 1/3])

# 관측된 상태 시퀀스
observations = [1, 0, 1]  # 좋음, 나쁨, 좋음

# Viterbi 알고리즘을 이용하여 최적 상태 시퀀스 추정
optimal_states = viterbi(A, B, initial_prob, observations)

# 최적 상태 시퀀스 출력
weather_states = ['비', '구름', '해']
weather_output = [weather_states[state] for state in optimal_states]

print("최적 상태 시퀀스:", weather_output)


최적 상태 시퀀스: ['비', '비', '비']
