### 변분법

 - 입력인 함수가 변할 떼 범함수의 출력이 어떻게 달라지는가를 계산하는 학문
 - 범함수
     * function y(x) $\rightarrow$ functional F $\rightarrow$ real number
     
 - 입력이 함수처럼 생겼는데 대괄호로 되어 있으면 범함수 : $F[y(x)]$
 
      - $E[p(x)] = \int^\infty_{-\infty} xp(x)dx$
      
      - $H[p(x)] = -\int^\infty_{-\infty} p(x) log p(x)dx$

---

### 최적화 기초

 - 함수가 주어졌을 때 그 값이 가장 작아지거나 가장 커지는 위치를 찾는 것
 
      - $x* = argmax_xf(x)$
      - $x* = argmin_xf(x)$
      
 #### 최소화 하려는 함수 $f(x)$ 
      - 목적함수 (objective function) 
      - 비용함수 (cost function)
      - 손실함수 (loss function) 
      - 오차함수 (error function)

---

### rosenbrock
$\rightarrow f(x,y) = (1-x)^2 + 100(y-x^2)^2$

### grid search

 - x값을 넣어보고 그 중 가장 작은 값을 선택하는 방식
 - 높은 차원(4차 이상)에서는 사용하기 힘들다는 단점.
 
### 수치적 최적화(numerical optimization)

 - 적은 횟수의 시도로 x의 위치를 찾는 방법
 
  1) 현재 위치 $x_k$가 최적점인지 판단하는 알고리즘
     
      - 필요조건
      
       1) $\nabla f = 0$ / $f' = 0$
       
       2) $g = 0$
       
      - 충분조건
      
       1) 2차 도함수의 부호까지 필요 
         - $f'' > 0 $
         - Hessian array PD $\rightarrow$ 최적점 
      
  2) 어떤 위치 $x_k$를 시도한 뒤, 다음 번 시도할 위치 $x_{k+1}$을 찾는 알고리즘
  
      - 최대경사법(Steeppest Gradient Descent / SGD)
      - $x_{k+1} = x_k - \mu\nabla f(x_k) = x_k - \mu g(x_k)$
      
 ----
 
 - 목적함수를 수식으로 알 수 있는 경우 : 2차 도함수 : Hessian array
 - 딥러닝처럼 목적함수가 수식으로 쓰여지지 않는 경우 : momentum
 
 ----
 
 #### 2차 도함수를 사용한 뉴턴 방법
 
  $x_{n+1} = x_n - [H f(x_n)]^{-1}\nabla f(x_n)$
  
   $\rightarrow$ 사람이 미분을 직접해야하는 경우가 생김 
   
 #### Auasi-Newton (준 뉴턴) 방법
 
  - BFGS (Broyden - Fletcher - Goldfarb - Shanno)
  - CG (Conjugated Gradient)
 
 ---

### Scipy 최적화

   - func: 목적함수
   - x0: 초깃값 벡터
   - jac: (옵션) 그레디언트 벡터를 출력하는 함수

---
 #### minimize() 명령의 결과는 OptimizeResult 클래스 객체로 다음 속성을 가진다.

   - x: 최적화 해
   - success: 최적화에 성공하면 True 반환
   - status: 종료 상태. 최적화에 성공하면 0 반환
   - message: 메시지 문자열
   - fun: x 위치에서의 함수의 값
   - jac: x 위치에서의 자코비안(그레디언트) 벡터의 값
   - hess_inv: x 위치에서의 헤시안 행렬의 역행렬의 값 (준 뉴턴방법)
   - nfev: 목적함수 호출 횟수
   - njev: 자코비안 계산 횟수
   - nhev: 헤시안 계산 횟수
   - nit: x 이동 횟수

In [1]:
from scipy import optimize

In [4]:
# success 값이 True == 최적화에 성공했다는 뜻
# nfev의 값을 줄이기 위해서는 def로 도함수 값을 미리 지정해서 넣어줘야 함.


def f1(x):
    return (x-2) ** 2 + 2


x0 = 0
result = sp.optimize.minimize(f1, x0)
print(result)

      fun: 2.0
 hess_inv: array([[0.5]])
      jac: array([0.])
  message: 'Optimization terminated successfully.'
     nfev: 9
      nit: 2
     njev: 3
   status: 0
  success: True
        x: array([1.99999999])


In [5]:
def f1p(x):
    return 2*(x-2)


result = sp.optimize.minimize(f1, x0, jac=f1p)
print(result)

      fun: 2.0
 hess_inv: array([[0.5]])
      jac: array([0.])
  message: 'Optimization terminated successfully.'
     nfev: 3
      nit: 2
     njev: 3
   status: 0
  success: True
        x: array([2.])


---
#### 2차원 목적함수 재정의 (벡터 입력)

In [8]:
def f2(x):
    return (1-x[0]**2 + 100.0 * (x[1] - x[0]**2)**2)


x0 = (-2, -2)
result = sp.optimize.minimize(f2, x0)
print(result)

      fun: -20246.68622892564
 hess_inv: array([[ 5.62789387e-03, -1.59855363e+00],
       [-1.59855363e+00,  4.54061320e+02]])
      jac: array([-22798.86914062,    -81.07983398])
  message: 'Maximum number of iterations has been exceeded.'
     nfev: 2064
      nit: 400
     njev: 516
   status: 1
  success: False
        x: array([ -142.35210213, 20263.71558382])


#### 연습문제 5.1.1

 - 초기점 변경
 - $\nabla f(x)$를 구현하여 $jac$ 인수로 주는 방법으로 계산속도 향상

In [67]:
def f2(x):
    return (1-x[0]**2 + 100.0 * (x[1] - x[0]**2)**2)


x0 = (0, 0)
result = sp.optimize.minimize(f2, x0, jac=None)
print(result)

      fun: 1.0
 hess_inv: array([[1, 0],
       [0, 1]])
      jac: array([-1.49011612e-08,  1.49011612e-06])
  message: 'Optimization terminated successfully.'
     nfev: 4
      nit: 0
     njev: 1
   status: 0
  success: True
        x: array([0., 0.])


In [68]:
def f2g(x):
    return np.array((2.0*(x[0]-1)-400.0 * x[0] * (x[1] - x[0]**2),
                     200.0*(x[1] - x[0]**2)))


result = sp.optimize.minimize(f2, x0, jac=f2g)
print(result)

      fun: 1.0441274516428312e-09
 hess_inv: array([[0.4999371 , 0.99981521],
       [0.99981521, 2.00451929]])
      jac: array([ 2.65674300e-08, -1.38057787e-08])
  message: 'Optimization terminated successfully.'
     nfev: 36
      nit: 23
     njev: 36
   status: 0
  success: True
        x: array([1., 1.])


In [55]:
import sympy
sympy.init_printing(use_latex='mathjax')

In [56]:
x, y = sympy.symbols('x y')

In [65]:
f = (1 - x)**2 + 100*(y - x ** 2)**2
sympy.diff(f, x)

        ⎛   2    ⎞          
- 400⋅x⋅⎝- x  + y⎠ + 2⋅x - 2

In [66]:
sympy.diff(f, y)

       2        
- 200⋅x  + 200⋅y