# Quadrados Mínimos Não-Lineares

Até agora supomos que o conjunto de dados $(x_i,y_i), i=1,\dots,m$
pode ser representado por uma função
$$f(x) = \alpha_1\phi_1(x) + \dots + \alpha_n\phi_n(x),$$
onde $\alpha$ são as incógnitas que buscamos.

No entanto, isso nem sempre é possível. Muitas vezes não temos uma forma para $f$, sabemos
apenas que depende de $\alpha$.
Em alguns casos, no entanto, podemos supor que os dados seguem um modelo não-linear **linearizável**.

## Quadrados Mínimos Não-Lineares Linearizável

Podemos supor, por exemplo, que os dados seguem um dos modelos abaixo:
$$ f(x) = \alpha_1e^{\alpha_2 x} $$
$$ f(x) = \frac{1}{\alpha_1 + \alpha_2 x} $$
$$ f(x) = \alpha_1 x^{\alpha_2} $$

Por exemplo, no primeiro caso $f(x) = \alpha_1e^{\alpha_x 2}$, se $y_i \approx f(x_i)$,
então $\ln y_i \approx \ln f(x_i)$.
Mas
$$ \ln f(x) = \ln \alpha_1 + \alpha_2 x. $$

Isso quer dizer que $g(x) = \beta_1 + \beta_2 x$ é um modelo linear para
$(x_i,\ln y_i), i=1,\dots,m$.
Podemos resolver o problema com o que já foi implementado, por exemplo, e
depois obter $\alpha_1 = e^{\beta_1}$ e $\alpha_2 = \beta_2$.

In [42]:
x = sort(rand(500))
Ta = 20
y = Ta + 80*exp(-3*x) + rand(500)*9

using Plots
gr()

scatter(x, y, ms=3)

In [44]:
scatter(x, log(y - Ta), ms=3)

In [39]:
lny = log(y-Ta)

A = [ones(500) x]
β = A\lny
α = [exp(β[1]); β[2]]

2-element Array{Float64,1}:
 76.1639 
 -2.33419

In [41]:
scatter(x, y, ms=3)
plot!(x, Ta + α[1]*exp(α[2]*x), c=:red, lw=2)

No caso $f(x) = \alpha_1x^{\alpha_2}$, a transformação também é $\ln f(x)$, obtendo
$$ \ln f(x) = \ln \alpha_1 + \alpha_2\ln x, $$
e aí $g(x) = \beta_1 + \beta_2\ln x$ é um modelo para $(x_i,\ln y_i)$, ou
$h(x) = \beta_1 + \beta_2x$ é um modelo polinomial para $(\ln x_i,\ln y_i)$.

No caso $f(x) = \dfrac{1}{\alpha_1 + \alpha_2 x}$, a transformação é $\dfrac{1}{f(x)}$.

A pergunta nesses casos é, tendo os dados, como saber qual a linearização?
Nesses casos, uma alternativa é tentar os gráficos das modificações.

In [48]:
x = sort(rand(500)*3 + 1)
y = 2.1*x.^(5.5) + rand(500)*1.5
scatter(x, y, ms=3)

In [49]:
scatter(x, log(y), ms=3)

In [50]:
scatter(log(x), log(y), ms=3)

In [51]:
scatter(x, 1./y, ms=3)

In [67]:
x = sort(rand(500)*3 + 1)
y = 1./(0.3 + 0.5*x + rand(500)*0.05)
scatter(x, y, ms=3)

In [68]:
scatter(x, log(y), ms=3)

In [69]:
scatter(log(x), log(y), ms=3)

In [74]:
A = [ones(500) log(x)]
β = A\log(y)
α = [exp(β[1]); β[2]]

scatter(x, y, ms=3)
plot!(x, α[1]*x.^(α[2]), c=:red, lw=2)

In [72]:
scatter(x, 1./y, ms=3)

In [75]:
A = [ones(500) x]
α = A\(1./y)

scatter(x, y, ms=3)
plot!(x, 1./(α[1] + α[2]*x), c=:red, lw=2)

In [111]:
#t = sort(rand(10)*10)
m = 100
t = collect(linspace(0, 10, m))
T = 20 + 80*exp(-t) + rand(m)*5
scatter(t, T, ms=3)

In [112]:
# Modelo
f(α) = α[1] + α[2]*exp(α[3]*t)
r(α) = T - f(α)

r (generic function with 1 method)

In [113]:
r(zeros(3))

100-element Array{Float64,1}:
 101.529 
  96.2051
  87.6802
  79.8988
  74.2913
  71.3817
  65.6363
  59.9049
  58.4965
  52.5302
  52.7303
  46.8354
  46.0915
   ⋮     
  21.8079
  22.8658
  20.7713
  23.3152
  23.5196
  22.3459
  24.5539
  24.483 
  22.5901
  20.097 
  21.3338
  22.8379

In [114]:
J(α) = [-ones(m) -exp(α[3]*t) -α[2]*t.*exp(α[3]*t)]

J (generic function with 1 method)

In [123]:
J(zeros(3))

100x3 Array{Float64,2}:
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
  ⋮              
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0
 -1.0  -1.0  -0.0

In [122]:
J([20; 80; -1])

100x3 Array{Float64,2}:
 -1.0  -1.0           -0.0      
 -1.0  -0.903924      -7.30444  
 -1.0  -0.817078     -13.2053   
 -1.0  -0.738577     -17.9049   
 -1.0  -0.667617     -21.5795   
 -1.0  -0.603475     -24.3828   
 -1.0  -0.545496     -26.4483   
 -1.0  -0.493086     -27.8918   
 -1.0  -0.445713     -28.8137   
 -1.0  -0.40289      -29.3011   
 -1.0  -0.364182     -29.4289   
 -1.0  -0.329193     -29.2616   
 -1.0  -0.297565     -28.8548   
  ⋮                             
 -1.0  -0.000137913   -0.0980713
 -1.0  -0.000124663   -0.0896564
 -1.0  -0.000112686   -0.0819531
 -1.0  -0.000101859   -0.0749025
 -1.0  -9.2073e-5     -0.0684502
 -1.0  -8.32269e-5    -0.0625463
 -1.0  -7.52308e-5    -0.057145 
 -1.0  -6.80029e-5    -0.0522043
 -1.0  -6.14695e-5    -0.0476854
 -1.0  -5.55637e-5    -0.043553 
 -1.0  -5.02254e-5    -0.0397744
 -1.0  -4.53999e-5    -0.0363199

In [143]:
α = [20.0; 50.0; -1.0] # Ponto inicial
#α = ones(3)

3-element Array{Float64,1}:
 20.0
 50.0
 -1.0

In [153]:
d = -(J(α)'*J(α)) \ (J(α)'*r(α))
α = α + d

3-element Array{Float64,1}:
 22.6542 
 79.4368 
 -1.01834

In [154]:
r(α)

100-element Array{Float64,1}:
 -0.56189  
  1.87899  
  0.359957 
 -1.10038  
 -1.0047   
  1.23146  
  0.128743 
 -1.41379  
  0.957245 
 -1.59904  
  1.67767  
 -1.44126  
  0.319412 
  ⋮        
 -0.855582 
  0.203231 
 -1.89044  
  0.654145 
  0.85922  
 -0.313864 
  1.89465  
  1.82427  
 -0.0682245
 -2.56086  
 -1.32368  
  0.180736 

In [155]:
scatter(t, T, ms=3)
plot!(t, f(α), c=:red, lw=2)