# Ajuste linear: parte 2

Nem todo modelo que vamos precisar ajustar é linear. Entretanto, em algumas situações onde podemos usar uma abordagem semelhante. Vejamos alguns casos.

## Linearização de modelos

Ajustes lineares servem pra muitos modelos, não somente para equações lineares. Você provavelmente já fez algo assim no laboratório de Física. Praticamente qualquer função que possua inversa pode ser linearizada, sendo um modelo adequado para um ajuste linear. Considere uma função na forma

$$
y(x) = a + b\ f(x).
$$

Fazendo uma substituição direta $u = f(x)$ ficamos com,

$$
y(u) = a + b u.
$$

Neste caso, precisamos converter os $x_i$ para $u_i = f(x_i)$, e depois fazer o ajuste normalmente de $y(u)$ aos dados $u_i$ e $y_i$.

Por exemplo, seja uma função

\begin{align}
y(x) &= a + b \sqrt x
\end{align}

Aqui, fazemos $u_i = \sqrt{x_i}$, e ajustamos $y(u) = a + b u$.

### Exponencial
Quando temos como modelo uma função exponencial, podemos tomar logaritmo dos dois lados. Neste caso,

\begin{align}
y(x) &= a\mathrm{e}^{bx} \\
\ln y(x) &= \ln a + b x.
\end{align}

A substituição neste caso é $v = \ln y(x)$. Calculamos os valores $v_i = \ln y_i$, e ajustamos $v(x)$ a $x_i$ e $v_i$.

### Lei de potência
No caso de uma lei de potência do tipo

\begin{align}
y(x) &= c x^b,
\end{align}

novamente tomamos o logaritmo dos dois lados. Assim,

\begin{align}
\ln y(x) &= \ln \left(c x^b \right) \\
\ln y(x) &= \ln c + b\ \ln x.
\end{align}

Fazemos duas substituições, $u = \ln x$ e $v = \ln y(x)$. Do mesmo modo, calculamos $u_i = \ln x_i$ e $v_i = \ln y_i$.
Basta então ajustar $v(u) = a + b u$, com $a = \ln c$, aos dados $u_i$ e $v_i$.

### Exercício

A terceira lei de Kepler relaciona as distâncias dos planetas até o Sol com o período de suas órbitas. Vamos tentar redescobrir esta lei usando técnicas um pouco mais modernas, explorando os dados da tabela abaixo. A coluna $R$ dá o semi-eixo maior da órbita do planeta, em unidades astronômicas ($\mathrm{au}$), onde
$1\,\mathrm{au} = 1.495978707 \times 10^{11}\,\mathrm{m}$ é a distância média entre a Terra e o Sol. A Coluna $T$ contém o período orbital, em anos.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('ggplot')
plt.rcParams['font.family'] = 'serif'
plt.rcParams['mathtext.fontset'] = 'stix'

In [None]:
# Tabela de dados.
# Fonte: Solar System Dynamics - JPL/NASA
# Períodos: https://ssd.jpl.nasa.gov/?planet_phys_par
# Distâncias: https://ssd.jpl.nasa.gov/txt/p_elem_t1.txt
planetas = np.array([('Mercúrio', 0.38709927,   0.2408467),
                     ('Vênus',    0.72333566,   0.61519726),
                     ('Terra',    1.00000261,   1.0000174),
                     ('Marte',    1.52371034,   1.8808476),
                     ('Júpiter',  5.20288700,  11.862615),
                     ('Saturno',  9.53667594,  29.447498),
                     ('Urano',   19.18916464,  84.016846),
                     ('Netuno',  30.06992276, 164.79132),
                     ('Plutão 😢',  39.48211675, 247.92065)],
                    dtype=[('nome', 'U8'), ('R', 'float64'), ('T', 'float64')])

# Variáveis com arrays para acesso rápido.
nome = planetas['nome']
R = planetas['R']
T = planetas['T']

**a.** Faça um gráfico da distância em função do período, usando escala logarítmica nos dois eixos. *Sugestão*: não ligue os pontos com linhas interpoladas. Use a função `ax.scatter(x, y)`.

**b.** Se tudo correu bem, você vai ver que os pontos formam aproximadamente uma linha reta no gráfico em escala logarítmica. Proponha um modelo linear, e determine qual a lei empírica $R(T)$.

**c.** Escrevendo o código explicitamente, faça um ajuste linear e imprima os valores dos coeficiente $a$ e $b$. Como não temos dados de incerteza, admita que as incertezas são todas iguais a 1.

Faça novamente o gráfico com os dados, agora sobrepondo o modelo ajustado.

Estes são dados parecidos com os que Kepler usou para determinar a sua terceira lei. Relembrando,

$$
\frac{R^3}{T^2} \cong 1\,\mathrm{au}^3\,\mathrm{a}^{-2}{,}\ \mathrm{constante}.
$$

Essa constante é obviamente próxima de 1, pois usamos a órbita da Terra para definir unidade astronômica e ano. Com o desenvolvimento da mecânica, Newton demonstrou que a terceira lei de Kepler é descrita por

$$
\frac{R^3}{T^2} = \frac{G (M_\odot + m)}{4 \pi^2} \cong \frac{G M_\odot}{4 \pi^2},
$$

onde $G$ é a constante gravitacional, $M_\odot$ é a massa do Sol, e $m$ é a massa do planeta (desprezível para nossos propósitos).

**d.** Relacione seu modelo empríco com a equação acima, para entender o papel dos coeficientes angular e linear.

**e.** Se tudo correu bem, você descobriu que o coeficiente linear está relacionado à constante gravitacional $G$ e à massa do Sol $M_\odot$. Sabemos que a constante $G$ é universal, e pode ser medida por meios independentes, aqui mesmo na Terra.

Assim, usando o coeficiente linear que você ajustou, calcule e imprima a massa do Sol, em quilogramas. Use $G = 6.67430 \times 10^{-11}\,\mathrm{m}^3\,\mathrm{kg}^{-1}\,\mathrm{s}^{-2}$. Lembre-se de converter, ou, nas unidades do nosso problema, sabendo que um ano tem $365.25$ dias.

Imprima também o erro relativo ao valor "oficial", $M_\odot = (1.98847 \pm 0.00007) \times 10^{30}\,\mathrm{kg}$. Este valor também foi obtido usando a Lei de Kepler, porém com mais dados e um modelo mais detalhado.

## Conclusão

Aprendemos uma ferramenta simples, porém poderosa, de análise de dados experimentais: o ajuste linear. A solução do ajuste linear é analítica, logo temos uma solução direta. Quando um modelo não é linear, nem mesmo linearizável (pense numa função definida como uma integral, como vimos na semanas 3 e 4), existem outras alternativas mais complexas de ajuste. A maioria envolve uma busca inteligente no espaço de parâmetros, e requer muita atenção para saber se de fato encontramos o melhor ajuste.