### üß† Se√ß√£o 6: O Ajuste de Curvas Cl√°ssico com `scipy`

Agora que entendemos o "qu√™" e o "porqu√™", vamos ao "como". Nesta se√ß√£o, vamos usar a principal ferramenta do Python para ajuste de curvas, `scipy.optimize.curve_fit`, para encontrar os par√¢metros de um modelo te√≥rico que descreve um fen√¥meno de crescimento.

#### 6.1. Cen√°rio: Modelando Crescimento com Satura√ß√£o (Curva Log√≠stica)

Muitos processos na natureza n√£o crescem indefinidamente. Eles come√ßam devagar, aceleram e depois desaceleram √† medida que se aproximam de um limite m√°ximo (satura√ß√£o). Pense na prolifera√ß√£o de uma cultura de bact√©rias em uma placa de Petri, na dissemina√ß√£o de uma not√≠cia em uma rede social ou na ado√ß√£o de uma nova tecnologia no mercado.

Este processo √© frequentemente descrito pela **fun√ß√£o log√≠stica** ou **curva sigmoidal**:

$$ y(x) = \frac{L}{1 + e^{-k(x-x_0)}} $$

Diferente dos modelos da Parte I, aqui os par√¢metros t√™m uma interpreta√ß√£o f√≠sica direta:
* **$L$**: O **limite m√°ximo** da curva (a "capacidade de carga" ou o valor de satura√ß√£o).
* **$x_0$**: O **ponto m√©dio** da curva (o ponto no eixo X onde a curva atinge $L/2$ e o crescimento √© mais r√°pido).
* **$k$**: A **taxa de crescimento** ou a "inclina√ß√£o" da curva.

Nosso objetivo √© usar um conjunto de dados "experimentais" para estimar os valores verdadeiros de $L, k$ e $x_0$.

Primeiro, vamos definir e gerar os dados para este cen√°rio.

In [1]:
# Importar a biblioteca de otimiza√ß√£o do SciPy
from scipy.optimize import curve_fit

# 1. Definir a fun√ß√£o do nosso modelo te√≥rico
def modelo_logistico(x, L, k, x0):
    """
    Fun√ß√£o log√≠stica com par√¢metros:
    L: Valor m√°ximo
    k: Taxa de crescimento
    x0: Ponto m√©dio
    """
    return L / (1 + np.exp(-k * (x - x0)))

# 2. Definir os par√¢metros "reais" para gerar nossos dados
L_real = 120.0  # Limite m√°ximo de 120 unidades
k_real = 0.2    # Taxa de crescimento
x0_real = 50.0  # O crescimento atinge o pico no tempo x=50

# Gerar o eixo X (ex: 100 dias de observa√ß√£o)
x_data = np.linspace(0, 100, 100)

# Calcular os valores de Y usando o modelo e os par√¢metros reais
y_real = modelo_logistico(x_data, L_real, k_real, x0_real)

# Adicionar ru√≠do para simular dados experimentais
ruido = np.random.normal(0, 3.5, size=x_data.size)
y_data = y_real + ruido

# 3. Visualizar nossos dados "experimentais"
plt.figure(figsize=(12, 7))
sns.scatterplot(x=x_data, y=y_data, label='Dados Experimentais')
plt.title('Dados de Crescimento Log√≠stico com Ru√≠do', fontsize=16)
plt.xlabel('Tempo (dias)', fontsize=12)
plt.ylabel('Popula√ß√£o / Vendas', fontsize=12)
plt.legend()
plt.grid(True)
plt.show()

NameError: name 'np' is not defined

#### 6.2. Ajuste com `curve_fit` e a Import√¢ncia das Estimativas Iniciais (`p0`)

O algoritmo por tr√°s do `curve_fit` √© um otimizador que precisa de um ponto de partida para come√ßar sua busca pelos melhores par√¢metros. Para fun√ß√µes simples, ele geralmente se vira bem sozinho. Mas para modelos com m√∫ltiplos par√¢metros, como o nosso, um "chute" inicial ruim pode fazer com que o algoritmo n√£o encontre a solu√ß√£o correta (n√£o "convirja").

Felizmente, podemos guiar o otimizador fornecendo estimativas iniciais (`p0`), que podemos extrair simplesmente olhando para o gr√°fico:
* **Estimativa para `L`**: O valor m√°ximo que os dados atingem. Olhando o gr√°fico, parece ser em torno de 120.
* **Estimativa para `x0`**: O valor de `x` onde a curva parece estar na metade da sua altura m√°xima (metade de 120, ou 60). Olhando o gr√°fico, isso acontece perto de `x=50`.
* **Estimativa para `k`**: Esta √© a mais dif√≠cil de estimar visualmente, mas ela representa a inclina√ß√£o. Um valor pequeno e positivo como `0.1` ou `0.2` √© um bom chute inicial.

Vamos fornecer essas dicas ao `curve_fit` para garantir um bom resultado.

In [None]:
# 1. Definir nossas estimativas iniciais (p0)
#          [L,   k,   x0]
p0 = [120.0, 0.2, 50.0]

# 2. Usar curve_fit com as estimativas iniciais
# popt: cont√©m os par√¢metros √≥timos encontrados
# pcov: cont√©m a matriz de covari√¢ncia, que usaremos para estimar o erro
popt, pcov = curve_fit(modelo_logistico, x_data, y_data, p0=p0)

# 3. Extrair os par√¢metros e seus erros
L_est, k_est, x0_est = popt
erros = np.sqrt(np.diag(pcov))
L_err, k_err, x0_err = erros

# 4. Apresentar os resultados de forma clara
print("--- Resultados do Ajuste N√£o-Linear ---")
print(f"Par√¢metro L (Limite M√°ximo): {L_est:.2f} ¬± {L_err:.2f} (Real: {L_real})")
print(f"Par√¢metro k (Taxa de Crescimento): {k_est:.3f} ¬± {k_err:.3f} (Real: {k_real})")
print(f"Par√¢metro x0 (Ponto M√©dio): {x0_est:.2f} ¬± {x0_err:.2f} (Real: {x0_real})")
print("\nOs valores estimados s√£o muito pr√≥ximos dos valores reais!")

# 5. Visualizar o ajuste final
plt.figure(figsize=(12, 7))
sns.scatterplot(x=x_data, y=y_data, label='Dados Experimentais', alpha=0.7)
plt.plot(x_data, modelo_logistico(x_data, *popt), color='red', linewidth=3, label='Curva Ajustada')
plt.title('Ajuste do Modelo Log√≠stico aos Dados', fontsize=16)
plt.xlabel('Tempo (dias)', fontsize=12)
plt.ylabel('Popula√ß√£o / Vendas', fontsize=12)
plt.legend()
plt.grid(True)
plt.show()