# Questão 4: Regressão Linear e Correlação de Pearson

## Enunciado
A partir dos dados fornecidos de x e y, calcule o coeficiente de correlação de Pearson e determine os coeficientes a e b da reta de regressão linear (y = ax + b).

## Teoria
A regressão linear é uma técnica estatística usada para modelar a relação entre uma variável dependente (y) e uma variável independente (x). 
A fórmula da regressão linear é y = ax + b, onde 'a' é a declividade da reta e 'b' é o ponto de intercepto.

Já o coeficiente de correlação de Pearson mede o grau de relação linear entre duas variáveis, variando entre -1 e 1, onde:
- 1 indica uma correlação positiva perfeita
- 0 indica que não há correlação
- -1 indica uma correlação negativa perfeita

In [None]:

import numpy as np
import matplotlib.pyplot as plt

# ## Definindo os Dados
# Definimos os dados que serão utilizados para calcular a regressão linear e a correlação de Pearson.
x = np.array([1, 2, 3, 4])
y = np.array([4.1, 0.6, 0.3, 3.2])


## Passo a Passo para Calcular os Coeficientes da Reta de Regressão Linear (y = a1 * x + a0)

In [None]:

# 1. Calcular o número de pontos (n)
n = np.size(x)
# 2. Calcular a soma dos valores de x (Sx)
Sx = np.sum(x)
# 3. Calcular a soma dos valores de y (Sy)
Sy = np.sum(y)
# 4. Calcular a soma dos produtos de x e y (Sxy)
Sxy = np.sum(x * y)
# 5. Calcular a soma dos quadrados de x (Sxx)
Sxx = np.sum(x * x)

# 6. Calcular o coeficiente a1 (declividade da reta)
a1 = (n * Sxy - Sx * Sy) / (n * Sxx - Sx ** 2)  # Declividade (a1)
# 7. Calcular o coeficiente a0 (intercepto da reta)
a0 = (Sxx * Sy - Sxy * Sx) / (n * Sxx - Sx ** 2)  # Intercepto (a0)

# ## Resultados
print(f"Coeficiente a1 (declividade da reta): {a1:.2f}")
print(f"Coeficiente a0 (intercepto da reta): {a0:.2f}")


## Visualização da Regressão Linear

In [None]:

# Vamos visualizar os dados e a linha de regressão.
plt.scatter(x, y, color='blue', label='Dados originais')
plt.plot(x, a1 * x + a0, color='red', label=f'Regressão Linear: y = {a1:.2f}x + {a0:.2f}')
plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.title('Regressão Linear dos Dados')
plt.grid(True)
plt.show()


## Cálculo do Coeficiente de Correlação de Pearson

In [None]:

# Para calcular a correlação de Pearson:
# 1. Utilizar a função `np.corrcoef()` para obter a matriz de correlação.
# 2. Extrair o valor desejado da matriz (posição [0, 1] ou [1, 0]).
correlacao = np.corrcoef(x, y)[0, 1]
print(f"Coeficiente de correlação de Pearson: {correlacao:.2f}")


# Questão 2: Preço das Mudas de Flores

## Enunciado
Num projeto de jardinagem serão usadas 3 tipos de flores: rosas, cravos e petúnias, que são vendidas em caixas de 20 mudas cada. Comprando, respectivamente:
- (a) 10, 15 e 20 caixas, o gasto será de R$610,00;
- (b) 10, 20 e 10 caixas, o gasto será de R$580,00;
- (c) 30, 10 e 5 caixas, o gasto será de R$790,00.

Calcular o preço da muda de cada flor.

## Teoria
Este é um exemplo clássico de sistema de equações lineares. Cada equação representa o custo total de comprar uma determinada quantidade de cada tipo de flor. Podemos resolver este sistema utilizando métodos algébricos, como a eliminação de Gauss, ou, de forma mais prática, utilizando o método `np.linalg.solve()` do NumPy.

In [None]:

# ## Definindo os Dados do Sistema de Equações
quantidades = np.array([
    [10, 15, 20],
    [10, 20, 10],
    [30, 10, 5]
])

valores = np.array([610, 580, 790])


## Resolvendo o Sistema Linear

In [None]:

# Utilizamos a função `np.linalg.solve()` para encontrar os preços unitários.
unitario = np.linalg.solve(quantidades, valores)

# ## Resultado
# Preço por muda (dividindo o valor encontrado pelo número de mudas por caixa)
print(f"Preço por muda de rosa: R${unitario[0] / 20:.2f}")
print(f"Preço por muda de cravo: R${unitario[1] / 20:.2f}")
print(f"Preço por muda de petúnia: R${unitario[2] / 20:.2f}")


## Instruções para Modificar Variáveis para Outros Exercícios
- Para alterar os valores de x e y na regressão linear, simplesmente modifique as listas `x` e `y` no início do código.
- Para resolver problemas similares com diferentes tipos de flores ou quantidades, altere a matriz `quantidades` e o vetor `valores` conforme necessário.
- Certifique-se de que a matriz `quantidades` seja quadrada e compatível com o vetor `valores` para que a função `np.linalg.solve()` funcione corretamente.