In [None]:
# 📌 Imports
import sqlite3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# ✅ Geração de dados simulados
np.random.seed(42)
idades = np.random.randint(10, 60, 100)
gastos = np.random.randint(10, 100, 100)
avaliacoes = (0.3 * idades + 0.7 * gastos + np.random.normal(0, 5, 100)).round(1)

dados = pd.DataFrame({
    'nome': [f'Pessoa{i+1}' for i in range(100)],
    'idade': idades,
    'gasto': gastos,
    'avaliacao': avaliacoes
})

# 💾 Criação do banco SQLite
conn = sqlite3.connect(':memory:')
dados.to_sql('festa', conn, index=False, if_exists='replace')

# 🔍 4 consultas SQL
print(pd.read_sql("SELECT * FROM festa LIMIT 5", conn))
print(pd.read_sql("SELECT AVG(avaliacao) as media_avaliacao FROM festa", conn))
print(pd.read_sql("SELECT gasto, AVG(avaliacao) as media FROM festa GROUP BY gasto ORDER BY gasto DESC LIMIT 5", conn))
print(pd.read_sql("SELECT * FROM festa WHERE idade > 30 AND gasto > 50", conn))

# 📈 Regressão Linear
X = dados[['idade', 'gasto']]
y = dados['avaliacao']
modelo = LinearRegression()
modelo.fit(X, y)

print("Coeficientes:", modelo.coef_)
print("Intercepto:", modelo.intercept_)

# Previsão com novos dados manuais
novo = pd.DataFrame({'idade': [25, 40], 'gasto': [60, 80]})
prev = modelo.predict(novo)
print("Previsão novas pessoas:", prev)

# Gráfico (opcional no Colab)
plt.scatter(dados['gasto'], dados['avaliacao'], color='blue')
plt.xlabel('Gasto')
plt.ylabel('Avaliação')
plt.title('Gasto vs Avaliação')
plt.show()

# Exportação opcional
dados.to_csv('dados_festa_junina.csv', index=False)
