### Objetivo:
Para otimizar a produção, evitar desperdícios e garantir que você sempre tenha estoque suficiente, você decide criar um modelo machine learning para prever a quantidade de sorvetes que serão vendidos com base na temperatura


### 1. Importação das Bibliotecas

🔹 pandas: Biblioteca para manipulação de dados em tabelas.

🔹 XGBRegressor: Regressor do XGBoost, usado para tarefas de previsão numérica.

🔹 train_test_split: Função do sklearn para dividir os dados em treino e teste.

🔹 mean_squared_error: Métrica usada para avaliar o desempenho do modelo (erro quadrático médio).

In [74]:
import pandas as pd
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import LabelEncoder
import warnings

# Ignorar todos os warnings
warnings.filterwarnings('ignore')



### 2. Leitura da Tabela com os Dados

Lê o arquivo vendas_sorvete.csv que contém 3 colunas:

Data: data da venda (não será usada neste modelo).

Temperatura (°C): temperatura registrada no dia.

Vendas de Sorvete: número de sorvetes vendidos.

In [77]:
df = pd.read_csv("C:\\Users\\DataSets\\VendaSorvetesPrevisao\\vendas_sorvete.csv")

df.head()

Unnamed: 0,Data,Temperatura (°C),Vendas de Sorvete
0,2024-01-01,27.5,113
1,2024-01-02,39.0,255
2,2024-01-03,34.6,182
3,2024-01-04,32.0,193
4,2024-01-05,23.1,176


### 3. Seleção das Variáveis
X: variável independente (neste caso, Temperatura).

y: variável dependente ou alvo (a quantidade de vendas que queremos prever).

In [80]:
X = df[['Temperatura (°C)']]
y = df['Vendas de Sorvete']

### 4. Divisão Treino/Teste

O conjunto de dados é dividido da seguinte forma:

80% para treinamento (X_train, y_train)

20% para teste (X_test, y_test)

O parâmetro random_state=42 garante que os resultados sejam reproduzíveis.

In [83]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### 5. Criação e Treinamento do Modelo XGBoost

📌 O modelo XGBoost é criado com os seguintes parâmetros:

objective='reg:squarederror': define que será uma regressão.

n_estimators=100: número de árvores que o modelo vai construir.

learning_rate=0.1: taxa de aprendizado (impacta o quanto cada árvore nova ajusta o erro anterior).

Depois, ele é treinado com os dados de treino.

In [86]:
modelo = XGBRegressor(objective='reg:squarederror', n_estimators=100, learning_rate=0.1)
modelo.fit(X_train, y_train)

### 6. Avaliação do Modelo

O modelo faz previsões com os dados de teste (y_pred) e o desempenho é avaliado com a métrica RMSE (Root Mean Squared Error), que mostra o erro médio da previsão em unidades de venda.

Quanto menor o RMSE, melhor o modelo.

In [89]:
y_pred = modelo.predict(X_test)
erro = mean_squared_error(y_test, y_pred, squared=False)
print(f'RMSE do Modelo: {erro:.2f}')

RMSE do Modelo: 41.35


### 7. Previsão de Vendas com Temperatura Futura

Aqui fazemos uma simulação:
Se a previsão do tempo indicar 33.5°C, quantos sorvetes devo produzir?

O modelo retorna uma previsão aproximada de quantas unidades devem ser vendidas, ajudando a tomar decisões operacionais.

In [92]:
temperatura_futura = 23.5  # previsão de temperatura
entrada = pd.DataFrame({'Temperatura (°C)': [temperatura_futura]})
previsao = modelo.predict(entrada)
print(f'Previsão de Vendas: {previsao[0]:.0f} unidades')

Previsão de Vendas: 121 unidades
