### Objetivo:
Para otimizar a produ√ß√£o, evitar desperd√≠cios e garantir que voc√™ sempre tenha estoque suficiente, voc√™ decide criar um modelo machine learning para prever a quantidade de sorvetes que ser√£o vendidos com base na temperatura


### 1. Importa√ß√£o das Bibliotecas

üîπ pandas: Biblioteca para manipula√ß√£o de dados em tabelas.

üîπ XGBRegressor: Regressor do XGBoost, usado para tarefas de previs√£o num√©rica.

üîπ train_test_split: Fun√ß√£o do sklearn para dividir os dados em treino e teste.

üîπ mean_squared_error: M√©trica usada para avaliar o desempenho do modelo (erro quadr√°tico m√©dio).

In [74]:
import pandas as pd
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import LabelEncoder
import warnings

# Ignorar todos os warnings
warnings.filterwarnings('ignore')



### 2. Leitura da Tabela com os Dados

L√™ o arquivo vendas_sorvete.csv que cont√©m 3 colunas:

Data: data da venda (n√£o ser√° usada neste modelo).

Temperatura (¬∞C): temperatura registrada no dia.

Vendas de Sorvete: n√∫mero de sorvetes vendidos.

In [77]:
df = pd.read_csv("C:\\Users\\DataSets\\VendaSorvetesPrevisao\\vendas_sorvete.csv")

df.head()

Unnamed: 0,Data,Temperatura (¬∞C),Vendas de Sorvete
0,2024-01-01,27.5,113
1,2024-01-02,39.0,255
2,2024-01-03,34.6,182
3,2024-01-04,32.0,193
4,2024-01-05,23.1,176


### 3. Sele√ß√£o das Vari√°veis
X: vari√°vel independente (neste caso, Temperatura).

y: vari√°vel dependente ou alvo (a quantidade de vendas que queremos prever).

In [80]:
X = df[['Temperatura (¬∞C)']]
y = df['Vendas de Sorvete']

### 4. Divis√£o Treino/Teste

O conjunto de dados √© dividido da seguinte forma:

80% para treinamento (X_train, y_train)

20% para teste (X_test, y_test)

O par√¢metro random_state=42 garante que os resultados sejam reproduz√≠veis.

In [83]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### 5. Cria√ß√£o e Treinamento do Modelo XGBoost

üìå O modelo XGBoost √© criado com os seguintes par√¢metros:

objective='reg:squarederror': define que ser√° uma regress√£o.

n_estimators=100: n√∫mero de √°rvores que o modelo vai construir.

learning_rate=0.1: taxa de aprendizado (impacta o quanto cada √°rvore nova ajusta o erro anterior).

Depois, ele √© treinado com os dados de treino.

In [86]:
modelo = XGBRegressor(objective='reg:squarederror', n_estimators=100, learning_rate=0.1)
modelo.fit(X_train, y_train)

### 6. Avalia√ß√£o do Modelo

O modelo faz previs√µes com os dados de teste (y_pred) e o desempenho √© avaliado com a m√©trica RMSE (Root Mean Squared Error), que mostra o erro m√©dio da previs√£o em unidades de venda.

Quanto menor o RMSE, melhor o modelo.

In [89]:
y_pred = modelo.predict(X_test)
erro = mean_squared_error(y_test, y_pred, squared=False)
print(f'RMSE do Modelo: {erro:.2f}')

RMSE do Modelo: 41.35


### 7. Previs√£o de Vendas com Temperatura Futura

Aqui fazemos uma simula√ß√£o:
Se a previs√£o do tempo indicar 33.5¬∞C, quantos sorvetes devo produzir?

O modelo retorna uma previs√£o aproximada de quantas unidades devem ser vendidas, ajudando a tomar decis√µes operacionais.

In [92]:
temperatura_futura = 23.5  # previs√£o de temperatura
entrada = pd.DataFrame({'Temperatura (¬∞C)': [temperatura_futura]})
previsao = modelo.predict(entrada)
print(f'Previs√£o de Vendas: {previsao[0]:.0f} unidades')

Previs√£o de Vendas: 121 unidades
