### IMPORTANDO BIBLIOTECAS

In [16]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from scipy.stats import shapiro
import google.generativeai as genai
import os

### IMPORTANDO BASE DE TESTE

In [17]:
df = pd.read_csv('base_teste.csv')

### FUNÇÕES PARA EFETUAR A VERIFICAÇÃO DA NORMALIZAÇÃO, NORMALIZAÇÃO, PADRONIZAÇÃO E DESNORMALIZAÇÃO

In [18]:
# Funções para normalização e padronização
def normalizar(x):
    return (x - np.min(x)) / (np.max(x) - np.min(x))

def padronizar(x):
    return (x - np.mean(x)) / np.std(x)

def verifica_normalidade(dataframe, coluna):
    coluna_data = dataframe[coluna]
    statistic, p_valor = shapiro(coluna_data)
    nivel_significancia = 0.1
    if p_valor > nivel_significancia:
        print(f"A coluna '{coluna}' segue uma distribuição normal")
        return True
    else:
        print(f"A coluna '{coluna}' não segue uma distribuição normal")
        return False
def desnormaliza(valor_normalizado, min_original, max_original):
    return valor_normalizado * (max_original - min_original) + min_original


### APLICANDO NORMALIZAÇÃO AOS DADOS

In [19]:
for coluna in ['Temperatura Média (°C)', 'Precipitação (mm)', 'Umidade Relativa (%)', 
               'Velocidade do Vento (km/h)', 'pH Médio', 'Nível de Nitrogênio (ppm)', 
               'Nível de Fósforo (ppm)', 'Nível de Potássio (ppm)', 'Vendas de Fertilizantes']:
    if verifica_normalidade(df, coluna):
        df[coluna] = padronizar(df[coluna])
    else:
        df[coluna] = normalizar(df[coluna])

A coluna 'Temperatura Média (°C)' não segue uma distribuição normal
A coluna 'Precipitação (mm)' não segue uma distribuição normal
A coluna 'Umidade Relativa (%)' não segue uma distribuição normal
A coluna 'Velocidade do Vento (km/h)' não segue uma distribuição normal
A coluna 'pH Médio' não segue uma distribuição normal
A coluna 'Nível de Nitrogênio (ppm)' não segue uma distribuição normal
A coluna 'Nível de Fósforo (ppm)' não segue uma distribuição normal
A coluna 'Nível de Potássio (ppm)' não segue uma distribuição normal
A coluna 'Vendas de Fertilizantes' não segue uma distribuição normal


### APLICANDO ONE HOT ENCONDING

In [20]:
df = pd.get_dummies(df, columns=['Região', 'Ano', 'Mês', 'Tipo de Solo', 'Tipo de Fertilizante'])

### SUBSTITUIÇÃO DO GPT PELO ALGORITMO DE IA (RandomForestRegressor)

In [21]:
X = df.drop(columns=['Vendas de Fertilizantes'])
y = df['Vendas de Fertilizantes']

In [22]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [23]:
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [24]:
df['Previsão de Vendas'] = modelo.predict(X)


In [25]:
resultados = []
regioes = [col for col in df.columns if 'Região_' in col]
meses = [col for col in df.columns if 'Mês_' in col]

for regiao in regioes:
    for mes in meses:
        df_regiao_mes = df[(df[regiao] == 1) & (df[mes] == 1)]
        if not df_regiao_mes.empty:
            previsao = df_regiao_mes['Previsão de Vendas'].mean()
            media_vendas_historica = df_regiao_mes['Vendas de Fertilizantes'].mean()
            temperatura_media = df_regiao_mes['Temperatura Média (°C)'].mean()
            
            resultados.append({
                'Região': regiao,
                'Previsão de Vendas': previsao,
                'Mês': mes,
                'Média de Vendas Histórica': media_vendas_historica,
                'Temperatura Média (°C)': temperatura_media
            })


### DESNORMALIZANDO DADOS

In [26]:
df_puro = pd.read_csv('base_teste.csv')
TEMPERATURA = df_puro['Temperatura Média (°C)'].min(), df_puro['Temperatura Média (°C)'].max()
VENDAS = df_puro['Vendas de Fertilizantes'].min(), df_puro['Vendas de Fertilizantes'].max()


In [27]:
for i in resultados:
    i['Previsão de Vendas'] = desnormaliza(i['Previsão de Vendas'], VENDAS[0], VENDAS[1])
    i['Média de Vendas Histórica'] = desnormaliza(i['Média de Vendas Histórica'], VENDAS[0], VENDAS[1])
    i['Temperatura Média (°C)'] = desnormaliza(i['Temperatura Média (°C)'], TEMPERATURA[0], TEMPERATURA[1])


In [28]:
for resultado in resultados:
    print(resultado)

{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5751.385778039695, 'Mês': 'Mês_Abr', 'Média de Vendas Histórica': 5750.0, 'Temperatura Média (°C)': 27.5}
{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5603.389775924468, 'Mês': 'Mês_Ago', 'Média de Vendas Histórica': 5600.0, 'Temperatura Média (°C)': 25.0}
{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5605.390466492966, 'Mês': 'Mês_Dez', 'Média de Vendas Histórica': 5600.0, 'Temperatura Média (°C)': 25.0}
{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5846.702736638541, 'Mês': 'Mês_Fev', 'Média de Vendas Histórica': 5850.0, 'Temperatura Média (°C)': 28.0}
{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5803.787014820205, 'Mês': 'Mês_Jan', 'Média de Vendas Histórica': 5800.0, 'Temperatura Média (°C)': 27.5}
{'Região': 'Região_Centro-Oeste', 'Previsão de Vendas': 5601.0021279727125, 'Mês': 'Mês_Jul', 'Média de Vendas Histórica': 5600.0, 'Temperatura Média (°C)': 24.5}
{'Região': 'Região_Centro-O

### INTEGRANDO COM GEMINI AI

In [39]:
genai.configure(api_key="AIzaSyB_azM6UNLE9vPDULJPSHwankxhiTOZLpg")

In [None]:
model = genai.GenerativeModel("gemini-1.5-flash")

In [53]:
prompt = "Considerando a seguinte série histórica:\n"

# Adicionando todos os dados ao prompt
for resultado in resultados:
    prompt += (f"Região: {resultado['Região']}, "
               f"Mês: {resultado['Mês']}, "
               f"Previsão de Vendas: {resultado['Previsão de Vendas']}, "
               f"Média de Vendas Histórica: {resultado['Média de Vendas Histórica']}, "
               f"Temperatura Média: {resultado['Temperatura Média (°C)']}°C\n")

prompt += "Quais são os insights para previsão de vendas com base nesses dados? Me de insigths concretos sobre os meses e fertlizantes"

# Gerando o insight para toda a base
response = model.generate_content(prompt)

# Imprimindo a resposta
print(response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "## Insights sobre Previs\u00e3o de Vendas e Temperatura:\n\n**1. Venda M\u00e9dia por Regi\u00e3o:**\n\n* **Regi\u00e3o Norte:** Maior m\u00e9dia de vendas (6750.0)\n* **Regi\u00e3o Nordeste:**  Segunda maior m\u00e9dia de vendas (6250.0)\n* **Regi\u00e3o Centro-Oeste:** Terceira maior m\u00e9dia de vendas (5750.0)\n* **Regi\u00e3o Sudeste:**  Quarta maior m\u00e9dia de vendas (5733.33)\n* **Regi\u00e3o Sul:** Menor m\u00e9dia de vendas (4750.0)\n\n**2. Influ\u00eancia da Temperatura nas Vendas:**\n\n* **Tend\u00eancia geral:** Existe uma correla\u00e7\u00e3o positiva entre temperatura e vendas. Regi\u00f5es com temperaturas mais altas tendem a apresentar maiores previs\u00f5es de vendas.\n* **Exce\u00e7\u00f5es:** A regi\u00e3o Sudeste apresenta um comporta