In [1]:
# Importando bibliotecas
import datetime as dt
import numpy as np
import pandas as pd


In [2]:
# Armazenando os dados da tabela csv em um DataFrame pandas
folhosas = pd.read_csv('Folhosas.csv')
folhosas.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
3,Alface Americana,Ibiúna,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
4,Alface Crespa,Ibiúna,"R$ 5,50",5,3,2013,2013-03-05 00:00:00


In [3]:
# Split de dados em dois DataFrames (Mogi e Ibiuna)
folhosas_mogi = folhosas[folhosas['Região'] == "Mogi das Cruzes"]
folhosas_mogi.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
6,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00
7,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00


In [4]:
# Split de dados em dois DataFrames (Mogi e Ibiuna)
folhosas_ibiuna = folhosas[folhosas['Região'] == "Ibiúna"]
folhosas_ibiuna.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
3,Alface Americana,Ibiúna,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
4,Alface Crespa,Ibiúna,"R$ 5,50",5,3,2013,2013-03-05 00:00:00
5,Alface Lisa,Ibiúna,"R$ 5,00",5,3,2013,2013-03-05 00:00:00
9,Alface Americana,Ibiúna,"R$ 4,00",12,3,2013,2013-03-12 00:00:00
10,Alface Crespa,Ibiúna,"R$ 4,00",12,3,2013,2013-03-12 00:00:00


In [5]:
# Armazenando os dados meteorologicos da tabela csv em um DataFrame pandas
inmet_sp = pd.read_csv('INMET\\SP_2013_2023.csv')
inmet_sp.head()

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,2013-01-01 00:00:00,0.0,922.3,25.8,61,1.1
1,2013-01-01 00:00:00,0.0,922.6,30.6,42,3.6
2,2013-01-01 00:00:00,0.0,922.9,30.8,44,3.1
3,2013-01-01 00:00:00,0.0,923.0,26.2,57,4.1
4,2013-01-01 00:00:00,0.0,923.1,22.6,70,0.6


In [6]:
# Armazenando os dados meteorologicos da tabela csv em um DataFrame pandas
inmet_sorocaba = pd.read_csv('INMET\\SOROCABA_2013_2023.csv')
inmet_sorocaba.head()

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,2013-01-01 00:00:00,0.0,942.6,27.1,66,2.2
1,2013-01-01 00:00:00,0.0,942.9,28.9,63,2.0
2,2013-01-01 00:00:00,0.0,943.1,30.2,56,3.5
3,2013-01-01 00:00:00,0.0,943.3,19.7,96,0.5
4,2013-01-01 00:00:00,0.0,943.4,24.3,73,0.6


In [7]:
# Limpeza de Outliers
inmet_sp = inmet_sp[(inmet_sp != -9999).all(axis=1)]
inmet_sp.loc[inmet_sp.eq(-9999).any(axis=1)]

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)


In [8]:
# Limpeza de Outliers
inmet_sorocaba = inmet_sorocaba[(inmet_sorocaba != -9999).all(axis=1)]
inmet_sorocaba.loc[inmet_sorocaba.eq(-9999).any(axis=1)]    

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)


In [9]:
# Agrupando dados por Data para descobrir a média diária de cada coluna
inmet_sp = inmet_sp.groupby(['Data']).mean()

# Resetando index para que a coluna Data não seja utilizada como tal
inmet_sp.reset_index(inplace=True)

In [10]:
# Extraindo datas de catálogo de produtos em folhosas mogi
datas_mogi = folhosas_mogi['Data'].unique()

# Encontrando a data anterior a uma semana do primeiro produto
primeira_data = pd.Timestamp(datas_mogi[0]) - dt.timedelta(days=7)

# Adicionando a primeira data as datas descobertas anteriormente
datas_mogi = pd.Series(datas_mogi)
datas_mogi = pd.concat([pd.Series([primeira_data]), datas_mogi], ignore_index=True)

# Convertendo tipo de dados
inmet_sp['Data'] = pd.to_datetime(inmet_sp['Data'])

In [15]:
# Criando um DataFrame para armazenar os dados do inmet_sp agrupados(+média) pelos intervalos das datas de catálogo em mogi
inmet_folhosas_mogi = pd.DataFrame()

# Foreach para percorrer as datas identificadas e realizar os processamentos de dados
for i in range(len(datas_mogi) - 1):
    intervalo_datas_mogi = inmet_sp[(inmet_sp['Data'] >= datas_mogi[i]) & (inmet_sp['Data'] <= datas_mogi[i+1])]

    pivot_mogi = intervalo_datas_mogi[['Média Precipitação Total (mm)', 'Média Pressão Atmosférica (mB)', 'Média Temperatura do Ar (°C)', 'Média Umidade Relativa do Ar (%)', 'Média Vento Velocidade (m/s)']].mean()
    
    pivot_mogi['Data'] = datas_mogi[i+1]
    
    inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)

inmet_folhosas_mogi.head()


  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas

Unnamed: 0,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s),Data
536,,,,,,2023-08-11 00:00:00
537,,,,,,2023-08-17 00:00:00
538,,,,,,2023-08-25 00:00:00
539,,,,,,2023-08-31 00:00:00
540,,,,,,2023-09-08 00:00:00


In [12]:
# Gerando um novo DataFrame a partir da junção dos dados de produtos e dados meteorológicos históricos de mogi
folhosas_inmet_mogi = pd.merge(folhosas_mogi,inmet_folhosas_mogi)
folhosas_inmet_mogi.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
3,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00,0.577083,924.426042,24.229688,74.755208,1.885938
4,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00,0.577083,924.426042,24.229688,74.755208,1.885938


In [13]:
# Formatação de colunas (arredondamento de casas decimais)
folhosas_inmet_mogi['Média Precipitação Total (mm)'] = folhosas_inmet_mogi['Média Precipitação Total (mm)'].round(4)
folhosas_inmet_mogi['Média Pressão Atmosférica (mB)'] = folhosas_inmet_mogi['Média Pressão Atmosférica (mB)'].round(3)
folhosas_inmet_mogi['Média Temperatura do Ar (°C)'] = folhosas_inmet_mogi['Média Temperatura do Ar (°C)'].round(2)
folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'] = folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'].round(2)
folhosas_inmet_mogi['Média Vento Velocidade (m/s)'] = folhosas_inmet_mogi['Média Vento Velocidade (m/s)'].round(2)

folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'] = folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'].astype(str) + '%'

folhosas_inmet_mogi.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
3,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00,0.5771,924.426,24.23,74.76%,1.89
4,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00,0.5771,924.426,24.23,74.76%,1.89


In [14]:
inmet = nuppa_inmet.loc[:, 'Data':'Média Vento Velocidade (m/s)']
inmet.to_csv('INMET_SP_2022_2023_filtered.csv', index = 0)

NameError: name 'nuppa_inmet' is not defined