In [63]:
# Importando bibliotecas
import datetime as dt
import numpy as np
import pandas as pd
pd.set_option("display.max_rows", None)

In [64]:
# Armazenando os dados da tabela csv em um DataFrame pandas
folhosas = pd.read_csv('Folhosas.csv')
folhosas.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
3,Alface Americana,Ibiúna,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
4,Alface Crespa,Ibiúna,"R$ 5,50",5,3,2013,2013-03-05 00:00:00


In [65]:
# Split de dados em dois DataFrames (Mogi e Ibiuna)
folhosas_mogi = folhosas[folhosas['Região'] == "Mogi das Cruzes"]
folhosas_mogi.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
6,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00
7,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00


In [66]:
# Split de dados em dois DataFrames (Mogi e Ibiuna)
folhosas_ibiuna = folhosas[folhosas['Região'] == "Ibiúna"]
folhosas_ibiuna.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data
3,Alface Americana,Ibiúna,"R$ 8,00",5,3,2013,2013-03-05 00:00:00
4,Alface Crespa,Ibiúna,"R$ 5,50",5,3,2013,2013-03-05 00:00:00
5,Alface Lisa,Ibiúna,"R$ 5,00",5,3,2013,2013-03-05 00:00:00
9,Alface Americana,Ibiúna,"R$ 4,00",12,3,2013,2013-03-12 00:00:00
10,Alface Crespa,Ibiúna,"R$ 4,00",12,3,2013,2013-03-12 00:00:00


In [67]:
# Armazenando os dados da tabela csv em um DataFrame pandas
inmet_sp = pd.read_csv('INMET\\SP_2013_2023.csv')
inmet_sp.head(24)

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,2013-01-01 00:00:00,0.0,922.3,25.8,61,1.1
1,2013-01-01 00:00:00,0.0,922.6,30.6,42,3.6
2,2013-01-01 00:00:00,0.0,922.9,30.8,44,3.1
3,2013-01-01 00:00:00,0.0,923.0,26.2,57,4.1
4,2013-01-01 00:00:00,0.0,923.1,22.6,70,0.6
5,2013-01-01 00:00:00,0.0,923.3,22.4,74,0.4
6,2013-01-01 00:00:00,0.0,923.5,29.5,46,4.8
7,2013-01-01 00:00:00,0.0,923.6,22.7,70,2.5
8,2013-01-01 00:00:00,0.0,923.7,22.0,75,0.1
9,2013-01-01 00:00:00,0.0,923.7,22.5,73,1.1


In [68]:
# Limpeza de Outliers
inmet_sp = inmet_sp[(inmet_sp != -9999).all(axis=1)]
inmet_sp.loc[inmet_sp.eq(-9999).any(axis=1)]

Unnamed: 0,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)


In [69]:
# Agrupando dados por Data para descobrir a média diária de cada coluna
inmet_sp = inmet_sp.groupby(['Data']).mean()

# Resetando index para que a coluna Data não seja utilizada como tal
inmet_sp.reset_index(inplace=True)

In [124]:
# Extraindo datas de catálogo de produtos em folhosas mogi
datas_mogi = folhosas_mogi['Data'].unique()

# Encontrando a data anterior a uma semana do primeiro produto
primeira_data = pd.Timestamp(datas_mogi[0]) - dt.timedelta(days=7)

# Adicionando a primeira data as datas descobertas anteriormente
datas_mogi = pd.Series(datas_mogi)
datas_mogi = pd.concat([pd.Series([primeira_data]), datas_mogi], ignore_index=True)

# Convertendo tipo de dados
inmet_sp['Data'] = pd.to_datetime(inmet_sp['Data'])

In [132]:
# Criando um DataFrame para armazenar os dados do inmet_sp agrupados(+média) pelos intervalos das datas de catálogo em mogi
inmet_folhosas_mogi = pd.DataFrame()

# Foreach para percorrer as datas identificadas e realizar os processamentos de dados
for i in range(len(datas_mogi) - 1):
    intervalo_datas_mogi = inmet_sp[(inmet_sp['Data'] >= datas_mogi[i]) & (inmet_sp['Data'] <= datas_mogi[i+1])]

    pivot_mogi = intervalo_datas_mogi[['Média Precipitação Total (mm)', 'Média Pressão Atmosférica (mB)', 'Média Temperatura do Ar (°C)', 'Média Umidade Relativa do Ar (%)', 'Média Vento Velocidade (m/s)']].mean()
    
    pivot_mogi['Data'] = datas_mogi[i+1]
    
    inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)

inmet_folhosas_mogi.head(10)


  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas_mogi = inmet_folhosas_mogi.append(pivot_mogi, ignore_index=True)
  inmet_folhosas

Unnamed: 0,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s),Data
0,0.122917,925.892708,23.46875,69.192708,2.235938,2013-03-05 00:00:00
1,0.577083,924.426042,24.229688,74.755208,1.885938,2013-03-12 00:00:00
2,0.21875,926.285417,20.897917,81.979167,2.497396,2013-03-19 00:00:00
3,0.110417,926.019271,20.097396,81.619792,1.883333,2013-03-26 00:00:00
4,0.033333,927.983805,20.732738,77.031746,1.844841,2013-04-02 00:00:00
5,0.145833,925.641146,21.614583,80.401042,1.934896,2013-04-09 00:00:00
6,0.222917,925.813542,19.990625,77.28125,1.833333,2013-04-16 00:00:00
7,0.0,929.240172,17.918705,71.957654,1.990376,2013-04-23 00:00:00
8,0.0,929.625,19.044792,71.322917,1.56875,2013-04-30 00:00:00
9,0.033333,927.036458,20.752083,68.625,1.447917,2013-05-07 00:00:00


In [139]:
# Gerando um novo DataFrame a partir da junção dos dados de produtos e dados meteorológicos históricos de mogi
folhosas_inmet_mogi = pd.merge(folhosas_mogi,inmet_folhosas_mogi)
folhosas_inmet_mogi.head(10)

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00,0.122917,925.892708,23.46875,69.192708,2.235938
3,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00,0.577083,924.426042,24.229688,74.755208,1.885938
4,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00,0.577083,924.426042,24.229688,74.755208,1.885938
5,Alface Lisa,Mogi das Cruzes,"R$ 7,00",12,3,2013,2013-03-12 00:00:00,0.577083,924.426042,24.229688,74.755208,1.885938
6,Alface Americana,Mogi das Cruzes,"R$ 10,67",19,3,2013,2013-03-19 00:00:00,0.21875,926.285417,20.897917,81.979167,2.497396
7,Alface Crespa,Mogi das Cruzes,"R$ 9,67",19,3,2013,2013-03-19 00:00:00,0.21875,926.285417,20.897917,81.979167,2.497396
8,Alface Lisa,Mogi das Cruzes,"R$ 10,80",19,3,2013,2013-03-19 00:00:00,0.21875,926.285417,20.897917,81.979167,2.497396
9,Alface Americana,Mogi das Cruzes,"R$ 11,00",26,3,2013,2013-03-26 00:00:00,0.110417,926.019271,20.097396,81.619792,1.883333


In [137]:
# Formatação de colunas (arredondamento de casas decimais)
folhosas_inmet_mogi['Média Precipitação Total (mm)'] = folhosas_inmet_mogi['Média Precipitação Total (mm)'].round(4)
folhosas_inmet_mogi['Média Pressão Atmosférica (mB)'] = folhosas_inmet_mogi['Média Pressão Atmosférica (mB)'].round(3)
folhosas_inmet_mogi['Média Temperatura do Ar (°C)'] = folhosas_inmet_mogi['Média Temperatura do Ar (°C)'].round(2)
folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'] = folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'].round(2)
folhosas_inmet_mogi['Média Vento Velocidade (m/s)'] = folhosas_inmet_mogi['Média Vento Velocidade (m/s)'].round(2)

folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'] = folhosas_inmet_mogi['Média Umidade Relativa do Ar (%)'].astype(str) + '%'

folhosas_inmet_mogi.head()

Unnamed: 0,Produto,Região,Preço,Dia,Mês,Ano,Data,Média Precipitação Total (mm),Média Pressão Atmosférica (mB),Média Temperatura do Ar (°C),Média Umidade Relativa do Ar (%),Média Vento Velocidade (m/s)
0,Alface Americana,Mogi das Cruzes,"R$ 9,43",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
1,Alface Crespa,Mogi das Cruzes,"R$ 7,00",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
2,Alface Lisa,Mogi das Cruzes,"R$ 8,00",5,3,2013,2013-03-05 00:00:00,0.1229,925.893,23.47,69.19%,2.24
3,Alface Americana,Mogi das Cruzes,"R$ 7,67",12,3,2013,2013-03-12 00:00:00,0.5771,924.426,24.23,74.76%,1.89
4,Alface Crespa,Mogi das Cruzes,"R$ 6,00",12,3,2013,2013-03-12 00:00:00,0.5771,924.426,24.23,74.76%,1.89


In [138]:
inmet = nuppa_inmet.loc[:, 'Data':'Média Vento Velocidade (m/s)']
inmet.to_csv('INMET_SP_2022_2023_filtered.csv', index = 0)