In [13]:
import pandas as pd

#### Import do dataset

In [2]:
df_estoque = pd.read_csv('estoque.csv')

In [3]:
df_estoque['CLUSTER'] = ''
df_estoque['PORTE'] = ''

#### Tratamento dos dados

Trata NA para 0 nos campos de valor

In [4]:
df_estoque['VENDA'] = df_estoque['VENDA'].fillna(0) 
df_estoque['VENDA_QTD'] = df_estoque['VENDA_QTD'].fillna(0) 
df_estoque['AVG_ESTOQUE_VLR'] = df_estoque['AVG_ESTOQUE_VLR'].fillna(0) 
df_estoque['AVG_ESTOQUE_QTD'] = df_estoque['AVG_ESTOQUE_QTD'].fillna(0) 

Cria um dataframe com as medianas das colunas de valores para substituir os valores negativos pela mediana do cluster

In [5]:
colunas_interesse = ['AVG_ESTOQUE_VLR', 'AVG_ESTOQUE_QTD', 'VENDA_QTD', 'VENDA']
mediana_df = df_estoque.groupby(['CLUSTER'])[colunas_interesse].quantile(0.5).reset_index()

Sempre que o valor da coluna for negativo, ele será substituido pela mediana do cluster, o objetivo é não ter valores negativos na base de dados.

In [6]:
for col in colunas_interesse:
    mask = df_estoque[col] < 0
    df_estoque.loc[mask, col] = df_estoque.loc[mask, 'CLUSTER'].map(mediana_df.set_index('CLUSTER')[col])


### Calculo da venda média diária

Uma das metas necessárias é a venda média diária, por isso ela é calculada a partir da venda realizada dos ultimos 90 dias

Uma premissa assumida é que para os meses de janeiro e fevereiro foi considerado a mesma venda média de março onde já se tem 90 dias para cálculo.

In [18]:
# Ordenando o DataFrame pela coluna 'DATA'

df = df_estoque.sort_values(['ESTRUTURA_OPER4', 'COD_ESTRUTURA_MERC2', 'ESTRUTURA_OPER0', 'DATA'])
df['DATA'] = pd.to_datetime(df['DATA'], format='%Y-%m-%d')
df['MES_DIA'] = df['DATA'].dt.strftime('%m-%d')

# Calculando a soma dos valores de venda e venda_qtd nos últimos 3 meses para cada grupo
df['SOMA_VENDA_3_MESES'] = df.groupby(['ESTRUTURA_OPER4', 'COD_ESTRUTURA_MERC2', 'ESTRUTURA_OPER0'])['VENDA'].transform(lambda x: x.rolling(window=3, min_periods=1).sum())
df['SOMA_VENDA_QTD_3_MESES'] = df.groupby(['ESTRUTURA_OPER4', 'COD_ESTRUTURA_MERC2', 'ESTRUTURA_OPER0'])['VENDA_QTD'].transform(lambda x: x.rolling(window=3, min_periods=1).sum())

# Obtendo os valores correspondentes à data '2022-03-01' para cada grupo
values_marco = df.loc[df['MES_DIA'] == '03-01', ['ESTRUTURA_OPER4', 'COD_ESTRUTURA_MERC2', 'ESTRUTURA_OPER0', 'SOMA_VENDA_3_MESES', 'SOMA_VENDA_QTD_3_MESES']]

# Substituindo os valores de 'SOMA_VENDA_3_MESES' e 'SOMA_VENDA_QTD_3_MESES' nas datas de janeiro e feveiro pelos valores de março
df['SOMA_VENDA_3_MESES'] = df.apply(
    lambda row: values_marco[(values_marco['ESTRUTURA_OPER4'] == row['ESTRUTURA_OPER4']) & 
                                  (values_marco['COD_ESTRUTURA_MERC2'] == row['COD_ESTRUTURA_MERC2']) & 
                                  (values_marco['ESTRUTURA_OPER0'] == row['ESTRUTURA_OPER0'])]['SOMA_VENDA_3_MESES'].values[0]
    if row['MES_DIA'] in ['01-01', '02-01'] else row['SOMA_VENDA_3_MESES'],
    axis=1
)

df['SOMA_VENDA_QTD_3_MESES'] = df.apply(
    lambda row: values_marco[(values_marco['ESTRUTURA_OPER4'] == row['ESTRUTURA_OPER4']) & 
                                  (values_marco['COD_ESTRUTURA_MERC2'] == row['COD_ESTRUTURA_MERC2']) & 
                                  (values_marco['ESTRUTURA_OPER0'] == row['ESTRUTURA_OPER0'])]['SOMA_VENDA_QTD_3_MESES'].values[0]
    if row['MES_DIA'] in ['01-01', '02-01'] else row['SOMA_VENDA_QTD_3_MESES'],
    axis=1
)

# Calculando a média diária considerando a soma dos valores de venda e venda_qtd nos últimos 3 meses
df['AVG_VND_DIARIA_VLR'] = df['SOMA_VENDA_3_MESES'] / 90
df['AVG_VND_DIARIA_QTD'] = df['SOMA_VENDA_QTD_3_MESES'] / 90

df = df.drop(['SOMA_VENDA_3_MESES', 'SOMA_VENDA_QTD_3_MESES', 'MES_DIA'], axis=1, errors='ignore')
df_estoque = df

#### Calculo das metas para os cenários Conservador, Realista e Agressivo

O cenário conservador é o valor do segundo quartil. <br>
O cenário realista é o valor do terceiro quartil.<br>
O cenário agressivo é o valor do valor máximo do cluster.

In [None]:
# Define os quartis desejados
quantis = [0.50, 0.75, 1]

colunas_interesse = ['AVG_ESTOQUE_VLR', 'AVG_ESTOQUE_QTD', 'AVG_VND_DIARIA_VLR','AVG_VND_DIARIA_QTD']

# Agrupa o DataFrame pelos grupos desejados e calcule os quantis
quartis_df = df_estoque.groupby(['CLUSTER', 'DATA'])[colunas_interesse].quantile(quantis).unstack()

In [None]:
# Renomeia as colunas para indicar o quartil
quartis_df.columns = [f'{col[0]}_q{int(col[1]*100)}' for col in quartis_df.columns]

In [None]:
quartis_df

Unnamed: 0_level_0,Unnamed: 1_level_0,AVG_ESTOQUE_VLR_q50,AVG_ESTOQUE_VLR_q75,AVG_ESTOQUE_VLR_q100,AVG_ESTOQUE_QTD_q50,AVG_ESTOQUE_QTD_q75,AVG_ESTOQUE_QTD_q100,AVG_VND_DIARIA_VLR_q50,AVG_VND_DIARIA_VLR_q75,AVG_VND_DIARIA_VLR_q100,AVG_VND_DIARIA_QTD_q50,AVG_VND_DIARIA_QTD_q75,AVG_VND_DIARIA_QTD_q100
CLUSTER,DATA,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
,2022-01-01,41.678687,135.03386,133260.330455,4.93475,16.612028,6696.0,11.602389,187.766583,142146.114778,0.755556,18.385014,28010.866667
,2022-02-01,41.678687,127.815898,63478.015909,4.93475,15.537226,6696.0,11.356556,186.779306,142146.114778,0.744444,18.247181,28010.866667
,2022-03-01,41.678687,123.388093,121045.398696,4.93475,14.670483,8370.434783,11.243833,186.043444,142146.114778,0.733333,18.107261,28010.866667
,2022-04-01,41.678687,118.350038,70412.67,4.93475,13.860837,6696.0,11.446833,190.80325,132396.121333,0.744444,18.475,27810.422222
,2022-05-01,41.678687,120.477174,128911.673333,4.93475,14.431472,11126.2,11.5,195.604889,156456.099111,0.733333,18.433333,28115.266667
,2022-06-01,41.678687,117.373199,66411.485417,4.93475,13.908034,6606.0,12.446111,199.365889,171325.576444,0.777778,18.05,23010.522222
,2022-07-01,41.678687,114.405,132871.71625,4.93475,13.792535,14100.833333,12.762278,204.869417,167066.920333,0.8,18.058333,20202.288889
,2022-08-01,41.678687,107.012748,56143.19,4.93475,12.764706,6606.0,12.500556,201.6485,148255.888889,0.766667,17.683333,19491.077778
,2022-09-01,49.858643,160.939329,90231.147055,5.818711,22.610034,5137.130631,13.631889,209.630444,130655.550667,0.866667,18.642003,16948.711111
,2022-10-01,44.282066,153.464271,116139.774667,5.0,21.255319,8471.013333,12.93,212.858,129071.641778,0.833333,19.322222,16808.166667


In [None]:
# Reset index para tornar os grupos como colunas novamente
quartis_df = quartis_df.reset_index()

# Junta os quartis de volta ao DataFrame original
df_estoque = pd.merge(df_estoque, quartis_df, on=[ 'CLUSTER', 'DATA'])

Cria um dataframe com valores minimos para as colunas de interesse, isso é usado para garantir que as metas não serão negativas

In [None]:
# Agrupa o DataFrame pelos grupos desejados e encontra o valor maximo
min = df_estoque[(df_estoque['AVG_ESTOQUE_VLR']>=0) & (df_estoque['AVG_ESTOQUE_QTD']>=0) & (df_estoque['AVG_VND_DIARIA_VLR']>=0) & (df_estoque['AVG_VND_DIARIA_QTD']>=0)]
min= min.groupby(['CLUSTER', 'DATA',])[colunas_interesse].min()

# Renomeia as colunas para indicar o quartil
min.columns = [f'{col}_MIN' for col in min.columns]

# Reset index para tornar os grupos como colunas novamente
min = min.reset_index()

In [None]:
# Junta os minimos  ao DataFrame original
df_estoque = pd.merge(df_estoque, min, on=[ 'CLUSTER','DATA'])

#### Cria as colunas de metas

É feita uma análise das metas sugeridas, caso o valor realizado seja menor que a meta sugerida é mantido o valor realizado como meta

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR_MIN'] if x['AVG_ESTOQUE_VLR_q100']< 0 else x['AVG_ESTOQUE_VLR_q100'], axis=1)
df_estoque['META_ESTOQUE_QTD_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD_MIN'] if x['AVG_ESTOQUE_QTD_q100']< 0 else x['AVG_ESTOQUE_QTD_q100'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR_MIN'] if x['AVG_VND_DIARIA_VLR_q100']< 0 else x['AVG_VND_DIARIA_VLR_q100'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD_MIN'] if x['AVG_VND_DIARIA_QTD_q100']< 0 else x['AVG_VND_DIARIA_QTD_q100'], axis=1)

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR'] if (x['META_ESTOQUE_VLR_CONSERVADOR']> x['AVG_ESTOQUE_VLR']) and (x['AVG_ESTOQUE_VLR'] >= 0) else x['META_ESTOQUE_VLR_CONSERVADOR'], axis=1)
df_estoque['META_ESTOQUE_QTD_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD'] if (x['META_ESTOQUE_QTD_CONSERVADOR']> x['AVG_ESTOQUE_QTD']) and (x['AVG_ESTOQUE_QTD']>= 0) else x['META_ESTOQUE_QTD_CONSERVADOR'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR'] if (x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_CONSERVADOR']> x['AVG_VND_DIARIA_VLR']) and (x['AVG_VND_DIARIA_VLR']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_CONSERVADOR'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_CONSERVADOR'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD']  if (x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_CONSERVADOR']> x['AVG_VND_DIARIA_QTD']) and (x['AVG_VND_DIARIA_QTD']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_CONSERVADOR'], axis=1)

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_REALISTA'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR_MIN'] if x['AVG_ESTOQUE_VLR_q75']< 0 else x['AVG_ESTOQUE_VLR_q75'], axis=1)
df_estoque['META_ESTOQUE_QTD_REALISTA'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD_MIN'] if x['AVG_ESTOQUE_QTD_q75']< 0 else x['AVG_ESTOQUE_QTD_q75'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_REALISTA'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR_MIN'] if x['AVG_VND_DIARIA_VLR_q75']< 0 else x['AVG_VND_DIARIA_VLR_q75'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_REALISTA'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD_MIN'] if x['AVG_VND_DIARIA_QTD_q75']< 0 else x['AVG_VND_DIARIA_QTD_q75'], axis=1)

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_REALISTA'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR'] if (x['META_ESTOQUE_VLR_REALISTA']> x['AVG_ESTOQUE_VLR']) and (x['AVG_ESTOQUE_VLR'] >= 0) else x['META_ESTOQUE_VLR_REALISTA'], axis=1)
df_estoque['META_ESTOQUE_QTD_REALISTA'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD'] if (x['META_ESTOQUE_QTD_REALISTA']> x['AVG_ESTOQUE_QTD']) and (x['AVG_ESTOQUE_QTD']>= 0) else x['META_ESTOQUE_QTD_REALISTA'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_REALISTA'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR'] if (x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_REALISTA']> x['AVG_VND_DIARIA_VLR']) and (x['AVG_VND_DIARIA_VLR']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_REALISTA'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_REALISTA'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD']  if (x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_REALISTA']> x['AVG_VND_DIARIA_QTD']) and (x['AVG_VND_DIARIA_QTD']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_REALISTA'], axis=1)

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR_MIN'] if x['AVG_ESTOQUE_VLR_q50']< 0 else x['AVG_ESTOQUE_VLR_q50'], axis=1)
df_estoque['META_ESTOQUE_QTD_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD_MIN'] if x['AVG_ESTOQUE_QTD_q50']< 0 else x['AVG_ESTOQUE_QTD_q50'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR_MIN'] if x['AVG_VND_DIARIA_VLR_q50']< 0 else x['AVG_VND_DIARIA_VLR_q50'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD_MIN'] if x['AVG_VND_DIARIA_QTD_q50']< 0 else x['AVG_VND_DIARIA_QTD_q50'], axis=1)

In [None]:
#Cria as colunas de metas se a meta sugerida for menor que zero utiliza o mínimo do cluster
df_estoque['META_ESTOQUE_VLR_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_VLR'] if (x['META_ESTOQUE_VLR_AGRESSIVO']> x['AVG_ESTOQUE_VLR']) and (x['AVG_ESTOQUE_VLR'] >= 0) else x['META_ESTOQUE_VLR_AGRESSIVO'], axis=1)
df_estoque['META_ESTOQUE_QTD_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_ESTOQUE_QTD'] if (x['META_ESTOQUE_QTD_AGRESSIVO']> x['AVG_ESTOQUE_QTD']) and (x['AVG_ESTOQUE_QTD']>= 0) else x['META_ESTOQUE_QTD_AGRESSIVO'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_VLR'] if (x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_AGRESSIVO']> x['AVG_VND_DIARIA_VLR']) and (x['AVG_VND_DIARIA_VLR']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_VLR_AGRESSIVO'], axis=1)
df_estoque['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_AGRESSIVO'] = df_estoque.apply(lambda x: x['AVG_VND_DIARIA_QTD']  if (x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_AGRESSIVO']> x['AVG_VND_DIARIA_QTD']) and (x['AVG_VND_DIARIA_QTD']>=0) else x['META_ESTOQUE_VND_MEDIA_DIARIA_QTD_AGRESSIVO'], axis=1)

Selecionando somente as colunas necessárias para o dataframe final

In [None]:
#Cria um dataframe apenas com as colunas necessarias
df_estoque = df_estoque[['ESTRUTURA_OPER0', 'ESTRUTURA_OPER1', 'ESTRUTURA_OPER1','PORTE','COD_ESTRUTURA_OPER4','ESTRUTURA_OPER4', 'COD_ESTRUTURA_MERC2','DATA','AVG_ESTOQUE_VLR', 'AVG_ESTOQUE_QTD', 'AVG_VND_DIARIA_VLR', 'AVG_VND_DIARIA_QTD', 'META_ESTOQUE_VLR_CONSERVADOR','META_ESTOQUE_QTD_CONSERVADOR','META_ESTOQUE_VND_MEDIA_DIARIA_VLR_CONSERVADOR', 'META_ESTOQUE_VND_MEDIA_DIARIA_QTD_CONSERVADOR', 'META_ESTOQUE_VLR_REALISTA','META_ESTOQUE_QTD_REALISTA','META_ESTOQUE_VND_MEDIA_DIARIA_VLR_REALISTA', 'META_ESTOQUE_VND_MEDIA_DIARIA_QTD_REALISTA', 'META_ESTOQUE_VLR_AGRESSIVO','META_ESTOQUE_QTD_AGRESSIVO','META_ESTOQUE_VND_MEDIA_DIARIA_VLR_AGRESSIVO', 'META_ESTOQUE_VND_MEDIA_DIARIA_QTD_AGRESSIVO'] ]

In [None]:
#Adicionar 1 ano a data atual
df_estoque['DATA'] = pd.to_datetime(df_estoque['DATA'], format='%Y-%m-%d')
df_estoque['DATA'] = df_estoque['DATA'].apply(lambda x: x.replace(year=2023))

In [None]:
df_estoque.to_csv('metas_estoque.csv')