# O notebook abaixo será utilizado no intuito de realizar o pivot necessário na planilha de produtos da Karhub, para que fique mais organizada e que possamos fazer a analise e junções com outros dados adequadamente

## Importando bibliotecas

In [317]:
import pandas as pd
from unidecode import unidecode

## Acessando o arquivo XLSX para tratar os dados em um DF

In [318]:
karhub_autoparts = pd.read_excel("source/karhub_autoparts_1.xlsx")

## Criando DF separado para valor atributo e nome atributo, para realizar o pivot

In [319]:
df_atributos = karhub_autoparts\
    .drop("Nome SKU", axis='columns')\
    .drop("Fabricante", axis='columns')\
    .drop("Código", axis='columns')\
    .drop("Composição", axis='columns')\
    .drop("Categoria", axis='columns')

In [320]:
#Realização do Pivot
df_pivot = df_atributos.pivot(values='Valor Atributo', columns='Nome Atributo')

## Criando DF que realiza o join do DF original da planilha autoparts com o DF com os atributos pivotados

In [321]:
autoparts = karhub_autoparts.join(df_pivot)

## CRIANDO DICIONARIO PARA O AGG
### O dicionario sera utilizado no intuito de passar as colunas que receberão o método agg do pandas para agrupar utilizando a SK criada

In [322]:
#Lendo o DF primario e pegando todos os atributos existentes
atributos = list(set(karhub_autoparts['Nome Atributo']))
#Criando o dicionario e passando os atributos como chave, acompanhando o valor "first", 
#no qual é usado para que os valores dos atributos se encontrem na mesma linha de acordo com o agrupamento em questão
dic_atributos = {}
for cont in atributos:
    dic_atributos[cont] = "first"

## Realizando o agrupamento com a coluna código e utilizando o dicionário acima para unir os valores em uma mesma linha.

In [323]:
autoparts_atributo_final = autoparts.groupby("Código").agg(dic_atributos).reset_index()

## Realizando a manutenção sugerida na proposta de ajustar as colunas com "," para "."

In [324]:
autoparts_atributo_final['Número de Espirais'] = autoparts_atributo_final['Número de Espirais'].astype(str)
autoparts_atributo_final['Número de Espirais'] = autoparts_atributo_final['Número de Espirais'].str.replace(',', '.')


## Realizando o Join dos atributos já ajustados com o DF karhub_autoparts para coletarmos nome, fabricante, composição e categoria e incluir no DF autoparts_final

In [325]:
autoparts_final = autoparts_atributo_final.join(karhub_autoparts.drop(['Código', 'Valor Atributo', 'Nome Atributo']\
                                                                      , axis="columns"))

## Realizando tratamento do nome das colunas do DF, para serem aceitas no bigquery futuramente, criamos um dict compreheesion com a intenção de ter como chave o nome original da coluna, e o valor a coluna tratada.
### na coluna tratada nós removemos os acentos, parenteses e substituímos o espaço por "_", além de deixar tudo em minúsculo.

In [326]:
header_sem_acento = {i : unidecode(i.lower().replace('(','').replace(')','').replace(' ','_'))\
                     for i in list(autoparts_final.columns)}
#passando o dicionário para corrigir os nomes adequadamente
autoparts_final = autoparts_final.rename(columns=header_sem_acento)

## Reordenando as colunas do DF karhub_autoparts para o inicio do DF final

In [327]:
autoparts_final = pd.concat([autoparts_final.iloc[:, -4:], autoparts_final.iloc[:, :-4]], axis=1)

In [328]:
autoparts_final

Unnamed: 0,nome_sku,fabricante,composicao,categoria,codigo,numero_de_espirais,peso_bruto_kg,motor,altura_cm,peso_liquido_kg,posicao,largura_cm,comprimento_cm
0,Mola da Suspensão Traseira,KarHub,UNITARY,Mola Helicoidal,0054,,0.600,,9.0,0.600,Traseira,18.0,8.0
1,Mola da Suspensão Traseira,KarHub,UNITARY,Mola Helicoidal,07402767.0,10.75,4.5,,25,2.0,Traseira,40,25
2,Mola da Suspensão Traseira,KarHub,UNITARY,Mola Helicoidal,CH-0017,7.3,4.5,,25,2.0,Traseira,40,25
3,Mola da Suspensão Traseira,KarHub,UNITARY,Mola Helicoidal,CH-0029,7,4.5,,25,2.0,Dianteira,40,25
4,Mola da Suspensão Traseira,KarHub,UNITARY,Mola Helicoidal,CH-0033,7.5,4.5,,25,2.0,Traseira,40,25
...,...,...,...,...,...,...,...,...,...,...,...,...,...
475,Mola de Suspensão Dianteira Helicoidal,KarHub,UNITARY,Mola Helicoidal,vw0425,,0.600,,9.0,0.600,Traseira,18.0,8.0
476,Mola de Suspensão Dianteira Helicoidal,KarHub,UNITARY,Mola Helicoidal,vw0446,,0.600,,9.0,0.600,Traseira,18.0,8.0
477,Mola de Suspensão Dianteira Helicoidal,KarHub,UNITARY,Mola Helicoidal,vw0474,,0.600,,9.0,0.600,Dianteira,18.0,8.0
478,Mola de Suspensão Dianteira Helicoidal,KarHub,UNITARY,Mola Helicoidal,vw0478,,0.600,,9.0,0.600,Dianteira,18.0,8.0


# ajustar o none de espirais para np.nan e transformar a coluna em float