# _Notebook Jupyter_ 1b_trataABIMOTO13

# Importação e tratamento Tabela ABIMOTO v13

A tabela ABIMOTO v13 é fornecida em PDF, que foi manualmente transformado em uma planilha do Excel no formato XLSX.

### Importação das Bibliotecas

In [1]:
import pandas as pd
import numpy as np
import os, time

In [2]:
# Data e hora da execução do script
print(f'Código executado em {time.strftime("%d/%m/%Y às %H:%M", time.localtime(time.time()))}')

Código executado em 10/01/2022 às 18:09


### Definindo dados gerais

Cria variáveis com nomes das colunas e seus tipos

In [3]:
tipos = { 'ITEM' : int, 
          'PARTES E PEÇAS' : str, 
          'MOTO PARTS' : str, 
          'NCM' : str, 
          'UNI' : str, 
          'VMLE' : float }
colunas = list(tipos.keys())

Inicializa a variável que conterá o tamanho total do dataset original

In [4]:
tamanhoDataset=0

Inicializa um dataframe vazio que conterá os dados finais

In [5]:
df = pd.DataFrame(columns = colunas)
df.head()

Unnamed: 0,ITEM,PARTES E PEÇAS,MOTO PARTS,NCM,UNI,VMLE


### Importa o arquivo Excel XLSX, trata e concatena no DataFrame final

In [6]:
# Executa a importação e tratamento do arquivo
arq = 'ABIMOTO13.xlsx'
print('Iniciando ' + arq + '.')
df = pd.read_excel(arq,
                   sep='@', 
                   decimal=r',', 
                   encoding = "ISO-8859-1",
                   header = 0,
                   names = colunas,
                   dtype = tipos, 
                   quotechar="'", 
                   error_bad_lines=False)
print('DataFrame carregado...\nAplicando filtros...')
# Elimina os registros sem valores ou nulos
df = df.dropna()
# Incrementa o tamanho do Dataset
tamanhoDataset += df[df.columns[0]].count()
print('Quantidade de registros válidos: ' + str(tamanhoDataset))
# Filtra o DataFrame somente com os registros de interesse
# Filtro 1: NCM de interesse: 87141000
indiceNCM = df['NCM'] == '87141000'
df = df[indiceNCM]
# Filtro 2: Descrição contendo 'kit' e 'transm'
df = df[df['PARTES E PEÇAS'].str.contains("kit", case=False)]
df = df[df['PARTES E PEÇAS'].str.contains("transm", case=False)]
print(arq + ' finalizado.\n')

Iniciando ABIMOTO13.xlsx.
DataFrame carregado...
Aplicando filtros...
Quantidade de registros válidos: 129
ABIMOTO13.xlsx finalizado.



### Ajustando a descrição e indicação de presença de retentor no kit

In [7]:
df.head()

Unnamed: 0,ITEM,PARTES E PEÇAS,MOTO PARTS,NCM,UNI,VMLE
77,78,KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...,TRANS.SET 1045 C100 BIZ 15D+428HX108+35D W/PR.,87141000,RETENTOR KIT COM,6.47
78,79,KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...,TRANS.SET 1045 C100 BIZ 15D+428HX108+35D W/PR.,87141000,RETENTOR KIT SEM,3.9
79,80,KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...,TRANS.SET 1045 (CHAIN + SPROCKET) CBX 250 TWISTER,87141000,KIT COM RETENTOR,9.3
80,81,KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...,TRANS.SET 1045 (CHAIN + SPROCKET) CBX 250 TWISTER,87141000,KIT SEM RETENTOR,6.25
81,82,KIT TRANSMISSÃO 1045 FAZER 250,TRANSMISSION SET + H CHAIN FAZER 251,87141000,RETENTOR KIT COM,8.2


Em virtude de haver observação se há ou não retentor na coluna UND faremos a adequação da descrição pra conter tal informação.

In [8]:
obs = ["COM RETENTOR" if "COM" in x else "SEM RETENTOR" for x in df.UNI.str.split()]
df["PARTES E PEÇAS"] = df["PARTES E PEÇAS"] + " " + obs

Em seguida define-se a coluna UNI como 'KIT'

In [9]:
df['UNI']='KIT'

E por fim cria-se a coluna RETENTOR do tipo _boolean_ para indicar ou não a presença do retentor no kit.

In [10]:
from funcoesTCC import retentorAux # função importada do módulo de funções criarModelo
df['RETENTOR'] = df['PARTES E PEÇAS'].apply(retentorAux)

### Resetando o índice do DataFrame final

In [11]:
df.reset_index(inplace=True, drop=True)

### Verificando o DataFrame final

In [12]:
df.head()

Unnamed: 0,ITEM,PARTES E PEÇAS,MOTO PARTS,NCM,UNI,VMLE,RETENTOR
0,78,KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...,TRANS.SET 1045 C100 BIZ 15D+428HX108+35D W/PR.,87141000,KIT,6.47,True
1,79,KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...,TRANS.SET 1045 C100 BIZ 15D+428HX108+35D W/PR.,87141000,KIT,3.9,False
2,80,KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...,TRANS.SET 1045 (CHAIN + SPROCKET) CBX 250 TWISTER,87141000,KIT,9.3,True
3,81,KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...,TRANS.SET 1045 (CHAIN + SPROCKET) CBX 250 TWISTER,87141000,KIT,6.25,False
4,82,KIT TRANSMISSÃO 1045 FAZER 250 COM RETENTOR,TRANSMISSION SET + H CHAIN FAZER 251,87141000,KIT,8.2,True


In [13]:
df.tail()

Unnamed: 0,ITEM,PARTES E PEÇAS,MOTO PARTS,NCM,UNI,VMLE,RETENTOR
11,89,KIT TRANSMISSÃO 1045 TITAN 150 16D+428HX118+43...,TRANS.SET 1045 TITAN 16D+428HX118+43D W/PROT.,87141000,KIT,4.3,False
12,90,KIT TRANSMISSÃO XRE - 300 COM RETENTOR,TRANSMISSION SET + H CHAIN XRE 301,87141000,KIT,9.0,True
13,91,KIT TRANSMISSÃO XRE - 300 SEM RETENTOR,TRANSMISSION SET + H CHAIN XRE 301,87141000,KIT,6.0,False
14,92,KIT TRANSMISSÃO XTZ - 250 LANDER COM RETENTOR,TRANSMISSION SET + H CHAIN 250 LANDER,87141000,KIT,8.2,True
15,93,KIT TRANSMISSÃO XTZ - 250 LANDER SEM RETENTOR,TRANSMISSION SET + H CHAIN 250 LANDER,87141000,KIT,4.4,False


In [14]:
df['PARTES E PEÇAS']

0     KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...
1     KIT TRANSMISSÃO 1045 C100 BIZ 15D+428HX108+35D...
2     KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...
3     KIT TRANSMISSÃO 1045 (CORRENTE.COROA. PINHAO) ...
4           KIT TRANSMISSÃO 1045 FAZER 250 COM RETENTOR
5           KIT TRANSMISSÃO 1045 FAZER 250 SEM RETENTOR
6     KIT TRANSMISSÃO 1045 TITAN 2000/04 14D+428HX11...
7     KIT TRANSMISSÃO 1045 TITAN 2000/04 14D+428HX11...
8     KIT TRANSMISSÃO 1045 YBR-125 2000/2002 14D+428...
9     KIT TRANSMISSÃO 1045 YBR-125 2000/2002 14D+428...
10    KIT TRANSMISSÃO 1045 TITAN 150 16D+428HX118+43...
11    KIT TRANSMISSÃO 1045 TITAN 150 16D+428HX118+43...
12              KIT TRANSMISSÃO XRE - 300  COM RETENTOR
13              KIT TRANSMISSÃO XRE - 300  SEM RETENTOR
14        KIT TRANSMISSÃO XTZ - 250 LANDER COM RETENTOR
15        KIT TRANSMISSÃO XTZ - 250 LANDER SEM RETENTOR
Name: PARTES E PEÇAS, dtype: object

In [15]:
df.shape

(16, 7)

### Exportando o DataFrame

Exportando para um arquivo CSV

In [16]:
df.to_csv(r'dfABIMOTOv13.csv', index = False, header = True)

Exportando para um arquivo de planilha do Excel

In [17]:
df.to_excel(r'dfABIMOTOv13.xlsx', index = False, header = True)

Compara o tamanho total do Dataset inicial e final

In [18]:
print('Qtd de registros Dataset original: ' + str(tamanhoDataset))
print('Qtd de registros Dataset final:    ' + str(df[df.columns[0]].count()))

Qtd de registros Dataset original: 129
Qtd de registros Dataset final:    16
