# Automatic Excel

This Python script has the intention to automate the creation of Excel files. The complete data was stored in the file 'some_file.xlsx.' Our goal here is to generate new Excel files from the original one. These files are generated based on different categories in the columns. The details of the items in the original file were omitted because they come from a private company.

Este script em Python tem a intenção de automatizar a criação de arquivos Excel. Todos os dados foram armazenados no arquivo 'some_file.xlsx'. Nosso objetivo aqui é gerar novos arquivos de Excel a partir do original. Esses arquivos são gerados com base nas diferentes categorias das colunas. Os detalhes dos itens no arquivo original foram omitidos porque pertencem a uma empresa privada.

### IMPORTING LIBRARIES
importando bibliotecas

In [None]:
import pandas as pd
import numpy as np

### STORING THE ORIGINAL FILE IN A DATAFRAME
armazenando o arquivo original em um DataFrame

In [None]:
df = pd.read_xcel('some_file.xlsx')
df.head()

### CREATING A NEW COLUMN 'Qtde' WITH ALL VALUES AS '1' AND REPOSITIONING IT
criando uma nova coluna 'Qtde' com todos os valores iguais a '1' e resposiciona ela

In [None]:
new_column = pd.Series(1, index=df.index, name='Qtde')

df = pd.concat([df, new_column], axis=1)

column_Quantidade = df.pop('Qtde')

df.insert(2, 'Qtde', column_Quantidade)

### FINDING THE UNIQUE VALUES IN THE COLUMNS Polo AND LAB AND STORING IN THE LISTS polos AND labs
encontrando os valores únicos nas colunas Polo e LAB e armazenando nas listas polos e labs

In [None]:
polos = np.sort(df['Polo'].unique())
labs = df['LAB'].unique()

### Deleting the files in the folder.
Here, we delete all the files in a specified folder to ensure that every time we execute the script, no unwanted remnant files remain after the file generation process.

### Excluindo os arquivos na pasta.
Aqui, excluímos todos os arquivos em uma pasta especificada para garantir que toda vez que executamos o script, nenhum arquivo indesejado permaneça após a geração dos arquivos.

In [None]:
import os

# Specify the path of the folder that contains the files you want to delete
# Especifique o caminho da pasta que contém os arquivos que você deseja excluir
folder_path = '/somewhere/somewhere2'

# Store all files in the folder in a list
# guarde todos os arquivos na pasta em uma lista
folder_files = os.listdir(folder_path)

# Iterate over the files and delete them
# Itere sobre os arquivos e exclua-os
for file in folder_files:
    file_path = os.path.join(folder_path, file)
    try:
        if os.path.isfile(file_path):
            os.remove(file_path)
            print(f"File {file} Successfully removed.")
    except Exception as e:
        print(f"Error while removing the file {file}: {str(e)}")

### Generating the files
In this part of the code, we generate Excel files. Each new file will be named after one of the unique values in the Polo column (polos list). Additionally, each file will have multiple sheets named after one of the unique values in the LAB column (labs list). Finally, the tables in each sheet of each file are the remaining DataFrames when we filter the Polo and LAB columns by their unique values.


### Gerando os arquivos
Nesta parte do código, geramos os arquivos de Excel. Cada novo arquivo será nomeado por um dos valores únicos da coluna Polo (lista polos). Além disso, cada arquivo terá várias planilhas nomeadas por um dos valores únicos da coluna LAB (lista labs). Por fim, as tabelas em cada planilha de cada arquivo são os DataFrames remanescentes quando filtramos a coluna Polo e LAB pelos seus valores únicos.

In [None]:
# !pip install xlsxwriter if necessary
# !pip install xlsxwriter se necessário

# header
# cabeçalho
cabecalho = 'What you want'


# Iterate over the intens in list polos
# Itere sobre os itens da lista polos
for i in polos:
    
    # Define a DataFrame fintering the original one column Polo by the item i of the list polos
    # Defina um DataFrame filtrando o original pela coluna Polo usando o item i da lista polos.
    a = df.loc[df['Polo'] == i]
    
    # Removing unwanted parts of the name of item i from the polos list
    # Removendo partes indesejadas do nome do item i da lista de polos
    aux = i.replace(" - ", "-")
    aux = aux.replace(" ","_")

    # Creating the file path and its name using the varible aux
    # Criando o caminho do arquivo e seu nome usando a variável aux
    caminho_do_arquivo = f'/content/Arquivos_Comodato/{aux}.xlsx'
    
    # Transforming the DataFrame into an Excel file with the file name created in the previous step
    # Transformando o DataFrame a num excel com o nome de arquivo criado no passo anterior
    a.to_excel(caminho_do_arquivo, index=False)
    

    # Now we will use ExcelWriter to create the various sheets in the Excel files
    # Agora vamos usar o ExcelWriter para criar as várias planilhas dos arquivos em excel
    
    # Accessing the created file and definig as writer
    # Acessando o arquivo criado e definindo como writer
    with pd.ExcelWriter(caminho_do_arquivo, engine='xlsxwriter') as writer:

        # Finding the unique values in the LAB column of the already filtered DataFrame a
        # Encontrando os valores unicos a coluna LAB do DataFrame já filtrado a
        cursos_unicos = a['LAB'].unique()

        
        # Iterating over the values of the cursos_unicos list and creating a sheet for each one
        # Iterando sobre os valores da lista cursos_unicos e criando uma planilha para cada um
        for j in cursos_unicos:
            df_curso = a.loc[a['LAB'] == j]
            df_curso.to_excel(writer, sheet_name = j, startrow = 2, index = False)

            # writer.sheets[j].write(0, 0, cabecalho) #colocando cabeçalho
            # Mescle as células para o cabeçalho e centralize

            mescla = f"A1:{chr(a.shape[1] + ord('A') - 1)}1"

            worksheet = writer.sheets[j]
            header_format = writer.book.add_format({'bold': True, 'align': 'center', 'valign': 'vcenter'})
            worksheet.merge_range(mescla, cabecalho, header_format)


In [None]:
from zipfile import ZipFile

# Especifique o caminho da pasta que contém os arquivos Excel
caminho_da_pasta = '/content/Arquivos_Comodato'

# Especifique o caminho do arquivo zip que será gerado
caminho_do_zip = '/content/arquivos.zip'

# Lista todos os arquivos na pasta
arquivos_na_pasta = os.listdir(caminho_da_pasta)

# Inicializa o objeto ZipFile para escrever no arquivo zip
with ZipFile(caminho_do_zip, 'w') as zipf:
    # Itera sobre os arquivos na pasta
    for arquivo in arquivos_na_pasta:
        # Verifica se o arquivo é um arquivo Excel (pode ajustar para outros formatos)
        if arquivo.endswith('.xlsx'):
            # Caminho completo do arquivo
            caminho_completo = os.path.join(caminho_da_pasta, arquivo)
            # Adiciona o arquivo ao arquivo zip, usando o nome original do arquivo
            zipf.write(caminho_completo, os.path.basename(caminho_completo))