# Sobre o Caderno

Nesse caderno será feita uma transcrição de um dataframe em `.csv` para uma tabela formata e estilizada no excel usando a biblioteca openpyxl, essa biblioteca permite a manipulação de arquivos `.xlsx` usando códigos python. Para isso é escolhido um workbook (arquivo `.xlsx`), e dentro desse workbook escolhemos uma sheet (planilha) para trabalhar.

Além de fazer a transcrição do dataframe de um `.csv` para o excel também serão apresentados alguns comandos básicos de estilização no excel.

## 0 - Importações

In [45]:
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import PatternFill, Border, Side, Alignment, Protection, Font, colors

## 1 - Definindo workbook e worksheet

In [46]:
# Importando o workbook modelo que trabalharemos sobre
arquivo = load_workbook(filename='Pasta1.xlsx')

In [47]:
# Visualizando as planilhas nesse workbook
print(arquivo.sheetnames)

['Planilha1', 'Planilha2', 'Planilha3']


In [48]:
# Para começar a trabalhar temos que definir qual a nossa planilha de trabalho (worksheet)
ws = arquivo['Planilha1']

## 2 - Definindo alguns estilos para uso

Definindo alguns estilos usando a openpyxl.styles.
Para ver mais coisas sobre estilos acesse https://openpyxl.readthedocs.io/en/stable/styles.html.
Sobre alinhamento https://openpyxl.readthedocs.io/en/stable/api/openpyxl.styles.alignment.html.

In [49]:
# Estilos do cabeçalho
fonte_cabecalho = Font(name='Calibri', size=12, bold=True, italic=False, vertAlign=None, underline='none', strike=False, color='FFFFFF')
estilo_borda = Side(border_style="medium", color='FFFFFF')
borda_cabecalho = Border(left=estilo_borda, right= estilo_borda, top=estilo_borda, bottom=estilo_borda, vertical= estilo_borda, horizontal=estilo_borda)
alinhamento_centralizado = Alignment(horizontal='center', vertical='center')
cor_celulas_cabecalho = PatternFill("solid", fgColor="000066CC")

In [50]:
# Estilos da tabela
fonte_tabela = Font(name='Calibri', size=12, bold=False, italic=False, vertAlign=None, underline='none', color='00333333')
cor_celulas__tabela = PatternFill("solid", fgColor="00FFFFFF")
estilo_borda_lateral = Side(border_style="medium", color='000066CC')
borda_tabela = Border(left=estilo_borda_lateral, right= estilo_borda_lateral)
alinhamento_esquerdo = Alignment(horizontal='right', vertical='center')
alinhamento_centralizado = Alignment(horizontal='center', vertical='center')

In [51]:
# Estilos da linha de totais
fonte_total = Font(name='Calibri', size=12, bold=True, italic=False, vertAlign=None, underline='none', strike=False, color='FFFFFF')
cor_celulas_total = PatternFill("solid", fgColor="00808080")

## 3 - Criando e visualizando o dataframe

In [52]:
# Criando o dataframe e visualizando suas primeiras linhas
dataframe = pd.read_csv("tmdb_5000_movies.csv")
dataframe.head()

Unnamed: 0,budget,genres,homepage,id,keywords,original_language,original_title,overview,popularity,production_companies,production_countries,release_date,revenue,runtime,spoken_languages,status,tagline,title,vote_average,vote_count
0,237000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://www.avatarmovie.com/,19995,"[{""id"": 1463, ""name"": ""culture clash""}, {""id"":...",en,Avatar,"In the 22nd century, a paraplegic Marine is di...",150.437577,"[{""name"": ""Ingenious Film Partners"", ""id"": 289...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2009-12-10,2787965087,162.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}, {""iso...",Released,Enter the World of Pandora.,Avatar,7.2,11800
1,300000000,"[{""id"": 12, ""name"": ""Adventure""}, {""id"": 14, ""...",http://disney.go.com/disneypictures/pirates/,285,"[{""id"": 270, ""name"": ""ocean""}, {""id"": 726, ""na...",en,Pirates of the Caribbean: At World's End,"Captain Barbossa, long believed to be dead, ha...",139.082615,"[{""name"": ""Walt Disney Pictures"", ""id"": 2}, {""...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2007-05-19,961000000,169.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,"At the end of the world, the adventure begins.",Pirates of the Caribbean: At World's End,6.9,4500
2,245000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://www.sonypictures.com/movies/spectre/,206647,"[{""id"": 470, ""name"": ""spy""}, {""id"": 818, ""name...",en,Spectre,A cryptic message from Bond’s past sends him o...,107.376788,"[{""name"": ""Columbia Pictures"", ""id"": 5}, {""nam...","[{""iso_3166_1"": ""GB"", ""name"": ""United Kingdom""...",2015-10-26,880674609,148.0,"[{""iso_639_1"": ""fr"", ""name"": ""Fran\u00e7ais""},...",Released,A Plan No One Escapes,Spectre,6.3,4466
3,250000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 80, ""nam...",http://www.thedarkknightrises.com/,49026,"[{""id"": 849, ""name"": ""dc comics""}, {""id"": 853,...",en,The Dark Knight Rises,Following the death of District Attorney Harve...,112.31295,"[{""name"": ""Legendary Pictures"", ""id"": 923}, {""...","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2012-07-16,1084939099,165.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,The Legend Ends,The Dark Knight Rises,7.6,9106
4,260000000,"[{""id"": 28, ""name"": ""Action""}, {""id"": 12, ""nam...",http://movies.disney.com/john-carter,49529,"[{""id"": 818, ""name"": ""based on novel""}, {""id"":...",en,John Carter,"John Carter is a war-weary, former military ca...",43.926995,"[{""name"": ""Walt Disney Pictures"", ""id"": 2}]","[{""iso_3166_1"": ""US"", ""name"": ""United States o...",2012-03-07,284139100,132.0,"[{""iso_639_1"": ""en"", ""name"": ""English""}]",Released,"Lost in our world, found in another.",John Carter,6.1,2124


In [53]:
# Formato do dataframe
dataframe.shape

(4803, 20)

## 4 - Adaptando o dataframe para algo legível no excel

In [54]:
# Vamos trabalhar na integração com a biblioteca pandas para já construir as tabelas com valores
# https://openpyxl.readthedocs.io/en/stable/pandas.html
# Vou usar uma base de dados do seguinte repositório: https://raw.githubusercontent.com/WLAraujo/python_PLN/main/Dados/tmdb_5000_movies.csv
from openpyxl.utils.dataframe import dataframe_to_rows

In [55]:
# Usando a função importada
linhas_df = dataframe_to_rows(dataframe, header = True, index = False)

## 5 - Transcrevendo os dados do dataframe para a planilha

In [56]:
for linha in linhas_df:
    ws.append(linha)

## 6 - Estilizando o cabeçalho

In [57]:
for ind_coluna in range(1, dataframe.shape[1] + 1):
    # Definindo célula que será alterada na iteração
    celula = ws.cell(row=1, column=ind_coluna)
    # Estilizando a célula
    celula.font = fonte_cabecalho
    celula.fill = cor_celulas_cabecalho
    celula.alignment = alinhamento_centralizado
    celula.border = borda_cabecalho

## 7 - Estilizando as células de dados

In [58]:
for ind_coluna in range(1, dataframe.shape[1] + 1):
    for ind_linha in range(2, dataframe.shape[0] + 2):
        ws.cell(row=ind_linha, column=ind_coluna).font = fonte_tabela
        ws.cell(row=ind_linha, column=ind_coluna).border = borda_tabela
        ws.cell(row=ind_linha, column=ind_coluna).alignment = alinhamento_centralizado
        ws.cell(row=ind_linha, column=ind_coluna).fill = cor_celulas__tabela

## 8 - Aplicando uma função no excel para calcular total e média

In [59]:
# Calculando o total de verba para os filmes
ws.cell(row=dataframe.shape[0]+2, column=1).value = f"=SUM(A2:A{dataframe.shape[0]+1})"
# Calculando a média das notas dos filmes
ws.cell(row=dataframe.shape[0]+2, column=19).value = f"=AVERAGE(S2:S{dataframe.shape[0]+1})"

# 9 - Estilizando a linha de totais

In [60]:
# Definindo função que adiciona linha de total
for coluna in range(1,21):
    ws.cell(row=dataframe.shape[0]+2, column=coluna).fill = cor_celulas_total
    ws.cell(row=dataframe.shape[0]+2, column=coluna).font = fonte_total

# 10 - Salvando o resultado em um arquivo .xlsx

In [61]:
# Salvando um worksheet intermediário
arquivo.save(filename='Planilha Filmes.xlsx')