<a href="https://colab.research.google.com/github/pierrebomfim/business-intelligence/blob/main/Openpyxl.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pandas, Openpyxl e automação no Excel

"**Pandas** is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language".

Como diz a definição acima, retirada do [site oficial](https://pandas.pydata.org/) da biblioteca, **Pandas** é uma poderosa ferramenta para trabalhar com dados tabulares de forma geral. Isso inclui manipular tabelas e arquivos de excel.

<center><img width="50%" src="https://cdn.pixabay.com/photo/2016/12/08/15/45/panda-1892023_960_720.png"></center>

Porém, se você precisa trabalhar com planilhas de excel, de forma que se tenha um controle mais fino sobre o arquivo em si, a biblioteca **Openpyxl** poderá te ajudar, atuando em conjunto com o Pandas, para te proporcionar maior automação e eficiência nas sua tarefa.
Com o Openpyxl você pode acessar, manipular, editar e criar planilhas. Também é possível inserir fórmulas, imagens e graficos.

Abaixo, vamos demonstrar de forma básica algumas aplicações dessa biblioteca.

In [3]:
# atualizando a lib
!pip install -U openpyxl -q

## 1 - Acessando o arquivo .csv com pandas

Criar planilha é uma das várias possibilidades do `Openpyxl`. Neste exemplo, vamos usar o `Pandas` para abrir um arquivo no formato .csv e criar um dataframe. E, com o `openpyxl`, transferir esse dataframe para um novo arquivo xlsx.

In [4]:
# importando o pandas e os dados
import pandas as pd
df = pd.read_csv('/content/Informa+º+Áes_demogr+íficas(G+¬nero_Idade_2022.09.27-2022.10.03).csv')

# visualizando o data frame
df.head()

Unnamed: 0,Gênero,Faixa de idade,Impressões,Porcentagem do total conhecido
0,Masculino,18 a 24,59,"6,40%"
1,Masculino,25 a 34,107,"11,61%"
2,Masculino,35 a 44,82,"8,89%"
3,Masculino,45 a 54,73,"7,92%"
4,Masculino,55 a 64,28,"3,04%"


## 2 -Transformando para .xlsx
Uma vez carregado nosso data frame, é hora de trabalhar com o openpyxl. Vamos, primeiramente, importar o módulo `Workbook` e o `dataframe_to_rows`, que transforma o dataframe em linhas.

In [5]:
# importando os pacotes necessários
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

In [9]:
# criando a planilha
workbook = Workbook()

# acessando a aba
sheet = workbook.active

Com nossa planilha aberta, fazemos uma iteração sobre os dados do data frame para inserir os mesmos na planilha.

In [10]:
# iterando sobre o dataframe, inserindo os dados nas células
for row in dataframe_to_rows(df, index=False, header=True):
  sheet.append(row)

# salvando a planilha
workbook.save(filename='novaplanilha.xlsx')

Finalizado! Agora, os dados retirados de um arquivo .csv estão disponíveis como uma tabela no excel.

## 3 -Editando planilha com `openpyxl`

In [11]:
# importando o modulo para abrir um arquivo
from openpyxl import load_workbook

wb = load_workbook(filename = '/content/novaplanilha.xlsx')


In [15]:
# Acessando uma célula específica da planilha
sheet = wb['Sheet']
print(sheet['B2'].value)

18 a 24


---
Este laptop foi inspirado no conteúdo da aula do curso:

<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Python do Zero**
*by [sigmoidal.ai](https://sigmoidal.ai)*
