# Integração Python com Excel: Pandas e Openpyxl

A integração entre Python e Excel é uma funcionalidade essencial para muitos profissionais e entusiastas de dados. Duas das principais bibliotecas utilizadas para esse propósito são o **Pandas** e o **Openpyxl**. Cada uma dessas bibliotecas possui suas peculiaridades e utilizações específicas, atendendo a diferentes necessidades dos usuários.

## Pandas

O **Pandas** é, sem dúvida, a forma mais amplamente utilizada para a integração Python com o Excel. Essa biblioteca é conhecida por tratar o Excel como uma base de dados, proporcionando uma série de funcionalidades poderosas. Com o **Pandas**, é possível realizar diversas operações no arquivo Excel, como leitura, escrita, manipulação de dados e muito mais. Ele torna a interação com o Excel extremamente flexível, permitindo ao usuário explorar as informações e realizar análises complexas.

Uma das principais vantagens do **Pandas** é a capacidade de desfazer a estrutura original do arquivo, caso seja necessário editar ou transformar os dados de forma significativa. Isso possibilita a limpeza e a preparação dos dados para análise, o que é fundamental em projetos de ciência de dados e outras atividades que envolvam informações complexas.

## Openpyxl

Por outro lado, temos o **Openpyxl**, que se destaca por tratar o Excel como uma planilha em sua forma mais tradicional. Com essa biblioteca, é possível editar o arquivo "como se fosse um VBA" (Visual Basic for Applications), o que atrai os usuários familiarizados com essa linguagem de programação. O **Openpyxl** é especialmente útil para quem deseja trabalhar com planilhas complexas, contendo várias abas e formatos específicos.

Apesar de suas vantagens, é importante observar que o **Openpyxl** pode ser menos eficiente em comparação ao Pandas em algumas situações. Além disso, embora ele preserve mais a estrutura original do arquivo Excel, é preciso ter cautela, pois nem sempre todos os detalhes são mantidos. Portanto, é recomendado realizar testes e verificações para garantir a integridade dos dados durante o processo de manipulação.

Em resumo, tanto o **Pandas** quanto o **Openpyxl** são ferramentas valiosas para a integração entre Python e Excel, cada uma com suas particularidades e usos específicos. A escolha da biblioteca mais adequada dependerá das necessidades e objetivos do projeto em questão. Ambas são poderosas e oferecem uma ampla gama de recursos, tornando a tarefa de trabalhar com dados do Excel muito mais eficiente e produtiva.

### Exercício

Como o aumento do imposto sobre os serviços, com um novo multiplicador de 1.2, afetará os preços dos produtos e serviços na planilha? 
Quais produtos serão impactados por essa mudança e como podemos atualizar os preços para refletir o aumento do imposto?

In [3]:
# Pandas
import pandas as pd

tbl = pd.read_excel("Produtos.xlsx")
tbl

Unnamed: 0,Produtos,Preço Líquido,Tipo,Imposto,Preço Bruto
0,TV,1600,Produto,1.1,1760.0
1,MBA,5000,Serviço,1.3,6500.0
2,Notebook,2800,Produto,1.1,3080.0
3,Exames laboratorias,500,Serviço,1.3,650.0
4,AirFryer,450,Produto,1.1,495.0
5,Eletricista,250,Serviço,1.3,325.0
6,Curso de Idiomas,200,Serviço,1.3,260.0


In [5]:
# Modificando o Imposto
tbl.loc[tbl["Tipo"]=="Serviço", "Imposto"] = 1.2

# Calculando o Preço Bruto, pois a fórmula foi ignorada pelo pandas
tbl["Preço Líquido"] = tbl["Imposto"] * tbl["Preço Bruto"]

# Criando um novo arquivo xlsx
tbl.to_excel("ProdutosPandas.xlsx", index=False)

In [9]:
# Openpyxl
from openpyxl import Workbook, load_workbook

tbl = load_workbook("Produtos.xlsx")

aba_ativa = tbl.active

for celula in aba_ativa["C"]:
    if celula.value == "Serviço":
        linha = celula.row
        aba_ativa[f"D{linha}"] = 1.2
        
# Novo arquivo xlsx
tbl.save("ProdutosOpenPy.xlsx")