<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Python do Zero**
*by [sigmoidal.ai](https://sigmoidal.ai)*

---

## Carregando uma Planilha

A biblioteca `openpyxl` permite que seja feita, com facilidade, a manipulação de arquivos em formato .xlsx, do Microsoft Excel por meio do Python. Essa é uma habilidade importantíssima devido ao amplo uso da ferramenta no ambiente profissional.


<center><img width="50%" src="https://image.freepik.com/free-photo/hacking-concept_23-2148165936.jpg"></center>

Vamos ver como ela funciona na prática.

O openpyxl vem por padrão no Colab, mas sua versão desatualizada não será capaz de fazer tudo o que precisamos. Por isso, o primeiro passo sempre que abrir um notebook onde o openpyxl será necessário é rodar o comando abaixo, para atualizar o pacote no notebook.

In [None]:
# atualizando o pacote
!pip install -U openpyxl -q

## Criando uma Planilha

Aqui, vamos entender como funciona a nomenclatura utilizada pelo pacote. A planilha, e aqui leia-se o arquivo xlsx é chamado de `workbook`. Por tanto, vamos criar um objeto do tipo Workbook, e associá-lo à variável workbook.

Dentro de um workbook, podemos ter diferentes *sheets*. Apesar da tradução livre para sheet ser planilha, aqui, vamos trabalhar as **abas** da planilha. 

Sempre precisamos definir qual a aba que será ativada e utilizada. Passando somente o padrão `active`, ele abrirá a primeira aba, aquela que aparece quando abrimos o arquivo. Vamos ver mais pra frente, como fazer para trabalhar com planilhas com variadas abas

In [None]:
# importando a lib
from openpyxl import Workbook

# criando o workbook/ planilha
workbook = Workbook()

# selecionando a aba
sheet = workbook.active

## Escrevendo na Planilha
Agora que estamos dentro da aba, dentro da planilha, podemos acessar as células, e associar valores a elas.

In [None]:
# acessando as células A1 e B1 e associando valores a elas
sheet['A1'] = 'hello'
sheet['B1'] = 'world'

# para salvar as alterações, utilizar o comando abaixo
workbook.save(filename='helloworld.xlsx')

## Carregando uma Planilha

Além de criar planilhas, também podemos acessar planilhas criadas previamente. Como estamos lidando com o Google Colab aqui, vamos fazer o upload da planilha, que foi disponibilizada no material de apoio dessa aula. É a mesma que utilizamos em aulas anteriores, de controle da empresa.

Agora, vamos utilizar um outro módulo da lib openpyxl, que se chama `load_workbook`. Sua função, como o nome sugere, é carregar planilhas.

In [None]:
# carregando uma planilha
from openpyxl import load_workbook

# carregando o arquivo
workbook = load_workbook(filename='controle_da_empresa.xlsx')

# verificando as abas
workbook.sheetnames

['Estoque', 'Vendas', 'Funcionários']

Essa planilha conta com 3 abas diferentes. Por isso, o mais interessante é que utilizemos o comando abaixo, para selecionar a planilha específica que desejamos utilizar.

In [None]:
# selecionando a aba ativa
sheet = workbook['Vendas']

# verificando a aba aberta
sheet.title

'Vendas'

## Acessando as Células
Para acessar uma célula, basta usar o comando abaixo. Lembre-se de passar o método .value, para que a consulta retorne o valor inserido dentro da célula.

In [None]:
# acesando as células
sheet['F10'].value

17994

Também é possível acessar o conteúdo por meio do método cell, passando o número da coluna e da linha.

Atenção para o index do excel que começa em 1, diferente do Python que começa em 0.


In [None]:
# acessando as células
sheet.cell(row=10, column=6).value

Atenção também para alguns argumentos que a função load_workbook recebe.

* `read_only` tem por padrão `False`, o que nos possibilita manipular os dados.

* `data_only` também recebe por padrão o argumento `False`. Caso seja passado `True`, qualquer célula que tenha fórmula, transmitirá somente o valor resultante da ação executada pela fórmula, sem aparesentar a mesma.

In [None]:
# adicione os parênteses e verifique a doc string para ver os argumentos
workbook2 = load_workbook(read_only=True, data_only=True)