<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Python do Zero**
*by [sigmoidal.ai](https://sigmoidal.ai)*

---

## Navegando pela Planilha

Uma vez dentro da planliha, é importante saber como navegar por ela, encontrar e manipular células. Apesar de simples, é de extrema importância.


<center><img width="50%" src="https://images.unsplash.com/photo-1515879218367-8466d910aaa4?ixlib=rb-1.2.1&ixid=eyJhcHBfaWQiOjEyMDd9&auto=format&fit=crop&w=750&q=80"></center>

Mais uma vez lembrando da importância de atualizar a biblioteca e carregar os dados via upload. O arquivo utilizado aqui é o mesmo que já utilizamos nos módulos anteriores e na aula anterior.

In [1]:
# atualizando o pacote
!pip install -U openpyxl -q

In [2]:
# carregando uma planilha
from openpyxl import load_workbook

workbook = load_workbook(filename='controle_da_empresa.xlsx')

# verificando as abas
sheet = workbook['Vendas']

## Acessando as Células
Para acessar as células de uma planilha, vamos fazer como fizemos no notebook anterior, passando a célula que desejamos utilizar como parâmetro.

In [3]:
# acessando um intervalo
sheet['A1:C2']

((<Cell 'Vendas'.A1>, <Cell 'Vendas'.B1>, <Cell 'Vendas'.C1>),
 (<Cell 'Vendas'.A2>, <Cell 'Vendas'.B2>, <Cell 'Vendas'.C2>))

Caso não passemos a linha, ele retorna a coluna inteira.




In [5]:
# acessando a coluna inteira
sheet['A']

(<Cell 'Vendas'.A1>,
 <Cell 'Vendas'.A2>,
 <Cell 'Vendas'.A3>,
 <Cell 'Vendas'.A4>,
 <Cell 'Vendas'.A5>,
 <Cell 'Vendas'.A6>,
 <Cell 'Vendas'.A7>,
 <Cell 'Vendas'.A8>,
 <Cell 'Vendas'.A9>,
 <Cell 'Vendas'.A10>,
 <Cell 'Vendas'.A11>,
 <Cell 'Vendas'.A12>,
 <Cell 'Vendas'.A13>,
 <Cell 'Vendas'.A14>,
 <Cell 'Vendas'.A15>,
 <Cell 'Vendas'.A16>,
 <Cell 'Vendas'.A17>,
 <Cell 'Vendas'.A18>,
 <Cell 'Vendas'.A19>,
 <Cell 'Vendas'.A20>,
 <Cell 'Vendas'.A21>,
 <Cell 'Vendas'.A22>,
 <Cell 'Vendas'.A23>,
 <Cell 'Vendas'.A24>,
 <Cell 'Vendas'.A25>,
 <Cell 'Vendas'.A26>,
 <Cell 'Vendas'.A27>,
 <Cell 'Vendas'.A28>,
 <Cell 'Vendas'.A29>,
 <Cell 'Vendas'.A30>,
 <Cell 'Vendas'.A31>,
 <Cell 'Vendas'.A32>,
 <Cell 'Vendas'.A33>,
 <Cell 'Vendas'.A34>,
 <Cell 'Vendas'.A35>,
 <Cell 'Vendas'.A36>,
 <Cell 'Vendas'.A37>,
 <Cell 'Vendas'.A38>,
 <Cell 'Vendas'.A39>,
 <Cell 'Vendas'.A40>,
 <Cell 'Vendas'.A41>,
 <Cell 'Vendas'.A42>,
 <Cell 'Vendas'.A43>,
 <Cell 'Vendas'.A44>,
 <Cell 'Vendas'.A45>,
 <Cell 'Vendas'.A46

Da mesma forma, podemos passar apenas a linha, e temos como resultado todas as colunas para aquela linha.

In [6]:
# acessando a linha inteira
sheet[1]

(<Cell 'Vendas'.A1>,
 <Cell 'Vendas'.B1>,
 <Cell 'Vendas'.C1>,
 <Cell 'Vendas'.D1>,
 <Cell 'Vendas'.E1>,
 <Cell 'Vendas'.F1>)

## Iterando Sobre os Dados

Uma forma mais efetiva de buscarmos determinado intervalo é utilizando uma estrutura de repetição para iterar sobre os dados e nos retornar as células que desejamos.

Para isso, vamos criar um loop for para utilizar o método `iter_rows`, para iterar pelas linhas e retornar as células.

Aqui, podemos passar parâmetros para definir em que linhas e colunas será feita a iteração.

Os valores min indicam onde começa a iteração, e max, onde termina.

In [7]:
sheet.iter_rows()

<generator object Worksheet._cells_by_row at 0x7fbbddca0d50>

In [10]:
# iterando sobre os dados
for row in sheet.iter_rows(min_row=1,
                           max_row=2,
                           min_col=1,
                           max_col=2):
  print(row)

(<Cell 'Vendas'.A1>, <Cell 'Vendas'.B1>)
(<Cell 'Vendas'.A2>, <Cell 'Vendas'.B2>)


Da mesma forma, é possível iterar sobre as colunas.

In [11]:
# iterando sobre os dados
for col in sheet.iter_cols(min_row=1,
                           max_row=2,
                           min_col=1,
                           max_col=2):
  print(col)

(<Cell 'Vendas'.A1>, <Cell 'Vendas'.A2>)
(<Cell 'Vendas'.B1>, <Cell 'Vendas'.B2>)


Até agora, estamos recebendo tuplas com informações sobre as células. Entretanto, na maioria dos casos, isso não será tão informativo. Nosso objeto de interesse é o valor contido em cada célula.

Para coletar os valores que estão lá, passaremos o parâmetro `values_only` como True, para que ele nos retorne o valor contido nas células do intervalo que definimos para a iteração.

In [12]:
# iterando sobre os dados
for value in sheet.iter_rows(min_row=1,
                             max_row=2,
                             min_col=1,
                             max_col=2,
                             values_only=True):
  print(value)

('Data da Venda', 'Item')
(datetime.datetime(2020, 1, 2, 0, 0), 'Lente 50mm f/1.4')


Caso esse seja o único parâmetro passado, a iteração será feita sobre toda a planilha, coletando os dados de todas as células.

In [14]:
# interando pela planilha inteira
for value in sheet.iter_rows(values_only=True):
  print (value)

('Data da Venda', 'Item', 'Quantidade', 'Vendedor', 'Preço Unitário', 'Total de Vendas')
(datetime.datetime(2020, 1, 2, 0, 0), 'Lente 50mm f/1.4', 2, 'Carlos', 1649, 3298)
(datetime.datetime(2020, 1, 2, 0, 0), 'Filtro ND 5 Stop', 2, 'Raquel', 1220, 2440)
(datetime.datetime(2020, 1, 3, 0, 0), 'Filtro ND 5 Stop', 2, 'Raquel', 1220, 2440)
(datetime.datetime(2020, 1, 3, 0, 0), 'Lente 16-35mm f/2.8', 2, 'Carlos', 8997, 17994)
(datetime.datetime(2020, 1, 4, 0, 0), 'Lente 16-35mm f/2.8', 2, 'Fernanda', 8997, 17994)
(datetime.datetime(2020, 1, 4, 0, 0), 'Filtro ND 3 Stop', 1, 'Raquel', 1220, 1220)
(datetime.datetime(2020, 1, 4, 0, 0), 'Lente 16-35mm f/2.8', 2, 'Carlos', 8997, 17994)
(datetime.datetime(2020, 1, 4, 0, 0), 'DJI Ronin-S', 2, 'Theo', 5790, 11580)
(datetime.datetime(2020, 1, 4, 0, 0), 'Lente 16-35mm f/2.8', 2, 'Carlos', 8997, 17994)
(datetime.datetime(2020, 1, 5, 0, 0), 'Lente 85mm f/1.4', 2, 'Raquel', 9989, 19978)
(datetime.datetime(2020, 1, 5, 0, 0), 'DJI Ronin-S', 2, 'Theo', 5790