### Importando arquivos e bases de dados

In [1]:
import pandas as pd

In [2]:
vendas_df = pd.read_excel('Vendas.xlsx')

In [4]:
display(vendas_df)

Unnamed: 0,Código Venda,Data,ID Loja,Produto,Quantidade,Valor Unitário,Valor Final
0,1,2019-01-01,Iguatemi Esplanada,Sapato Estampa,1,358,358
1,1,2019-01-01,Iguatemi Esplanada,Camiseta,2,180,360
2,1,2019-01-01,Iguatemi Esplanada,Sapato Xadrez,1,368,368
3,2,2019-01-02,Norte Shopping,Relógio,3,200,600
4,2,2019-01-02,Norte Shopping,Chinelo Liso,1,71,71
...,...,...,...,...,...,...,...
93905,65012,2019-11-30,Shopping Vila Velha,Mochila Xadrez,2,283,566
93906,65013,2019-11-30,Ribeirão Shopping,Pulseira Listrado,2,79,158
93907,65013,2019-11-30,Ribeirão Shopping,Cueca Listrado,3,67,201
93908,65014,2019-11-30,Shopping Morumbi,Pulseira Linho,5,114,570


### Resumos de visualização de Dados simples e úteis
- head
- shape
- describe

O método head vai exibir as 5 primeiras linhas do Dataframe, caso queira alteração para mais ou menos linhas, basta especificar um número diferente entre os parênteses.

_Exemplo com 10 linhas: head(10)_

In [12]:
display(vendas_df.head())

Unnamed: 0,Código Venda,Data,ID Loja,Produto,Quantidade,Valor Unitário,Valor Final
0,1,2019-01-01,Iguatemi Esplanada,Sapato Estampa,1,358,358
1,1,2019-01-01,Iguatemi Esplanada,Camiseta,2,180,360
2,1,2019-01-01,Iguatemi Esplanada,Sapato Xadrez,1,368,368
3,2,2019-01-02,Norte Shopping,Relógio,3,200,600
4,2,2019-01-02,Norte Shopping,Chinelo Liso,1,71,71


O método shape irá exibir quantas linhas e colunas possuem em seu Dataframe. Ou seja, mostra o formato do DataFrame como uma tupla (linhas, colunas).

In [15]:
print(vendas_df.shape)

(93910, 7)


O método describe irá exibir estatísticas descritivas para colunas numéricas do Dataframe, ajudando a compreender a distribuição e o resumo estatístico básico dos dados.

Ele fornece:
* _contagem_
* _média_
* _desvio padrão_
* _valores mínimo, máximo e percentis_

In [16]:
display(vendas_df.describe())

Unnamed: 0,Código Venda,Data,Quantidade,Valor Unitário,Valor Final
count,93910.0,93910,93910.0,93910.0,93910.0
mean,32464.762155,2019-06-16 23:52:28.265360896,2.166553,191.725886,414.862656
min,1.0,2019-01-01 00:00:00,1.0,30.0,30.0
25%,16204.0,2019-03-26 00:00:00,1.0,100.0,156.0
50%,32367.0,2019-06-17 00:00:00,2.0,155.0,274.0
75%,48793.75,2019-09-08 00:00:00,3.0,248.0,524.0
max,65014.0,2019-11-30 00:00:00,5.0,750.0,3750.0
std,18809.007093,,1.258732,145.215519,434.846228


### Pegar 1 coluna (e os pd.Series)

_Uma série (Series) do pandas é sempre uma coluna da tabela (Dataframe)._

In [21]:
produtos = vendas_df['Produto']
display(produtos)

0           Sapato Estampa
1                 Camiseta
2            Sapato Xadrez
3                  Relógio
4             Chinelo Liso
               ...        
93905       Mochila Xadrez
93906    Pulseira Listrado
93907       Cueca Listrado
93908       Pulseira Linho
93909        Casaco Xadrez
Name: Produto, Length: 93910, dtype: object

_Acessando apenas uma coluna ~> Uma série_

In [22]:
produtos = vendas_df[['Produto','ID Loja']]
display(produtos)

Unnamed: 0,Produto,ID Loja
0,Sapato Estampa,Iguatemi Esplanada
1,Camiseta,Iguatemi Esplanada
2,Sapato Xadrez,Iguatemi Esplanada
3,Relógio,Norte Shopping
4,Chinelo Liso,Norte Shopping
...,...,...
93905,Mochila Xadrez,Shopping Vila Velha
93906,Pulseira Listrado,Ribeirão Shopping
93907,Cueca Listrado,Ribeirão Shopping
93908,Pulseira Linho,Shopping Morumbi


_Acessando duas colunas ~> É uma tabela extraída da tabela original._

### .loc -> É usado para acessar dados com base nos rótulos de índice.

* Pegar uma linha
* Pegar linhas de acordo com alguma condição
* Pegar linhas e colunas específicas
* Pegar um valor específico

1 - Pegar uma linha

In [31]:
display(vendas_df.loc[1])

Código Venda                        1
Data              2019-01-01 00:00:00
ID Loja            Iguatemi Esplanada
Produto                      Camiseta
Quantidade                          2
Valor Unitário                    180
Valor Final                       360
Name: 1, dtype: object

_Obs: Caso queira exibir mais de uma linha, usamos o fatiamento._

_Exemplo: vendas_df.loc[1:5]_


2 - Pegar linhas de acordo com alguma condição

In [38]:
vendas_norteshopping_df = vendas_df.loc[vendas_df['ID Loja'] == 'Norte Shopping']
display(vendas_norteshopping_df)

Unnamed: 0,Código Venda,Data,ID Loja,Produto,Quantidade,Valor Unitário,Valor Final
3,2,2019-01-02,Norte Shopping,Relógio,3,200,600
4,2,2019-01-02,Norte Shopping,Chinelo Liso,1,71,71
8,7,2019-01-02,Norte Shopping,Camisa Gola V Listrado,1,116,116
9,7,2019-01-02,Norte Shopping,Camisa Liso,1,105,105
100,73,2019-01-02,Norte Shopping,Cueca Xadrez,5,60,300
...,...,...,...,...,...,...,...
93716,64888,2019-11-30,Norte Shopping,Polo Xadrez,1,142,142
93754,64914,2019-11-30,Norte Shopping,Calça Liso,1,190,190
93755,64914,2019-11-30,Norte Shopping,Casaco Estampa,2,256,512
93756,64914,2019-11-30,Norte Shopping,Gorro,2,80,160


_A extração está sendo realizada apenas da coluna 'ID Loja - Norte Shopping'_

### 3 - Pegar linhas e colunas específicas - Usando o .loc

In [40]:
vendas_norteshopping_df = vendas_df.loc[vendas_df['ID Loja'] == 'Norte Shopping', ['ID Loja', 'Produto', 'Quantidade']]
display(vendas_norteshopping_df)

Unnamed: 0,ID Loja,Produto,Quantidade
3,Norte Shopping,Relógio,3
4,Norte Shopping,Chinelo Liso,1
8,Norte Shopping,Camisa Gola V Listrado,1
9,Norte Shopping,Camisa Liso,1
100,Norte Shopping,Cueca Xadrez,5
...,...,...,...
93716,Norte Shopping,Polo Xadrez,1
93754,Norte Shopping,Calça Liso,1
93755,Norte Shopping,Casaco Estampa,2
93756,Norte Shopping,Gorro,2


### 4 - Pegar um valor específico

In [49]:
print(vendas_df.loc[0:5, 'Produto'])

0    Sapato Estampa
1          Camiseta
2     Sapato Xadrez
3           Relógio
4      Chinelo Liso
5       Cinto Linho
Name: Produto, dtype: object


_Obs: Vamos passar (linha, coluna)._