## **Importando as bibliotecas**

In [1]:
import pandas as pd
import numpy as np

## Documentação:


- [Documentação](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.DataFrame.html)
- [PDF de Pandas](https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf)
- [Documentação do Método drop](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html).

## **Sumario:**

- [Criando Series](#criando-series)
  - [Visualizando Series](#visualizando-series)
- [Criando Databases](#criando-databases)
  - [Criando um DataFrame a partir de um array](#criando-um-dataframe-a-partir-de-um-array)
  - [Criando um DataFrame a partir de um dicionário](#criando-um-dataframe-a-partir-de-um-dicionário)
  - [Copiando DataFrame](#copiando-dataframe)
  - [Transpondo o DataFrame](#transpondo-o-dataframe)
  - [Visualizando Databases](#visualizando-databases)
    - [Visualizando uma coluna](#visualizando-uma-coluna)
    - [Visualizando valores de uma coluna](#visualizando-valores-de-uma-coluna)
    - [Visualizando repetição de valores de uma coluna](#visualizando-repetição-de-valores-de-uma-coluna)
    - [Visualizando estatísticas](#visualizando-estatísticas)
    - [Operações matemáticas](#operações-matemáticas)
    - [Visualizando valores nulos](#visualizando-valores-nulos)
- [Adicionando Dados](#adicionando-dados)
  - [Adicionando uma nova Coluna](#adicionando-uma-nova-coluna)
  - [Adicionando uma nova Linha](#adicionando-uma-nova-linha)
  - [Adicionando mais de uma linha (Concatenando "Linhas")](#adicionando-mais-de-uma-linha-concatenando-linhas)
  - [Usando Reindex](#usando-reidex)
  - [Reindexando sem perder os dados](#reindexando-sem-perder-os-dados)
  - [Renomeando uma coluna](#renomeando-uma-coluna)
- [Excluindo Dados](#excluindo-dados)
  - [Excluindo Colunas](#excluindo-colunas)
  - [Excluindo Linhas](#excluindo-linhas)
  - [Localizando e deletando](#localizando-e-deletando)
- [Consultando Dados](#consultando-dados)
  - [Consultas por Índice](#consultas-por-indice)
  - [Consultas por Fatiamento](#consultas-por-fatiamento)
  - [Consulta com critérios](#consulta-com-criterios)
  - [Consulta com mais de um critério](#consulta-com-mais-de-um-criterio)
- [Consulta por Query](#consulta-por-query)
  - [Consulta por Query com mais de um critério](#consulta-por-query-com-mais-de-um-criterio)

## **Criando Series**

### **Visualizando Series**

## **Criando Databases**

index são "Linhas" e columns sao "Colunas"

#### Criando um DataFrame a partir de um array

In [2]:
array1 = np.array([[0,1,2],[3,4,5]])
dataframe1 = pd.DataFrame(array1, columns=['col1','col2','col3'])

# Exibindo o DataFrame

dataframe1

Unnamed: 0,col1,col2,col3
0,0,1,2
1,3,4,5


#### Criando um DataFrame a partir de um dicionário

In [3]:
pop_data = {'Flamengo': [56,72,90,71, 71],
        'Palmeiras': [63, 80,74,58,66],
        'Corinthians': [72, 44,56,51,57]}

futebol = pd.DataFrame(pop_data, index=[2017,2018,2019,2020,2021])
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57


#### Copiando Dataframe

In [4]:
futebol2 = futebol.copy()
futebol2

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57


#### Transpondo o DataFrame

In [5]:
futebolT = futebol.T
futebolT

Unnamed: 0,2017,2018,2019,2020,2021
Flamengo,56,72,90,71,71
Palmeiras,63,80,74,58,66
Corinthians,72,44,56,51,57


### **Visualizando Databases**

#### Visualizando uma coluna

In [6]:
futebol['Flamengo']

2017    56
2018    72
2019    90
2020    71
2021    71
Name: Flamengo, dtype: int64

#### Visualizando valores de uma coluna

In [7]:
futebol['Flamengo'].values

array([56, 72, 90, 71, 71], dtype=int64)

#### Visualizando repetição de valores de uma coluna

In [8]:
futebol['Flamengo'].value_counts()

Flamengo
71    2
56    1
72    1
90    1
Name: count, dtype: int64

#### Visualizando estatísticas

In [9]:
futebol.describe()

Unnamed: 0,Flamengo,Palmeiras,Corinthians
count,5.0,5.0,5.0
mean,72.0,68.2,56.0
std,12.062338,8.786353,10.319884
min,56.0,58.0,44.0
25%,71.0,63.0,51.0
50%,71.0,66.0,56.0
75%,72.0,74.0,57.0
max,90.0,80.0,72.0


#### Operações matemáticas

In [10]:
futebol.sum()

Flamengo       360
Palmeiras      341
Corinthians    280
dtype: int64

In [11]:
futebol.sum(axis='columns')

2017    191
2018    196
2019    220
2020    180
2021    194
dtype: int64

In [12]:
futebol.mean()

Flamengo       72.0
Palmeiras      68.2
Corinthians    56.0
dtype: float64

In [13]:
futebol.median()

Flamengo       71.0
Palmeiras      66.0
Corinthians    56.0
dtype: float64

In [14]:
futebol.min()

Flamengo       56
Palmeiras      58
Corinthians    44
dtype: int64

In [15]:
futebol.max()

Flamengo       90
Palmeiras      80
Corinthians    72
dtype: int64

#### Visualizando valores nulos

In [16]:
futebol.isnull()

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,False,False,False
2018,False,False,False
2019,False,False,False
2020,False,False,False
2021,False,False,False


### **Adcionando Dados**

#### Adicionando uma nova Colunas

In [17]:
futebol['nova'] = np.NaN
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova
2017,56,63,72,
2018,72,80,44,
2019,90,74,56,
2020,71,58,51,
2021,71,66,57,


In [18]:
futebol['Flamengo2'] = futebol['Flamengo']*2
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142


#### Adicionando uma nova Linhas

In [19]:
futebol.loc[len(futebol.index)] = [0, 0, 0, 0, 0]
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0


#### Adcionando mais de uma linha (Concatenando "Linhas")

In [20]:
# Isso faz com que o index resete

fut = {'Flamengo': [0,0],
        'Palmeiras': [0,'Deletar'],
        'Corinthians': [0,0],
        'nova': [0,0],
        'Flamengo2':[0,0]
       }
  
fut2 = pd.DataFrame(fut) 
  
futebol = pd.concat([futebol, fut2], ignore_index = True)
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
0,56,63,72,,112
1,72,80,44,,144
2,90,74,56,,180
3,71,58,51,,142
4,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


#### Usando Reidex

In [21]:
futebol3 = futebol.copy()
futebol3 = futebol3.reindex([2017, 2018, 2019, 2020, 2021, 5, 6, 7])
futebol3

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
2017,,,,,
2018,,,,,
2019,,,,,
2020,,,,,
2021,,,,,
5,0.0,0,0.0,0.0,0.0
6,0.0,0,0.0,0.0,0.0
7,0.0,Deletar,0.0,0.0,0.0


#### Reindexando sem perder os dados

In [22]:
futebol['Data'] = [2017,2018,2019,2020,2021,5,6,7] #Criei uma coluna 'Data' para poder usar o set_index

'''
df.set_index('xcol') makes the column 'xcol' 
become the index (when it is a column of df).

df.reindex(myList), however, takes indexes from outside the dataframe, 
for example, from a list named myList that we defined somewhere else.
'''

futebol = futebol.set_index(['Data'])
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


#### Renomeando uma coluna

In [23]:
futebol.rename(columns={'nova':'CAM'}) #Só visualização

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,CAM,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [24]:
futebol = futebol.rename(columns={'nova':'CAM'})
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,CAM,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [25]:
futebol.rename(columns={'CAM':'Atletico'}, inplace=True)
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Atletico,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


### **Excluindo Dados**

#### Excluindo Colunas

In [26]:
futebol.drop(['Atletico','Flamengo2'], axis='columns') #Só visualização
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Atletico,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [27]:
futebol.drop(['Atletico'], inplace=True, axis='columns')
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2017,56,63,72,112
2018,72,80,44,144
2019,90,74,56,180
2020,71,58,51,142
2021,71,66,57,142
5,0,0,0,0
6,0,0,0,0
7,0,Deletar,0,0


In [28]:
del futebol['Flamengo2']
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
5,0,0,0
6,0,0,0
7,0,Deletar,0


#### Excluindo Linhas

In [29]:
futebol.drop(5) #Só visualização

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
6,0,0,0
7,0,Deletar,0


In [30]:
futebol.drop([5,6], inplace= True)
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
7,0,Deletar,0


#### Localizando e deletando

In [31]:
i = futebol.loc[(futebol['Palmeiras'] == "Deletar")]
futebol.drop(i.index, inplace=True) # O .index informa que voce quer a linha, nao a coluna.
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57


### **Consultando Dados**

#### Consultas por Indice

In [32]:
futebol.loc[2017] # Seria o indice 0

Flamengo       56
Palmeiras      63
Corinthians    72
Name: 2017, dtype: object

In [33]:
futebol.loc[2017]['Flamengo']

56

In [34]:
futebol.loc[[2017,2019,2021]]

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2019,90,74,56
2021,71,66,57


In [35]:
futebol.iloc[0,2] # Loc pega o indice da linha, o ILOC pega linha e a coluna [linha ,coluna]

72

#### Consultas por Fatiamento

In [36]:
futebol[0:2]

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44


In [37]:
futebol[:1]['Flamengo']

Data
2017    56
Name: Flamengo, dtype: int64

#### Consulta com criterios

In [38]:
futebol.loc[futebol['Flamengo'] < 80]

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2020,71,58,51
2021,71,66,57


In [39]:
futebol.loc[futebol['Flamengo'] == 71]

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2020,71,58,51
2021,71,66,57


#### Consulta com mais de um criterio

In [40]:
futebol.loc[(futebol['Flamengo'] < 80) & (futebol['Corinthians'] == 72)]

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72


### **Consulta por Query**

In [41]:
futebol.query('Flamengo == 71')

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2020,71,58,51
2021,71,66,57


#### Consulta por Query com mais de um criterio

In [42]:
futebol.query('60 <= Flamengo < 80') #Imagina que isso diz, "Está entre", para facilitar

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2018,72,80,44
2020,71,58,51
2021,71,66,57
