## **Importando as bibliotecas**

In [551]:
import pandas as pd
import numpy as np

## Documentação:


- [Documentação](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.DataFrame.html)
- [PDF de Pandas](https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf)
- [Documentação do Método drop](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html).

## **Sumario:**

- [Criando Series](#criando-series)
  - **Visualizando Series**
- [Criando Databases](#criando-databases)
  - [Criando um DataFrame a partir de um array](#criando-um-dataframe-a-partir-de-um-array)
  - [Criando um DataFrame a partir de um dicionário](#criando-um-dataframe-a-partir-de-um-dicionário)
  - [Copiando DataFrame](#copiando-dataframe)
  - [Transpondo o DataFrame](#transpondo-o-dataframe)
  - **Visualizando Databases**
    - [Visualizando uma coluna](#visualizando-uma-coluna)
    - [Visualizando valores de uma coluna](#visualizando-valores-de-uma-coluna)
    - [Visualizando repetição de valores de uma coluna](#visualizando-repetição-de-valores-de-uma-coluna)
    - [Visualizando estatísticas](#visualizando-estatísticas)
    - [Operações matemáticas](#operações-matemáticas)
    - [Visualizando valores nulos](#visualizando-valores-nulos)
- [Adicionando Dados](#adicionando-dados)
  - [Adicionando uma nova Coluna](#adicionando-uma-nova-coluna)
  - [Adicionando uma nova Linha](#adicionando-uma-nova-linha)
  - [Adicionando mais de uma linha (Concatenando "Linhas")](#adicionando-mais-de-uma-linha-concatenando-linhas)
  - [Reindexando sem perder os dados](#reindexando-sem-perder-os-dados)
  - [Renomeando uma coluna](#renomeando-uma-coluna)
- [Excluindo Dados](#excluindo-dados)
  - [Excluindo Colunas](#excluindo-colunas)
  - [Excluindo Linhas](#excluindo-linhas)
  - [Localizando e deletando](#localizando-e-deletando)

## **Criando Series**

### **Visualizando Series**

## **Criando Databases**

index são "Linhas" e columns sao "Colunas"

#### Criando um DataFrame apartir de um array

In [552]:
array1 = np.array([[0,1,2],[3,4,5]])
dataframe1 = pd.DataFrame(array1, columns=['col1','col2','col3'])

# Exibindo o DataFrame

dataframe1

Unnamed: 0,col1,col2,col3
0,0,1,2
1,3,4,5


#### Criando um DataFrame apartir de um dicionario

In [553]:
pop_data = {'Flamengo': [56,72,90,71, 71],
        'Palmeiras': [63, 80,74,58,66],
        'Corinthians': [72, 44,56,51,57]}

futebol = pd.DataFrame(pop_data, index=[2017,2018,2019,2020,2021])
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57


#### Copiando Dataframe

In [554]:
futebol2 = futebol.copy()
futebol2

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57


#### Transpondo o DataFrame

In [555]:
futebolT = futebol.T
futebolT

Unnamed: 0,2017,2018,2019,2020,2021
Flamengo,56,72,90,71,71
Palmeiras,63,80,74,58,66
Corinthians,72,44,56,51,57


### **Visualizando Databases**

#### Visualizando uma coluna

In [556]:
futebol['Flamengo']

2017    56
2018    72
2019    90
2020    71
2021    71
Name: Flamengo, dtype: int64

#### Visualizando valores de uma coluna

In [557]:
futebol['Flamengo'].values

array([56, 72, 90, 71, 71], dtype=int64)

#### Visualizando repetição de valores de uma coluna

In [558]:
futebol['Flamengo'].value_counts()

Flamengo
71    2
56    1
72    1
90    1
Name: count, dtype: int64

#### Visualizando estatísticas

In [559]:
futebol.describe()

Unnamed: 0,Flamengo,Palmeiras,Corinthians
count,5.0,5.0,5.0
mean,72.0,68.2,56.0
std,12.062338,8.786353,10.319884
min,56.0,58.0,44.0
25%,71.0,63.0,51.0
50%,71.0,66.0,56.0
75%,72.0,74.0,57.0
max,90.0,80.0,72.0


#### Operações matemáticas

In [560]:
futebol.sum()

Flamengo       360
Palmeiras      341
Corinthians    280
dtype: int64

In [561]:
futebol.sum(axis='columns')

2017    191
2018    196
2019    220
2020    180
2021    194
dtype: int64

In [562]:
futebol.mean()

Flamengo       72.0
Palmeiras      68.2
Corinthians    56.0
dtype: float64

In [563]:
futebol.median()

Flamengo       71.0
Palmeiras      66.0
Corinthians    56.0
dtype: float64

In [564]:
futebol.min()

Flamengo       56
Palmeiras      58
Corinthians    44
dtype: int64

In [565]:
futebol.max()

Flamengo       90
Palmeiras      80
Corinthians    72
dtype: int64

#### Visualizando valores nulos

In [566]:
futebol.isnull()

Unnamed: 0,Flamengo,Palmeiras,Corinthians
2017,False,False,False
2018,False,False,False
2019,False,False,False
2020,False,False,False
2021,False,False,False


### **Adcionando Dados**

#### Adicionando uma nova Colunas

In [567]:
futebol['nova'] = np.NaN
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova
2017,56,63,72,
2018,72,80,44,
2019,90,74,56,
2020,71,58,51,
2021,71,66,57,


In [568]:
futebol['Flamengo2'] = futebol['Flamengo']*2
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142


#### Adicionando uma nova Linhas

In [569]:
futebol.loc[len(futebol.index)] = [0, 0, 0, 0, 0]
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0


#### Adcionando mais de uma linha (Concatenando "Linhas")

In [570]:
# Isso faz com que o index resete

fut = {'Flamengo': [0,0],
        'Palmeiras': [0,'Deletar'],
        'Corinthians': [0,0],
        'nova': [0,0],
        'Flamengo2':[0,0]
       }
  
fut2 = pd.DataFrame(fut) 
  
futebol = pd.concat([futebol, fut2], ignore_index = True)
futebol

Unnamed: 0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
0,56,63,72,,112
1,72,80,44,,144
2,90,74,56,,180
3,71,58,51,,142
4,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


#### Reindexando sem perder os dados

In [571]:
futebol['Data'] = [2017,2018,2019,2020,2021,5,6,7] #Criei uma coluna 'Data' para poder usar o set_index

'''
df.set_index('xcol') makes the column 'xcol' 
become the index (when it is a column of df).

df.reindex(myList), however, takes indexes from outside the dataframe, 
for example, from a list named myList that we defined somewhere else.
'''

futebol = futebol.set_index(['Data'])
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,nova,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


#### Renomeando uma coluna

In [572]:
futebol.rename(columns={'nova':'CAM'}) #Só visualização

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,CAM,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [573]:
futebol = futebol.rename(columns={'nova':'CAM'})
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,CAM,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [574]:
futebol.rename(columns={'CAM':'Atletico'}, inplace=True)
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Atletico,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


### **Excluindo Dados**

#### Excluindo Colunas

In [575]:
futebol.drop(['Atletico','Flamengo2'], axis='columns') #Só visualização
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Atletico,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017,56,63,72,,112
2018,72,80,44,,144
2019,90,74,56,,180
2020,71,58,51,,142
2021,71,66,57,,142
5,0,0,0,0.0,0
6,0,0,0,0.0,0
7,0,Deletar,0,0.0,0


In [576]:
futebol.drop(['Atletico'], inplace=True, axis='columns')
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians,Flamengo2
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2017,56,63,72,112
2018,72,80,44,144
2019,90,74,56,180
2020,71,58,51,142
2021,71,66,57,142
5,0,0,0,0
6,0,0,0,0
7,0,Deletar,0,0


In [577]:
del futebol['Flamengo2']
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
5,0,0,0
6,0,0,0
7,0,Deletar,0


#### Excluindo Linhas

In [578]:
futebol.drop(5) #Só visualização

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
6,0,0,0
7,0,Deletar,0


In [579]:
futebol.drop([5,6], inplace= True)
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
7,0,Deletar,0


#### Localizando e deletando

In [580]:
i = futebol.loc[(futebol['Palmeiras'] == "Deletar")]
futebol.drop(i.index, inplace=True) # O .index informa que voce quer a linha, nao a coluna.
futebol

Unnamed: 0_level_0,Flamengo,Palmeiras,Corinthians
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2017,56,63,72
2018,72,80,44
2019,90,74,56
2020,71,58,51
2021,71,66,57
