# Tutorial 1 - Introdução à Lib Pandas

___

# Imports para a Aula

In [None]:
import numpy as np
import pandas as pd

# Construção

## Series

In [None]:
""" Construtor padrão """
pd.Series(
    name="Compras",
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"],  
    data=[2, 12, 1, 5, 2]
)

In [None]:
""" Construtor padrão: dados desconhecidos """
pd.Series(
    name="Compras",
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"]
)

In [None]:
""" Construtor padrão: valor padrão """
pd.Series(
    name="Compras",
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"],
    data="fill here"
)

In [None]:
""" Recebendo um Dicionário"""
s = pd.Series({"Leite": 2, "Ovos": 12, "Carne": 1, "Arroz": 5, "Feijão": 2})
s.name = "Compras"
s

In [None]:
""" Recebendo uma Lista"""
s = pd.Series([2, 12, 1, 5, 2])
s

In [None]:
""" editando parâmetros"""
s.name="Compras"
s.index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"]
s

In [None]:
""" Ordenação: Índices """
s.sort_index()

In [None]:
""" Ordenação: Dados """
s.sort_values(ascending=False)

## DataFrame

In [None]:
""" Construtor padrão """
pd.DataFrame(
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"],
    columns=["quantidade", "unidade"],
    data=[
        [ 2,  "L"],
        [12, "Ud"], 
        [ 1, "Kg"],
        [ 5, "Kg"], 
        [ 2, "Kg"]
    ]
)

In [None]:
""" Construtor padrão: dados desconhecidos """
pd.DataFrame(
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"],
    columns=["quantidade", "unidade"]
)

In [None]:
""" Construtor padrão: valor padrão """
pd.DataFrame(
    index=["Leite", "Ovos", "Carne", "Arroz", "Feijão"],
    columns=["quantidade", "unidade"],
    data="?"
)

In [None]:
""" Recebendo um Dicionário"""
pd.DataFrame(
    {
        "quantidade": {
            "Leite": 2, 
            "Ovos": 12, 
            "Carne": 1, 
            "Arroz": 5, 
            "Feijão": 2
        },
        "unidade": {
            "Leite": "L", 
            "Ovos": "Ud", 
            "Carne": "Kg", 
            "Arroz": "Kg", 
            "Feijão": "Kg"
        }
    }
)

In [None]:
""" Recebendo um Dicionário de Series"""
index = ["Leite", "Ovos", "Carne", "Arroz", "Feijão"]
pd.DataFrame(
    {
        "quantidade": pd.Series(index=index,  data=[2, 12, 1, 5, 2]),
        "unidade": pd.Series(index=index,  data=["L", "Ud", "Kg", "Kg", "Kg"])
    }
)

In [None]:
""" Recebendo um vetor de Series"""
index = ["Leite", "Ovos", "Carne", "Arroz", "Feijão"]
df = pd.DataFrame(
    [
        pd.Series(name="quantidade", index=index,  data=[2, 12, 1, 5, 2]),
        pd.Series(name="unidade", index=index,  data=["L", "Ud", "Kg", "Kg", "Kg"])
    ]
)
df

In [None]:
""" Transpondo para ajustar a Tabela """
df = df.T
df

In [None]:
""" editando parâmetros"""
df.index = ["Leite tipo A", "Ovos Orgânicos", "Patinho", "Arroz Arbóreo", "Feijão Preto"]
df.columns = ["Quantidade", "Unidade"]
df

In [None]:
""" Ordenação: Índices """
df.sort_index()

In [None]:
""" Ordenação: Dados """
df.sort_values(by="Unidade", ascending=False)

#  Acessando valores

## Definição das Variáveis

In [None]:
index = pd.Index(data=["Leite", "Ovos", "Carne", "Arroz", "Feijão"], name="Itens")
index

In [None]:
sq = pd.Series(index=index,  data=[2, 12, 1, 5, 2]).sort_values()
sq

In [None]:
su = pd.Series(index=index,  data=["L", "Ud", "Kg", "Kg", "Kg"]).sort_index()
su

In [None]:
df = pd.DataFrame({"Quantidade": sq, "Unidade": su}).sort_values(by="Unidade")
df

In [None]:
df["Preço p/ Ud"] = [5.00, 29.99, 6.50, 3.30, 0.50]
df["Preço Total"] = [25.00, 29.99, 13.00, 6.60, 6.00]
df

## Slicing

### Series

In [None]:
sq

In [None]:
sq[2]

In [None]:
sq[5:2:-1]

In [None]:
sq["Leite"]

In [None]:
sq["Leite":"Arroz"]

###  DataFrame

In [None]:
df

In [None]:
df["Unidade"]

In [None]:
df.Quantidade

In [None]:
""" Uma Coluna do DataFrame é uma Series"""
df["Preço Total"][2]

In [None]:
""" Acesso a mais de uma Coluna """
df[["Preço Total", "Quantidade"]]

In [None]:
""" acesso às Linhas: método 'loc' """
df.loc["Leite"]

In [None]:
""" acesso ao item: método 'loc' """
df.loc["Ovos", "Preço Total"]

In [None]:
""" acesso ao item: método 'iloc' """
df.iloc[4, 3]

In [None]:
""" acesso por slice: método 'loc' """
df.loc["Leite":, "Preço p/ Ud":]

In [None]:
""" acesso por slice: método 'iloc' """
df.iloc[3:, 2:]

#### * Atribuição de Valores em DataFrames

In [None]:
""" Atribuir Valores em 'slices' levanta warnings """
df["Unidade"][[0, 2]] = "Pacote"
df

In [None]:
""" Deve-se usar 'loc' ou 'iloc' """
df.loc["Carne", "Unidade"] = "Kilograma"
df.iloc[3, 1] = "Litro"
df

## Masks

### Conceito

In [None]:
""" mask => array de bool """
sq > 2

In [None]:
""" mask => array de bool """
df > 2

### Aplicação

#### * Series

In [None]:
""" atribuição de valores em uma cópia """
s_tmp = sq.copy()
s_tmp

In [None]:
s_tmp[s_tmp == 2]

In [None]:
s_tmp[s_tmp == 2] = 3
s_tmp

#### * DataFame

In [None]:
""" atribuição de valores em uma cópia """
df_tmp = df[["Preço p/ Ud", "Preço Total"]].copy()
df_tmp

In [None]:
""" mask """
mask = (df_tmp > 5) & (df_tmp < 10)
mask

In [None]:
df_tmp[mask]

In [None]:
tmp2 = df_tmp.copy()
tmp2[mask] = "?"
tmp2

In [None]:
s_tmp[s_tmp == 2] = 3
s_tmp