In [None]:
import pandas as pd

# Contando valores com o método `value_counts()`
- É possível contar a quantidade de cada uma das entradas numa série

In [None]:
pokemon = pd.read_csv("../data/pokemon.csv", index_col="Pokemon", squeeze=True)
pokemon

In [None]:
pokemon.value_counts()

- Perceba que o método retornou a quantidade de cada tipo da série
- Obviamente, a soma do resultado tem que ser igual ao total de pokemons

In [None]:
print(f"Soma: {pokemon.value_counts().sum()}")
print(f"Total: {pokemon.count()}")

- O método `value_counts()` tem alguns parâmetros que podem ser utilizados (sempre interessante consultar a documentação)

In [None]:
pokemon.value_counts(normalize=True)

In [None]:
pokemon.value_counts(ascending=True, dropna=True)

# Usando método `apply()`
- Esse método é utilizado para aplicar alguma operação customizada (ou função) em todos os elementos da série
- Obviamente, o pandas nao vai cobrir tudo o que você quer operar em cima de uma série
- Esse método espera receber uma função (que pode ser uma lambda) para operar em cima da série

In [None]:
google = pd.read_csv("../data/google_stock_price.csv", squeeze=True)
google.head()

- Vamos definir uma função para ser aplicada na série

In [None]:
def classifica_preco(preco):
    if preco < 300:
        return "Baixo"
    elif preco < 650:
        return "Medio"
    else:
        return "Caro"

- Agora vamos aplicar a função

In [None]:
google.apply(classifica_preco)

- Observe que recebemos uma nova série com o resultado da operação customizada que definimos
- Além disso, o método nao modifica a seria original, ele cria outra
- A função precisa receber um parametro apenas e retornar um valor

- Como disse antes, podemos usar uma função `lambda` (ou função anonima) quando temos uma operação bem simples para fazer
- Vamos supor que eu quero converter todos os valores de USD para BRL
- Para isso, podemos fazer

In [None]:
google.apply(lambda preco: preco*4.7)

# Usando o método `map()`
- Esse método serve para mapear duas séries (ou uma série e um dicionário) que possuem alguma chave em comum
- funciona para achar interseção entre duas séries

In [None]:
pokemon = pd.read_csv("../data/pokemon.csv", usecols=["Pokemon"], squeeze=True)
pokemon_types = pd.read_csv("../data/pokemon.csv", index_col="Pokemon", squeeze=True)

In [None]:
pokemon

In [None]:
pokemon_types.head()

- Agora podemos mapear uma série com a outra. Aquelas que possuem chaves iguals são mantidos
    - Nesse caso vai manter tudo porque estamos carregando o mesmo arquivo

In [None]:
pokemon.map(pokemon_types)

- Também é possivel usar um dicionario para mapeamento

In [None]:
pokemon_dict = {
    "Bulbasaur": "Grass",
    "Ivysaur": "Grass",
    "Venusaur": "Grass",
    "Jesimon": "God",
    "Digimon": "other"    
}

pokemon.map(pokemon_dict)

- Observe que aqueles valores que nao tem interseção, são colocados como `NaN`
- Podemos remover eles do resultado

In [None]:
pokemon.map(pokemon_dict).dropna()