In [1]:
import pandas as pd

# Selecionado valores pela posição do index

In [5]:
pokemon = pd.read_csv("../data/pokemon.csv", usecols=["Pokemon"]).squeeze()
google = pd.read_csv("../data/google_stock_price.csv").squeeze()

- Primeiramente, vamos imprimir os primeiros valores de uma serie

In [6]:
pokemon.head()

0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Pokemon, dtype: object

- Nesse caso, a série tem indices numéricos que começa do zero
- A maneira de selecionar valores em uma série é similar a uma lista do Python
- Podemos usar o a notação de colchetes `[]` e passar a posição de um indice
    - **Obs**: Se o indice fosse uma string, poderiamos passar a string, vamos fazer isso logo mais

In [7]:
pokemon[3]

'Charmander'

- Podemos passar uma lista de indices para selecionar vários pokemons
    - Nesse caso, vamos obter uma nova série como resultado

In [8]:
pokemon[[3, 9, 400]]

3      Charmander
9        Caterpie
400     Kricketot
Name: Pokemon, dtype: object

- Também podemos usar a notação de `slices` do Python

In [9]:
pokemon[50:55]

50    Dugtrio
51     Meowth
52    Persian
53    Psyduck
54    Golduck
Name: Pokemon, dtype: object

In [10]:
pokemon[-5:-1]

716    Yveltal
717    Zygarde
718    Diancie
719      Hoopa
Name: Pokemon, dtype: object

# Selecionado valores pelo label do index
- Até o momento carregamos nossos pokemons usando a coluna numerica
- Agora vamos carregar o csv usando os pokemons como indices
- Para isso, vamos usar a função `read_csv` ao nosso favor

In [13]:
pokemon = pd.read_csv("../data/pokemon.csv", index_col="Pokemon").squeeze()
pokemon

Pokemon
Bulbasaur       Grass
Ivysaur         Grass
Venusaur        Grass
Charmander       Fire
Charmeleon       Fire
               ...   
Yveltal          Dark
Zygarde        Dragon
Diancie          Rock
Hoopa         Psychic
Volcanion        Fire
Name: Type, Length: 721, dtype: object

- Observe que agora os pokemons viraram os indices e o tipo dele virou o valor
- Agora que nossos indices são labels (strings) podemos selecionar por eles
- Porém, **ainda é possível selecionar por posição**
    - Pandas é muito flexivel (isso pode ser bom ou ruim, depende do ponto de vista)
    - Ele vai associar a posição do label com um valor numerico
- Vou selecionar a posição 3, que no caso é o indice `Charmander` que tem que retornar `Fire`

In [14]:
pokemon[3]

  pokemon[3]


'Fire'

- O slice também fuciona:

In [15]:
pokemon[0:5]

Pokemon
Bulbasaur     Grass
Ivysaur       Grass
Venusaur      Grass
Charmander     Fire
Charmeleon     Fire
Name: Type, dtype: object

- Perfeito, mas nossa intenção aqui é extrair por label, por posição a gente já fez anteriormente
- Simples: basta usar o nome do label:

In [16]:
pokemon["Charmander"]

'Fire'

- Também podemos usar uma lista de indices
    - Vamos receber uma outra serie com os resultados

In [17]:
pokemon[["Charmander", "Pikachu", "Bulbasaur"]]

Pokemon
Charmander        Fire
Pikachu       Electric
Bulbasaur        Grass
Name: Type, dtype: object

- Pode parecer estranho, mas também é possível usar `slice` para selecionar via label
- Neste caso, ele usa a posição do label para selecionar em sequência

In [18]:
pokemon["Bulbasaur":"Charmander"]

Pokemon
Bulbasaur     Grass
Ivysaur       Grass
Venusaur      Grass
Charmander     Fire
Name: Type, dtype: object

- **Importante:** se usarmos `slice` com labels, o intervalo é fechado, ou seja, `Bulbasaur` e `Charmander` fazem parte do resultado. Isso não acontece com o index
- Temos que ter cuidado ao utilizar essa feature
- Assim como em um dicionário, se você passar um indice que não existe, será retornado uma excessão com `KeyError`

In [19]:
pokemon["Jesimon"]

KeyError: 'Jesimon'

In [None]:
pokemon[["Jesimon", "Pikachu"]]

- Uma maneira de solucionar os casos em que em uma lista de labels uns existam e outros não é usando o método `reindex`
- Em resumo, ele criar um `NaN` para os casos em que o label não existe e não teremos mais uma excessão

In [20]:
pokemon.reindex(index=["Jesimon", "Pikachu"])

Pokemon
Jesimon         NaN
Pikachu    Electric
Name: Type, dtype: object

# Selecionando usando o método `get()`
- Uma outra maneira de selecionar valores pelos indices é usando o `get()`
- Basicamente a gente passa o indice por parametro (pode ser label ou valor numerico) e ele retorna o valor
- É muito similar ao `[]`, a diferença é que é possível definir um valor padrão para quando o indice nao existe

In [21]:
pokemon.head()

Pokemon
Bulbasaur     Grass
Ivysaur       Grass
Venusaur      Grass
Charmander     Fire
Charmeleon     Fire
Name: Type, dtype: object

In [22]:
pokemon.get(0)

  pokemon.get(0)


'Grass'

In [23]:
pokemon.get("Pikachu")

'Electric'

- Quando a gente passa um indice que não existe, ele retorn `None` e portanto não imprime nada aqui no notebook

In [24]:
print(pokemon.get(10000))

None


  print(pokemon.get(10000))


In [25]:
print(pokemon.get("Jesimon"))

None


- Porém, podemos passar o valor `default` como parametro para definir o que retornar nessa ocasião

In [26]:
pokemon.get("Jesimon", default="Nao existe")

'Nao existe'

In [27]:
pokemon.get(20000, default="Nao existe")

  pokemon.get(20000, default="Nao existe")


'Nao existe'

In [28]:
pokemon.get(["Jesimon", "Pikachu"], default="Algum indice nao existe")

'Algum indice nao existe'

# Selecionando os indices dos maiores e menores valores da serie
- Como ja vimos no Notebook 2, podemos usar os métodos `min` e `max` para selecionar o menor e maior valor da série, respectivamente
- Agora vamos selecionar o indice desses valores com os métodos `idxmin` e `idxmax`
- Primeiramente, vamos obter os valores minimo e maximo:

In [29]:
print (f"Min: {google.min()}\nMax: {google.max()}")

Min: 49.95
Max: 782.22


- Agora, vamos obter os indices dos mesmos:

In [30]:
print (f"Idx Min: {google.idxmin()}\nIdx Max: {google.idxmax()}")

Idx Min: 11
Idx Max: 3011


- Vamos verificar o valor de cada posição:

In [31]:
print (f"Min: {google[11]}\nMax: {google[3011]}")

Min: 49.95
Max: 782.22
