# O que é uma estrutura de dados(ED) Series?

Series é uma ED composta por um vetor de dados e um vetor
associado de rótulos, este último chamado de índice (index). Ou
seja: **Series = vetor de dados + vetor de rótulos.**

In [4]:
import pandas as pd

# Criando uma Series

In [None]:
# Cria a Series notas
notas = pd.Series([7.6, 5.0, 8.5, 9.5, 6.4])

# Mostra a Series na tela
print(notas)

In [None]:
# Cria a Series alunos
lst_matriculas = ['M02', 'M05', 'M13', 'M14', 'M19']
lst_nomes = ['Bob', 'Dayse', 'Bill', 'Cris', 'Jimi']
alunos = pd.Series(lst_nomes, index=lst_matriculas)

print(alunos)

# Propriedades elementares das Series

Você deve ter notado que, além de ter mostrado os índices e valores de cada **Series**, o comando `print()` do programa anterior também exibiu o `dtype` delas. Trata-se de uma das propriedades básicas das Series, que corresponde ao tipo dos elementos do vetor de dados. O `dtype` de notas é `float64`, que é utilizado para armazenar números reais com dupla precisão (64 bits). Por sua vez, o `dtype` de alunos é `object`, utilizado pela pandas para armazenar dados alfanuméricos (strings). Vale a pena deixar claro que o vetor de dados de uma **Series** sempre conterá valores do mesmo tipo, ou seja, com o mesmo `dtype`.

A tabela a seguir apresenta os cinco principais dtypes da pandas. Na primeira coluna mostramos o nome do dtype , na segunda, o tipo de dado que ele armazena e na terceira, o nome do tipo equivalente no Python padrão.

dtype|Utilização|Tipo Python
:---|:---|:---
int64|números inteiros|int
float64|números reais|float
bool|True/False|bool
object|texto|str
datetime64|data/hora|datetime

É necessário ressaltar que `dtype` não é a mesma coisa que tipo do objeto (type)! O tipo de qualquer objeto Python representa a classe deste objeto e pode ser sempre obtido com o uso da função `type()`. Se você aplicar a função `type()` sobre qualquer Series, sempre receberá como resposta o tipo `pandas.core.series.Series`. Outra consideração importante é que toda **Series** está associada a outras propriedades elementares além do `dtype`.

São elas:

* `values`: vetor de dados;
* `index`: vetor de rótulos;
* `name`: nome do vetor de dados;
* `size`: tamanho da Series (número de elementos);
* `index.name`: nome do vetor de rótulos;
* `index.dtype`: `dtype` do vetor de rótulos;

In [22]:
#P02: Propriedades básicas das Series
import pandas as pd

#cria a Series "alunos"
alunos = pd.Series({'M02':'Bob','M05':'Dayse','M13':'Bill', 'M14':'Cris','M19':'Jimi'})

#atribui nomes p/ os vetores de dados e rótulos
alunos.name = "alunos"
alunos.index.name = "matrículas"

#recupera e imprime as propriedades
print(alunos)
print('=' * 50)
tamanho = alunos.size
dados = alunos.values
rotulos = alunos.index
alunos_tipo = type(alunos)
alunos_dtype = alunos.dtype
alunos_idx_dtype = alunos.index.dtype

print('número de elementos: ', tamanho)
print('vetor de dados: ', dados)
print('vetor de rótulos: ', rotulos)
print('tipo (type): ', alunos_tipo)
print('dtype da Series:', alunos_dtype)
print('dtype do vetor de rótulos:', alunos_idx_dtype)


matrículas
M02      Bob
M05    Dayse
M13     Bill
M14     Cris
M19     Jimi
Name: alunos, dtype: object
número de elementos:  5
vetor de dados:  ['Bob' 'Dayse' 'Bill' 'Cris' 'Jimi']
vetor de rótulos:  Index(['M02', 'M05', 'M13', 'M14', 'M19'], dtype='object', name='matrículas')
tipo (type):  <class 'pandas.core.series.Series'>
dtype da Series: object
dtype do vetor de rótulos: object


# Técnicas para consulta e modificação de dados


In [23]:
import pandas as pd

#cria a Series "alunos"
alunos = pd.Series({'M02':'Bob','M05':'Dayse','M13':'Bill', 'M14':'Cris','M19':'Jimi'})

## 1. Indexação Tradicional

Esta técnica de indexação deve ser utilizada quando você quiser recuperar apenas um elemento da **Series**.

Exemplo|Resultado|Explicação
:---|:---|:---
alunos[0]|Bob|primeiro aluno
alunos[1]|Dayse|segundo aluno
alunos['M14']|Cris|aluno de matrícula 'M14'
alunos[alunos.size-1]|Jimi|último aluno
alunos[-1]|Jimi|outra forma de pegar o últimoaluno

In [37]:
# Exemplos da tabela acima
alunos[1]

'Dayse'

## 2. Fatiamento (slicing)

Esta técnica de indexação baseada em fatiamento (slicing) deve ser utilizada quando você quiser recuperar mais de um elemento da **Series**. Você pode fatiar de duas diferentes formas:

* Por intervalos (ranges) definidos por dois pontos `:`;
* Por listas.

Sintaxe|Explicação
:---|:---
s[i:j]|do elemento de índice i ao de índice j-1
s[i:]|do elemento de índice i até o último
s[:j]|do primeiro elemento ao de índice j-1
s[-k:]|últimos k elementos
s[i:j:k]|do elemento i ao j-1 , utilizando o passo k
s[[lista]]|todos os elementos especificados na lista

Veja alguns exemplos:

Exemplo|Resultado
:---|:---
alunos[0:2]|{M02:Bob, M05:Dayse}
alunos[2:4]|{M13:Bill, M14:Cris}
alunos[:2]|{M02:Bob, M05:Dayse}
alunos[2:]|{M13:Bill, M14:Cris, M19:Jimi}
alunos[-2:]|{M14:Cris, M19:Jimi}
alunos[1:5:2]|{M05:Dayse, M14:Cris}
alunos[[2,0,4]]|{M13:Bill, M02:Bob, M19:Jimi}
alunos[['M13','M02','M19']]|{M13:Bill, M02:Bob, M19:Jimi}

In [None]:
# Exemplos da tabela acima
print(alunos[[2, 0, 4]])
print("=" * 30)
print(alunos[2:])
print("=" * 30)
alunos[['M13','M02','M19']]

## 3. Indexação Booleana

Neste modo de indexação, subconjuntos de dados são selecionados com base nos valores da **Series** (valores do vetor de dados) e não em seus rótulos/índices.

In [48]:
#P03: Indexação booleana
import pandas as pd

#cria as Series "notas" e "alunos"
notas = pd.Series([7.6, 5.0, 8.5, 9.5, 6.4])
alunos = pd.Series({'M02':'Bob','M05':'Dayse','M13':'Bill', 'M14':'Cris','M19':'Jimi'})

#obtém os índices dos alunos aprovados
idx_aprovados = notas[notas >= 7].index

#imprime os alunos aprovados
print('Relação de Alunos Aprovados:')
print('=' * 30)
print(alunos[idx_aprovados])

Relação de Alunos Aprovados:
M02     Bob
M13    Bill
M14    Cris
dtype: object


In [67]:
# Busca em Series
import pandas as pd

#cria a Series "alunos"
alunos = pd.Series({'M02':'Bob','M05':'Dayse','M13':'Bill', 'M14':'Cris','M19':'Jimi'})

#testa se rótulos fazem parte de uma Series
tem_M13 = 'M13' in alunos
tem_M99 = 'M99' in alunos

print("existe o rótulo 'M13'? -> ",tem_M13)

print("existe o rótulo 'M99'? -> ",tem_M99)
print('---------------------------')

#testa se valor faz parte de uma Series
tem_Bob = alunos.isin(['Bob'])

print("existe o valor 'Bob'")
print(tem_Bob)

existe o rótulo 'M13'? ->  True
existe o rótulo 'M99'? ->  False
---------------------------
existe o valor 'Bob'
M02     True
M05    False
M13    False
M14    False
M19    False
dtype: bool
