# Series

O primeiro tipo de dado que aprenderemos é a Serie. Vamos importar Pandas e explorar tal objeto.

A Serie é muito semelhante a uma matriz NumPy (na verdade, ela é construída em cima do objeto de matriz NumPy). O que diferencia a matriz NumPy de uma Série, é que uma Serie pode ter rótulos de eixos, o que significa que pode ser indexado por um rótulo, em vez de apenas uma localização numérica. Também não precisa manter dados numéricos, ele pode conter qualquer objeto Python arbitrário.

Vamos explorar este conceito através de alguns exemplos:

In [26]:
import pandas as pd
import numpy as np

### Criando uma Serie
Você pode converter uma lista, numpy array ou dicionário para uma série:

In [27]:
# Definindo uma lista de rótulos
labels = ['ValorA', 'ValorB', 'ValorC']

# Definindo uma lista de valores
minha_lista = [10, 20, 30]

# Convertendo a lista de valores para um array NumPy
arr = np.array([minha_lista])

# Definindo um dicionário de valores
Dicionario = {'Valor1': 10, 'Valor2': 20, 'Valor3': 30}



In [28]:
# Criando uma Serie a partir de uma lista de rótulos
pd.Series(labels)


0    ValorA
1    ValorB
2    ValorC
dtype: object

Atribuindo indices a Serie

In [29]:
# Criando uma Serie a partir de uma lista de rótulos e uma lista de índices
pd.Series(data=labels, index=minha_lista)


10    ValorA
20    ValorB
30    ValorC
dtype: object

In [30]:
# Criando uma Serie a partir de um dicionário
pd.Series(Dicionario)


Valor1    10
Valor2    20
Valor3    30
dtype: int64

In [31]:
# Criando duas Series com índices de países
serie1 = pd.Series(data=[1, 2, 3, 4], index=['Brasil', 'Argentina', 'China', 'Estados Unidos'])
serie2 = pd.Series(data=[1, 2, 3, 5], index=['Brasil', 'Argentina', 'China', 'Paraguai'])

# Somando as duas Series. Onde os índices não coincidem, o resultado será NaN.
print(serie1 + serie2)

Argentina         4.0
Brasil            2.0
China             6.0
Estados Unidos    NaN
Paraguai          NaN
dtype: float64


In [32]:
# Acessando um valor específico na Serie através do índice
serie1['Brasil']

np.int64(1)

In [33]:
# Acessando múltiplos valores na Serie através de uma lista de índices
serie1[['Brasil', 'Argentina']]

Brasil       1
Argentina    2
dtype: int64