# Introdução ao pandas Series



Aqui vamos abordar sucintamente aspectos introdutórios sobre o tema. É claro que aqui não tem muita novidade, a não ser uma organização um pouco mais didática e facilitada. Tudo que se aborda aqui é a luz da [documentação](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.html).

O primeiro passo é importar a biblioteca pandas, que tipicamente é renomeada como sendo "pd". Isso é feito apenas para deixar o código mais enxuto e melhor de ser implementado. **Lembre que o seu código será lido por outras pessoas**. 



In [None]:
import pandas as pd 

Agora vamos construir um exemplo de pandas Series para discutirmos as suas características.

In [None]:
s1 = pd.Series(data = [True, 21, 'Matemática'], 
               index = ['Alice', 'Bob', 'Carlos'])

s1

Os dados que estamos representando é essencialmente a lista: 

 <font color='red'> [True, 21, 'Matemática'], </font>

cuja cada elemento tem um *índice* correspondente 

<font color='red'> ['Alice', 'Bob', 'Carlos'].</font>

Observe ainda o dtype : object. Aqui o pandas está interpretando os elementos como sendo um objeto genérico. 

Vejamos agora um segundo exemplo:

In [None]:
s2 = pd.Series(data = [18, 21, 13], 
               index = ['Alice', 'Bob', 'Carlos'])

s2

Quando os nossos dados de entrada são todo inteiros, automaticamente o pandas reconheceu os dados como sendo do formato inteiro! 

Aqui então já notamos uma grande diferença com o tratamento típico de arrays (por exemplo, NumPy ndarrays) é que <font color='red'> pandas Series suporta dados de entrada em diferentes formatos.</font>

Em resumo, podemos compreender um objeto Pandas Series como um array 1-dimensional de dados indexados. 

# Atributos

Curtas e rápidas sobre alguns dos atributos do pd.Series:

In [None]:
# Checando tipo de dados
s2.dtype

In [None]:
# Acessando os índices da série
s1.index

In [None]:
#Acessando os valores de uma série
s1.values

In [None]:
#Shape dos dados
s1.shape

In [None]:
#Quantidade de elementos nos dados
s1.size

In [None]:
#Acessando o primeiro elemento da série
s1[0]

In [None]:
#Acessando o índices de 0 à 1
s1[0:2]

# Métodos

Curtas e rápidas sobre alguns métodos do pd.Series:

In [None]:
#Concatenar duas series
s1 = pd.Series([1,'oi',3]) #Se índices não forem informados, eles serão 0,1,2...
s2 = pd.Series(['tchau', 5, 6], index = ['x', 'y', 'z'])
s3 = s1.append(s2)
s3

In [None]:
# Concatenar duas series ignorando indice da segunda
s1.append(s2, ignore_index=True)

Vamos ilustrar agora o método apply, que serve para "aplicar" uma função ao pandas series. Por exemplo, a tarefa de elevar todos os números ao quadrado.

In [None]:
#Passo 1: Definir a função:
def square(x): return x*x;

#Passo 2: Chamar a função via método apply:
s = pd.Series([1, 2, 3])
s.apply(square)

In [None]:
#Deletando valores de uma série por indice:
s = pd.Series(data=[18, 21, 22], index=['Alice', 'Bob', 'Carlos'])
s.drop(labels = ['Bob', 'Carlos'])


In [None]:
#Deletando valores com dados com NaN
s = pd.Series(data = [float("NaN"), 21, 22], index=['Alice', 'Bob', 'Carlos'])
print(" Antes: \n")
print(s)
print("\n Depois: \n ")
s.dropna()

In [None]:
#Substituindo valores com dados com NaN
s = pd.Series(data = [float("NaN"), 21, 22], index=['Alice', 'Bob', 'Carlos'])
s.fillna(value = 0)

In [None]:
#Conversões
s = pd.Series(data=[18, 21, 22], index=['Alice', 'Bob', 'Carlos'])

#Json
print(" Jason: {}".format(s.to_json()))

#Latex
print("\n Latex: \n")
print(s.to_latex())

#Lista
print("\n Lista: {}".format(s.to_list()))


In [None]:
#Valores unicos
s = pd.Series(data=[18, 18, 22], index=['Alice', 'Bob', 'Carlos'])
s.unique()

In [None]:
#Substitui valores via clásula where
s = pd.Series(data = [16, 18, 22])

#inplace serve para modificar objeto original
#Substitui valores quando a condição é falsa
s.where(s < 18, "Hot") #Se não < 18, então "Hot"

Por fim, uma observação importante é que em geral os métodos não alteram o estado original do pandas Series: na verdade apenas retornam uma cópia modificada. 

In [None]:
print(" Série original: \n")
print(s)

print("\n Cópia modificada: \n")
s2 = s.where(s < 18, "Hot")
print(s2)

Nesse caso, se você quiser alterar a série original sem a necessidade de armazenar em um novo elemento, você precisa configurar o parâmetro "inplace" que por padrão é "False":

In [None]:
print(" Série original: \n")
print(s)

s.where(s < 18, "Hot", inplace= True)

print(" Série Modificada: \n")
print(s)

Racínio análogo com respeito ao "inplace" também se aplica aos outros métodos, você deve explicitar quando deseja fazer alterações na série original.