# Series

O primeiro tipo de dado que aprenderemos é a Serie. Vamos importar Pandas e explorar tal objeto.

A Serie é muito semelhante a uma matriz NumPy (na verdade, ela é construída em cima do objeto de matriz NumPy). O que diferencia a matriz NumPy de uma Série, é que uma Serie pode ter rótulos de eixos, o que significa que pode ser indexado por um rótulo, em vez de apenas uma localização numérica. Também não precisa manter dados numéricos, ele pode conter qualquer objeto Python arbitrário.

Vamos explorar este conceito através de alguns exemplos:

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
import numpy as np
import pandas as pd

### Criando uma Serie

Você pode converter uma lista, numpy array ou dicionário para uma série:

In [9]:
labels = ['a a','b','c'] #lista
minha_lista = [10,20,30] #lista
arr = np.array([10,20,30]) #array
d = {'a':10,'b':20,'c':30} #dicionario

** Usando listas **

In [10]:
pd.Series(data=minha_lista) #serie

Unnamed: 0,0
0,10
1,20
2,30


In [11]:
s1 = pd.Series(data=minha_lista,index=labels)

In [12]:
s1

Unnamed: 0,0
a a,10
b,20
c,30


In [17]:
s1['a a']
s1.b

20

In [None]:
pd.Series(minha_lista,labels)

a    10
b    20
c    30
dtype: int64

** NumPy Arrays **

In [None]:
#pd.Series(arr)
pd.Series(minha_lista)

0    10
1    20
2    30
dtype: int64

In [None]:
pd.Series(arr,labels)

a    10
b    20
c    30
dtype: int64

** Dicionários **

In [None]:
pd.Series(d)

a    10
b    20
c    30
dtype: int64

### Dados nas Series

Uma série de pandas pode conter uma variedade de tipos de objeto:

In [None]:
pd.Series(data=labels)

0    a
1    b
2    c
dtype: object

In [None]:
# Mesmo funções (embora seja improvável que você use isso)
pd.Series([sum,print,len])

0      <built-in function sum>
1    <built-in function print>
2      <built-in function len>
dtype: object

## Usando um Índice

A chave para usar uma Serie é entender seu índice. O Pandas faz uso desses nomes ou números de índice, permitindo pesquisas rápidas de informações (funciona como uma tabela de hash ou dicionário).

Vamos ver alguns exemplos de como pegar informações de uma Serie. Vamos criar duas Series, ser1 e ser2:

In [18]:
ser1 = pd.Series([1,2,3,4], ['EUA', 'Alemanha','USSR', 'Japão'])

In [19]:
ser1

Unnamed: 0,0
EUA,1
Alemanha,2
USSR,3
Japão,4


In [20]:
ser2 = pd.Series([1,2,5,4],index = ['EUA', 'Alemanha','Italia', 'Japão'])

In [21]:
ser2

Unnamed: 0,0
EUA,1
Alemanha,2
Italia,5
Japão,4


In [22]:
ser1['EUA']
ser1.EUA

1

As operações também são feitas com base no índice:

In [23]:
ser1 * ser2

Unnamed: 0,0
Alemanha,4.0
EUA,1.0
Italia,
Japão,16.0
USSR,


In [30]:
s1 = pd.Series([1,2,5,4])
s2 = pd.Series([1,4,10,16, 20])

In [31]:
print(s1)
print(s2)
s1-s2

0    1
1    2
2    5
3    4
dtype: int64
0     1
1     4
2    10
3    16
4    20
dtype: int64


Unnamed: 0,0
0,0.0
1,-2.0
2,-5.0
3,-12.0
4,


Vamos parar aqui por enquanto e passar para a DataFrames, que expandirá o conceito da Serie!