In [1]:
import pandas as pd

# Criando uma series

In [2]:
data = [1,2,3,4,5]

In [3]:
s = pd.Series(data)

In [4]:
# isso é uma representação de uma series 
s

0    1
1    2
2    3
3    4
4    5
dtype: int64

In [5]:
# vamos nomear o index das mesmas usando list comprehension

index = ['Linha ' + str (i) for i in range(5)]
index

['Linha 0', 'Linha 1', 'Linha 2', 'Linha 3', 'Linha 4']

In [6]:
# com isso criamos uma series e adicionamos nomes a seus index
s = pd.Series(data = data, index = index)
s

Linha 0    1
Linha 1    2
Linha 2    3
Linha 3    4
Linha 4    5
dtype: int64

In [7]:
## Criando um dicionario com a mesma estrutura acima
data = {'Linha ' + str(i) : i + 1 for i in range(5)}

In [8]:
data

{'Linha 0': 1, 'Linha 1': 2, 'Linha 2': 3, 'Linha 3': 4, 'Linha 4': 5}

In [9]:
# graças a estrutura da variavel 'data'(usado para criar o dicionario), conseguimos criar uma Series recebendo o dicionario
# como valor, com as linhas ja renomeadas
s = pd.Series(data)
s

Linha 0    1
Linha 1    2
Linha 2    3
Linha 3    4
Linha 4    5
dtype: int64

In [10]:
# e possivel realizar operacoes dentro desta series
# com o processo abaixo, adicionamos +2 aos valores previamente inseridos.
s1 = s + 2
s1

Linha 0    3
Linha 1    4
Linha 2    5
Linha 3    6
Linha 4    7
dtype: int64

In [11]:
# tambem e possivel utilizar operacoes entre series que contenham os mesmos indices
s2 = s + s1
s2

Linha 0     4
Linha 1     6
Linha 2     8
Linha 3    10
Linha 4    12
dtype: int64

# DataFrame

In [12]:
# Criando nossos dados, uma lista com listas dentro
data = [[1,2,3],
        [4,5,6],
        [7,8,9]]

In [13]:
# criando nosso dataframe, recebendo nossos dados e a forma na qual ele os exibe
df1 = pd.DataFrame(data = data)
df1

Unnamed: 0,0,1,2
0,1,2,3
1,4,5,6
2,7,8,9


In [14]:
# agora vamos alterar o nome do index, adicionando um rotulo a linha
index = ['Linha ' + str(i) for i in range(3)]
index

['Linha 0', 'Linha 1', 'Linha 2']

In [15]:
df1 = pd.DataFrame(data = data, index = index)
df1

Unnamed: 0,0,1,2
Linha 0,1,2,3
Linha 1,4,5,6
Linha 2,7,8,9


In [16]:
# faremos a mesma coisa para as colunas

columns = ['Coluna ' + str(i) for i in range(3)]
columns

['Coluna 0', 'Coluna 1', 'Coluna 2']

In [17]:
# adicionando agora, o valor das colunas tambem
df1 = pd.DataFrame(data = data, index = index, columns = columns)
df1

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,1,2,3
Linha 1,4,5,6
Linha 2,7,8,9


In [18]:
# caso ja tenhamos um dicionario pronto (com dicionarios dentro) fica ate mais facil para transforma-lo em um DF

data = {'Coluna 0': {'Linha 0': 1, 'Linha 1': 4, 'Linha 2': 7},
        'Coluna 1': {'Linha 0': 2, 'Linha 1': 5, 'Linha 2': 8},
        'Coluna 2': {'Linha 0': 3, 'Linha 1': 6, 'Linha 2': 9}}
data

{'Coluna 0': {'Linha 0': 1, 'Linha 1': 4, 'Linha 2': 7},
 'Coluna 1': {'Linha 0': 2, 'Linha 1': 5, 'Linha 2': 8},
 'Coluna 2': {'Linha 0': 3, 'Linha 1': 6, 'Linha 2': 9}}

In [19]:
df2 = pd.DataFrame(data)
df2

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,1,2,3
Linha 1,4,5,6
Linha 2,7,8,9


In [20]:
# podemos fazer com tuplas tambem

data = [(1,2,3),
        (4,5,6),
        (7,8,9)]
data

[(1, 2, 3), (4, 5, 6), (7, 8, 9)]

In [21]:
df3 = pd.DataFrame(data = data, index = index, columns = columns)
df3

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,1,2,3
Linha 1,4,5,6
Linha 2,7,8,9


In [22]:
# vamos trabalhar com concatenacao de df's
# alterei os valores numericos para se chamarem A

df1[df1 > 0] = 'A'
df1

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,A,A,A
Linha 1,A,A,A
Linha 2,A,A,A


In [23]:
df2[df2 > 0] = 'B'
df2

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,B,B,B
Linha 1,B,B,B
Linha 2,B,B,B


In [24]:
df3[df3 > 0] = 'C'
df3

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,C,C,C
Linha 1,C,C,C
Linha 2,C,C,C


In [25]:
# feita a concatenacao
df4 = pd.concat([df1, df2, df3])
df4

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2
Linha 0,A,A,A
Linha 1,A,A,A
Linha 2,A,A,A
Linha 0,B,B,B
Linha 1,B,B,B
Linha 2,B,B,B
Linha 0,C,C,C
Linha 1,C,C,C
Linha 2,C,C,C


In [26]:
# caso queiramos verificar os resultados um do lado do outro, pode ser feito assim
df4 = pd.concat([df1, df2, df3], axis = 1)
df4

Unnamed: 0,Coluna 0,Coluna 1,Coluna 2,Coluna 0.1,Coluna 1.1,Coluna 2.1,Coluna 0.2,Coluna 1.2,Coluna 2.2
Linha 0,A,A,A,B,B,B,C,C,C
Linha 1,A,A,A,B,B,B,C,C,C
Linha 2,A,A,A,B,B,B,C,C,C
