# Dataframes

In [43]:
import pandas as pd

In [44]:
data = [[1, 2, 3], 
        [4, 5, 6], 
        [7, 8, 9]]

In [45]:
data

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [46]:
df1 = pd.DataFrame(data)

In [47]:
df1

Unnamed: 0,0,1,2
0,1,2,3
1,4,5,6
2,7,8,9


In [48]:
index = ['Linha' + str(i) for i in range(3)]

In [49]:
index

['Linha0', 'Linha1', 'Linha2']

In [50]:
df1 = pd.DataFrame(data, index=index)
df1

Unnamed: 0,0,1,2
Linha0,1,2,3
Linha1,4,5,6
Linha2,7,8,9


In [51]:
columns = ['Coluna' + str(i) for i in range(3)]
columns

['Coluna0', 'Coluna1', 'Coluna2']

In [52]:
df1 = pd.DataFrame(data, index=index, columns=columns)
df1

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,1,2,3
Linha1,4,5,6
Linha2,7,8,9


In [53]:
data = {'Coluna0': {'Linha0': 1, 'Linha1': 4, 'Linha2': 7},
        'Coluna1': {'Linha0': 2, 'Linha1': 5, 'Linha2': 8},
        'Coluna2': {'Linha0': 3, 'Linha1': 6, 'Linha2': 9}}

In [54]:
data

{'Coluna0': {'Linha0': 1, 'Linha1': 4, 'Linha2': 7},
 'Coluna1': {'Linha0': 2, 'Linha1': 5, 'Linha2': 8},
 'Coluna2': {'Linha0': 3, 'Linha1': 6, 'Linha2': 9}}

In [55]:
df2 = pd.DataFrame(data)
df2

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,1,2,3
Linha1,4,5,6
Linha2,7,8,9


In [56]:
# a partir de tuplas
data = [(1, 2, 3), 
        (4, 5, 6), 
        (7, 8, 9)]

data

[(1, 2, 3), (4, 5, 6), (7, 8, 9)]

In [57]:
df3 = pd.DataFrame(data = data, index = index, columns = columns)
df3

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,1,2,3
Linha1,4,5,6
Linha2,7,8,9


In [58]:
df1[df1 > 0] = 'A'
df1

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,A,A,A
Linha1,A,A,A
Linha2,A,A,A


In [59]:
df2[df2 > 0] = 'B'
df2

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,B,B,B
Linha1,B,B,B
Linha2,B,B,B


In [60]:
df3[df3 > 0] = 'C'
df3

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,C,C,C
Linha1,C,C,C
Linha2,C,C,C


In [61]:
# concatenação pelas colunas
df4 = pd.concat([df1, df2, df3])
df4

Unnamed: 0,Coluna0,Coluna1,Coluna2
Linha0,A,A,A
Linha1,A,A,A
Linha2,A,A,A
Linha0,B,B,B
Linha1,B,B,B
Linha2,B,B,B
Linha0,C,C,C
Linha1,C,C,C
Linha2,C,C,C


In [62]:
# concatenação pelas linhas
df4 = pd.concat([df1, df2, df3], axis = 1)
df4


Unnamed: 0,Coluna0,Coluna1,Coluna2,Coluna0.1,Coluna1.1,Coluna2.1,Coluna0.2,Coluna1.2,Coluna2.2
Linha0,A,A,A,B,B,B,C,C,C
Linha1,A,A,A,B,B,B,C,C,C
Linha2,A,A,A,B,B,B,C,C,C


# Organizando DataFrame (sort)

In [63]:
import pandas as pd

In [64]:
data = [[1,2,3], [4,5,6], [7,8,9]]
data

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [65]:
list('321')

['3', '2', '1']

In [66]:
df = pd.DataFrame(data, list('321'), list('ZYX'))
df

Unnamed: 0,Z,Y,X
3,1,2,3
2,4,5,6
1,7,8,9


In [67]:
# organiza o DataFrame pelo índice das linhas
df.sort_index(inplace=True)
df

Unnamed: 0,Z,Y,X
1,7,8,9
2,4,5,6
3,1,2,3


In [68]:
# organiza o DataFrame pelas colunas
df.sort_index(inplace=True, axis=1)
df

Unnamed: 0,X,Y,Z
1,9,8,7
2,6,5,4
3,3,2,1


In [69]:
# coloca a coluna X em ordem crescente
df.sort_values(by='X', inplace=True)
df

Unnamed: 0,X,Y,Z
3,3,2,1
2,6,5,4
1,9,8,7


In [70]:
df.sort_values(by = '3', axis = 1, inplace = True)
df

Unnamed: 0,Z,Y,X
3,1,2,3
2,4,5,6
1,7,8,9


# Formas de Seleção

In [71]:
import pandas as pd

In [72]:
data = [(1, 2, 3, 4),
        (5, 6, 7, 8),
        (8, 10, 11, 12),
        (13, 14, 15, 16)]
df = pd.DataFrame(data, 'l1 l2 l3 l4'.split(), 'c1 c2 c3 c4'.split())

In [74]:
# cria uma lista de itens
'l1 l2 l3 l4'.split()

['l1', 'l2', 'l3', 'l4']

In [75]:
df

Unnamed: 0,c1,c2,c3,c4
l1,1,2,3,4
l2,5,6,7,8
l3,8,10,11,12
l4,13,14,15,16


In [76]:
df.loc[['l3', 'l2']]

Unnamed: 0,c1,c2,c3,c4
l3,8,10,11,12
l2,5,6,7,8


In [77]:
df.iloc[0,1]

2

In [78]:
df.iloc[[2,0],[3,0]]

Unnamed: 0,c4,c1
l3,12,8
l1,4,1


# Contadores

In [1]:
import pandas as pd

In [2]:
s = pd.Series(list('asdadeadesdasesda'))
s

0     a
1     s
2     d
3     a
4     d
5     e
6     a
7     d
8     e
9     s
10    d
11    a
12    s
13    e
14    s
15    d
16    a
dtype: object

In [3]:
s.unique()

array(['a', 's', 'd', 'e'], dtype=object)

In [5]:
#distribuição de frequências
s.value_counts()

a    5
d    5
s    4
e    3
dtype: int64

In [6]:
dados = pd.read_csv('dados/aluguel.csv', sep=';')

In [7]:
dados.Tipo.unique()

array(['Apartamento', 'Casa', 'Casa de Condomínio', 'Casa de Vila',
       'Quitinete'], dtype=object)

In [8]:
dados.Tipo.value_counts()

Apartamento           16923
Casa de Condomínio      964
Casa                    898
Quitinete               813
Casa de Vila            233
Name: Tipo, dtype: int64