In [4]:
import pandas as pd
df1 = pd.DataFrame({'A': {'X': 1}, 'B': {'X': 2}})
df2 = pd.DataFrame({'C': {'X': 3}, 'D': {'X': 4}})
pd.concat([df1, df2])

Unnamed: 0,A,B,C,D
X,1.0,2.0,,
X,,,3.0,4.0


In [5]:
dados = [('A', 'B'), ('C', 'D')]
df = pd.DataFrame(dados, columns = ['L1', 'L2'],  index = ['C1', 'C2'])
df

Unnamed: 0,L1,L2
C1,A,B
C2,C,D


In [6]:
dados = [[1, 2, 3], [4, 5, 6]]
index = 'X,Y'.split(',')
columns = list('CBA')[::-1]
df = pd.DataFrame(dados, index, columns)
df

Unnamed: 0,A,B,C
X,1,2,3
Y,4,5,6


In [7]:
dados = {'A': {'X': 1, 'Y': 3}, 'B': {'X': 2, 'Y': 4}}
df = pd.DataFrame(dados)
df

Unnamed: 0,A,B
X,1,2
Y,3,4


In [8]:
import pandas as pd

numeros = [i for i in range(11)]
letras = [chr(i + 65) for i in range(11)]
nome_coluna = ['N']

df = pd.DataFrame(data = numeros, index = letras, columns = nome_coluna)

In [9]:
selecao = df['N'].isin([i for i in range(11) if i % 2 == 0])
df = df[selecao]
df

Unnamed: 0,N
A,0
C,2
E,4
G,6
I,8
K,10


## Organizando DataFrames

In [10]:
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
data

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [11]:
list('321')

['3', '2', '1']

In [12]:
df = pd.DataFrame(data, list('321'), list('ZYX'))

In [13]:
df

Unnamed: 0,Z,Y,X
3,1,2,3
2,4,5,6
1,7,8,9


In [15]:
df.sort_index(inplace = True)
df

Unnamed: 0,Z,Y,X
1,7,8,9
2,4,5,6
3,1,2,3


In [16]:
df.sort_index(inplace = True, axis = 1)
df

Unnamed: 0,X,Y,Z
1,9,8,7
2,6,5,4
3,3,2,1


In [17]:
df.sort_values(by = 'X', inplace = True)
df

Unnamed: 0,X,Y,Z
3,3,2,1
2,6,5,4
1,9,8,7


In [18]:
df.sort_values(by = ['X','Y'], inplace = True)
df

Unnamed: 0,X,Y,Z
3,3,2,1
2,6,5,4
1,9,8,7


In [19]:
df.sort_values(by = '3', axis = 1, inplace = True)
df

Unnamed: 0,Z,Y,X
3,1,2,3
2,4,5,6
1,7,8,9


In [20]:
df.sort_index()
df.sort_index(axis = 1)
df

Unnamed: 0,Z,Y,X
3,1,2,3
2,4,5,6
1,7,8,9


In [21]:
import pandas as pd
alunos = pd.DataFrame({'Nome': ['Ary', 'Cátia', 'Denis', 'Beto', 'Bruna', 'Dara', 'Carlos', 'Alice'], 
                        'Sexo': ['M', 'F', 'M', 'M', 'F', 'F', 'M', 'F'], 
                        'Idade': [15, 27, 56, 32, 42, 21, 19, 35], 
                        'Notas': [7.5, 2.5, 5.0, 10, 8.2, 7, 6, 5.6], 
                        'Aprovado': [True, False, False, True, True, True, False, False]}, 
                        columns = ['Nome', 'Idade', 'Sexo', 'Notas', 'Aprovado'])
alunos

Unnamed: 0,Nome,Idade,Sexo,Notas,Aprovado
0,Ary,15,M,7.5,True
1,Cátia,27,F,2.5,False
2,Denis,56,M,5.0,False
3,Beto,32,M,10.0,True
4,Bruna,42,F,8.2,True
5,Dara,21,F,7.0,True
6,Carlos,19,M,6.0,False
7,Alice,35,F,5.6,False


In [22]:
selecao = alunos['Aprovado'] == True
aprovados = alunos[selecao]
aprovados

Unnamed: 0,Nome,Idade,Sexo,Notas,Aprovado
0,Ary,15,M,7.5,True
3,Beto,32,M,10.0,True
4,Bruna,42,F,8.2,True
5,Dara,21,F,7.0,True


# Formas de Seleção

In [38]:
data = [(1, 2, 3, 4),
        (5, 6, 7, 8),
        (8, 10, 11, 12),
        (13, 14, 15, 16)]
df = pd.DataFrame(data, 'l1 l2 l3 l4'.split(), 'c1 c2 c3 c4'.split())

In [25]:
df

Unnamed: 0,c1,c2,c3,c4
l1,1,2,3,4
l2,5,6,7,8
l3,8,10,11,12
l4,13,14,15,16


In [26]:
'l1 l2 l3 l4'.split() 

['l1', 'l2', 'l3', 'l4']

In [27]:
df['c1']

l1     1
l2     5
l3     8
l4    13
Name: c1, dtype: int64

In [28]:
type(df['c1'])

pandas.core.series.Series

In [29]:
df[['c3','c1']]

Unnamed: 0,c3,c1
l1,3,1
l2,7,5
l3,11,8
l4,15,13


In [30]:
df[:]

Unnamed: 0,c1,c2,c3,c4
l1,1,2,3,4
l2,5,6,7,8
l3,8,10,11,12
l4,13,14,15,16


In [31]:
df[1:3]

Unnamed: 0,c1,c2,c3,c4
l2,5,6,7,8
l3,8,10,11,12


In [32]:
df[1:][['c3', 'c1']]

Unnamed: 0,c3,c1
l2,7,5
l3,11,8
l4,15,13


In [33]:
df.loc['l3']

c1     8
c2    10
c3    11
c4    12
Name: l3, dtype: int64

In [34]:
df.loc[['l3', 'l2']]

Unnamed: 0,c1,c2,c3,c4
l3,8,10,11,12
l2,5,6,7,8


In [35]:
df.iloc[0,1]

2

In [36]:
df.loc[['l3', 'l1'], ['c4','c1']]

Unnamed: 0,c4,c1
l3,12,8
l1,4,1


In [37]:
df.iloc[[2,0],[3,0]]

Unnamed: 0,c4,c1
l3,12,8
l1,4,1


In [39]:
df

Unnamed: 0,c1,c2,c3,c4
l1,1,2,3,4
l2,5,6,7,8
l3,8,10,11,12
l4,13,14,15,16


In [40]:
alunos

Unnamed: 0,Nome,Idade,Sexo,Notas,Aprovado
0,Ary,15,M,7.5,True
1,Cátia,27,F,2.5,True
2,Denis,56,M,5.0,True
3,Beto,32,M,10.0,True
4,Bruna,42,F,8.2,True
5,Dara,21,F,7.0,True
6,Carlos,19,M,6.0,True
7,Alice,35,F,5.6,True


In [41]:
selecao = alunos['Aprovado'] == False
reprovados = alunos.loc[selecao, ['Nome', 'Sexo', 'Idade']]
reprovados

Unnamed: 0,Nome,Sexo,Idade


In [46]:
selecao = alunos['Aprovado'] == False
reprovados = alunos[['Nome', 'Sexo', 'Idade']][selecao]
reprovados

Unnamed: 0,Nome,Sexo,Idade


In [47]:
alunos.sort_values(by = ['Idade'], inplace = True)
alunos.iloc[:3]

Unnamed: 0,Nome,Idade,Sexo,Notas,Aprovado
0,Ary,15,M,7.5,True
6,Carlos,19,M,6.0,True
5,Dara,21,F,7.0,True


In [48]:
alunos.sort_values(by = ['Idade'], inplace = True)
alunos.iloc[1:3]

Unnamed: 0,Nome,Idade,Sexo,Notas,Aprovado
6,Carlos,19,M,6.0,True
5,Dara,21,F,7.0,True


In [49]:
alunos.sort_values(by = ['Idade'], inplace = True)
alunos.iloc[3]

Nome        Cátia
Idade          27
Sexo            F
Notas         2.5
Aprovado     True
Name: 1, dtype: object