# Construindo um Data Frame

**Documentação:** [pandas.DataFrame](https://https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html)

# Importando a biblioteca PANDAS

In [None]:
import pandas as pd

# Criando DataFrame do zero

In [107]:
# Definindo valores e atribuindo-os as suas respectivas colunas

l1 = {'COL1':[10, 12, 14, 16],
      'COL2':[3, 2, 1, 0],
      'COL3':[7, 8, 9, 10],
      'COL4':[12, 23, 45, 56]}

l1

{'COL1': [10, 12, 14, 16],
 'COL2': [3, 2, 1, 0],
 'COL3': [7, 8, 9, 10],
 'COL4': [12, 23, 45, 56]}

In [108]:
# Construindo a tabela co o dicionário l1

df = pd.DataFrame(
    data = l1, # Determina os valores das células
    index = ['A', 'B', 'C', 'D'], # Determina a respresentação dos índices
    columns = ['COL1', 'COL2', 'COL3', 'COL4'] # Determina as colunas da tabela
    )

df

Unnamed: 0,COL1,COL2,COL3,COL4
A,10,3,7,12
B,12,2,8,23
C,14,1,9,45
D,16,0,10,56


## Dtypes - Pra que serve?


¹Utilizado para determinar o tipo que cada valor na célula \
terá, se str, int, float e etc...

²Também serve para retornar os tipos de um DataFrame

In [182]:
# Determinando o tipo dos valores

l1 = {'COL1':[10, 12, 14, 16],
      'COL2':[3, 2, 1, '1'],
      'COL3':[7, 8, 9, 10],
      'COL4':[12, 23, 45, 56]}

l1

df = pd.DataFrame(
    data = l1,
    index = ['A', 'B', 'C', 'D'],
    columns = l1.keys(),
    dtype = float
    )

df

Unnamed: 0,COL1,COL2,COL3,COL4
A,10.0,3.0,7.0,12.0
B,12.0,2.0,8.0,23.0
C,14.0,1.0,9.0,45.0
D,16.0,1.0,10.0,56.0


In [142]:
# Mostrando qual o tipo das células da tabela

df.dtypes

COL1    float64
COL2    float64
COL3    float64
COL4    float64
dtype: object

# Exemplos

### Exemplo 1

In [149]:
# Sem definir coluna e índice
df = pd.DataFrame(data =[[1],
                         [2],
                         [3]])
df

Unnamed: 0,0
0,1
1,2
2,3


### Exemplo 2

In [159]:
df = pd.DataFrame(data =[[1, 'a'],
                         [2, 'b'],
                         [3, 'b']],
                  index = ['+1', '+2', '+3'],
                  columns = ['COL1', 'COL2'])
df


Unnamed: 0,COL1,COL2
1,1,a
2,2,b
3,3,b


## Exemplo 3

In [187]:
# Nesse caso é obrigatório definir o index

df = pd.DataFrame(data = {'COL1': 1, 'COL2': 2, 'COL3': 3},
                  index = [1, 2, 3])

df

Unnamed: 0,COL1,COL2,COL3
1,1,2,3
2,1,2,3
3,1,2,3


# Usando Dicionário


Nesse caso as chaves do dicionário serão as colunas e os \
valores referentes a cada uma das chaves representará uma \
linha na tabela:

dic = { \
        'col1': ['a', 'b', 'c'], \
        'col2': ['a', 'b', 'c'], \
        'col3': ['a', 'b', 'c'] \
}

df = pd.DataFrame(dic) \
df \

Vai aparecer uma tabela 3x3 onde as chaves \
col1, col2, col3 serão as colunas e seus \
respectivos valores são as linhas de cada \
coluna

In [None]:
# Definindo um dicionário
dicionario = {
    'Coluna1': ['A1', 'A2', 'A3'],
    'Coluna2': ['B1', 'B2', 'B3'],
    'Coluna3': ['B3', 'B2', 'B3'],
    }

dicionario

{'Coluna1': ['A1', 'A2', 'A3'],
 'Coluna2': ['B1', 'B2', 'B3'],
 'Coluna3': ['B3', 'B2', 'B3']}

In [None]:
# Salvando o dicionário como uma tabela data frame

df = pd.DataFrame(dicionario)
df

Unnamed: 0,Coluna1,Coluna2,Coluna3
0,A1,B1,B3
1,A2,B2,B2
2,A3,B3,B3


In [None]:
df.loc[0:1]

Unnamed: 0,Coluna1,Coluna2,Coluna3
0,A1,B1,B3
1,A2,B2,B2
