### Introdução ao DataFrame

Um DataFrame é uma estrutura de dados bidimensional com colunas que podem ser de diferentes tipos. É semelhante a uma planilha ou uma tabela SQL e é a estrutura de dados mais comumente usada em Pandas para manipulação de dados.

### Criando DataFrames

Vamos começar criando um DataFrame simples para ilustrar as operações básicas.


In [2]:
import pandas as pd
import numpy as np

# Criando um DataFrame
data = {
    'Nome': ['João', 'Maria', 'Pedro', 'Ana'],
    'Idade': [28, 34, 29, 32],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Porto Alegre']
}
df = pd.DataFrame(data)
df

Unnamed: 0,Nome,Idade,Cidade
0,João,28,São Paulo
1,Maria,34,Rio de Janeiro
2,Pedro,29,Belo Horizonte
3,Ana,32,Porto Alegre


In [3]:
# Acessando uma coluna
print(df['Nome'])

# Acessando múltiplas colunas
print(df[['Nome', 'Idade']])

# Slicing de linhas
print(df[0:2])


0     João
1    Maria
2    Pedro
3      Ana
Name: Nome, dtype: object
    Nome  Idade
0   João     28
1  Maria     34
2  Pedro     29
3    Ana     32
    Nome  Idade          Cidade
0   João     28       São Paulo
1  Maria     34  Rio de Janeiro


### Operações Aritméticas

Realizando operações aritméticas com colunas numéricas.

In [4]:
# Adicionando um valor a uma coluna numérica
df['Idade'] += 5
print(df)

# Calculando a média de uma coluna numérica
print(df['Idade'].mean())

    Nome  Idade          Cidade
0   João     33       São Paulo
1  Maria     39  Rio de Janeiro
2  Pedro     34  Belo Horizonte
3    Ana     37    Porto Alegre
35.75


### Filtragem

Utilizando condições para filtrar linhas de um DataFrame

In [6]:
# Filtrando por idade
print(df[df['Idade'] > 30])

    Nome  Idade          Cidade
0   João     33       São Paulo
1  Maria     39  Rio de Janeiro
2  Pedro     34  Belo Horizonte
3    Ana     37    Porto Alegre



### Manipulação de Colunas

Adicionando, alterando e removendo colunas.

In [7]:
# Adicionando uma nova coluna
df['Profissão'] = ['Engenheiro', 'Médico', 'Advogado', 'Designer']

# Alterando uma coluna existente
df['Cidade'] = df['Cidade'].str.upper()

# Removendo uma coluna
df.drop('Idade', axis=1, inplace=True)