In [None]:
import pandas as pd

# --------------------------------------
# 1. LENDO DADOS
# --------------------------------------

# Lendo um arquivo CSV
df = pd.read_csv('lego.csv')
display(df)

# Lendo um dicionário e criando DataFrame
dicionario = {
    'DIA': [12, 13, 14, 15, 16, 17, 18, 19, 20, 21],
    'CLIMA': ['chuva', 'nublado', None, 'limpo', 'nublado', 'chuva', 'limpo', 'nuvens', 'limpo', 'limpo']
}
df = pd.DataFrame(dicionario)
display(df)

# --------------------------------------
# 2. CRIANDO DATAFRAMES COM ÍNDICES E COLUNAS
# --------------------------------------

# Definindo colunas e índices
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['A', 'B', 'C'], index=['A', 'B'])
display(df)

# Tentativa de DataFrame com dados incompatíveis (1D com múltiplas colunas)
df = pd.DataFrame([[1, 2, 3]], columns=['A', 'B', 'C'], index=['A', 'B'])
display(df)

# --------------------------------------
# 3. ACESSANDO DADOS COM ILOC
# --------------------------------------

# Acessando dados com iloc
df = pd.read_csv('lego.csv')
display(df.iloc[12])  # Acessa linha na posição 12 (pode gerar erro se índice não existir)
display(df.iloc[:25])  # Acessa linhas até a posição 25
display(df.iloc[15, 0])  # Acessa elemento na linha 15, coluna 0 (pode gerar erro se fora do limite)

# --------------------------------------
# 4. ACESSANDO COLUNAS
# --------------------------------------

# Criando DataFrame com nomes e idades
dados = {
    'Nome': ['Felipe', 'Ana', 'Maria'],
    'Idade': [12, 23, 45]
}
dados_df = pd.DataFrame(dados)
display(dados_df)

# Acessando colunas específicas
display(dados_df['Nome'])
display(dados_df['Idade'])

# --------------------------------------
# 5. MÉTODOS DE ANÁLISE
# --------------------------------------

# Métodos para análise de DataFrame
df = pd.read_csv('pokemon.csv')
tamanho = df.shape  # Retorna número de linhas e colunas
minimo = df['Attack'].min()  # Valor mínimo da coluna 'Attack'
maximo = df['Attack'].max()  # Valor máximo da coluna 'Attack'
soma = df['Attack'].sum()  # Soma dos valores da coluna 'Attack'
media = df['Attack'].mean()  # Média dos valores da coluna 'Attack'
contagem = df['Attack'].count()  # Contagem de valores não nulos na coluna 'Attack'
primeiros = df.head()  # Primeiras 5 linhas
ultimos = df.tail()  # Últimas 5 linhas
informacoes = df.info()  # Informações gerais do DataFrame
metodos = df.describe()  # Estatísticas descritivas (contagem, média, min, max, etc.)
unicos = df.nunique()  # Contagem de valores únicos por coluna
aleatorios = df.sample(10)  # Amostra aleatória de 10 linhas

# --------------------------------------
# 6. FILTRANDO DADOS
# --------------------------------------

# Criando DataFrame para filtragem
dados = {
    'Nome': ['Lucas', 'Felipe', 'Maria', 'Maria', 'Julia', 'Pedro'],
    'Idade': [27, 34, 12, 33, 56, 20]
}
df = pd.DataFrame(dados)

# Filtragem - Maneira 1: Retorna valores booleanos
# Exemplo 1
display(df['Nome'] == 'Maria')  # Retorna True/False para cada linha onde Nome é 'Maria'

# Filtragem - Maneira 2: Retorna apenas as linhas filtradas
# Exemplo 1
filtro = df['Nome'] == 'Maria'
display(df[filtro])  # Exibe apenas linhas onde Nome é 'Maria'

# Exemplo 2
dados = {
    "Nome": ['Felipe', 'Lucas', 'Antônio'],
    "Salário": [2350, 5600, 1240]
}
df = pd.DataFrame(dados)
filtro = df["Salário"] > 2000
display(df[filtro])  # Exibe linhas onde Salário > 2000

# --------------------------------------
# 7. ORDENANDO DADOS
# --------------------------------------

# Criando DataFrame para ordenação
dados = {
    "Nome": ["Gabriel", "Lucas", "Maria", "Pedro"],
    "Idade": [13, 27, 15, 15]
}
df = pd.DataFrame(dados)

# Ordem crescente
decrescente = df.sort_values(by=['Nome'], ascending=True)

# Ordem decrescente
crescente = df.sort_values(by=['Nome'], ascending=False)

# --------------------------------------
# 8. LENDO E CONVERTENDO ARQUIVOS
# --------------------------------------

# Lendo arquivos de diferentes formatos
# CSV
"""csv = pd.read_csv('nome-do-arquivo.csv')
display(csv)"""

# Excel
"""excel = pd.read_excel('nome-do-arquivo.xlsx')
display(excel)"""

# Convertendo DataFrame para diferentes formatos
# Para CSV
"""df.to_csv('nome-do-arquivo.csv')"""

# Para Excel
"""df.to_excel('nome-do-arquivo.xlsx')"""

# Para HTML
"""df.to_html('nome-do-arquivo.html')"""

# Para JSON
"""df.to_json('nome-do-arquivo.json')"""

# --------------------------------------
# 9. ALTERANDO DADOS
# --------------------------------------

# Lendo arquivo CSV e adicionando colunas
df = pd.read_csv('pokemon.csv')

# Adicionando coluna 'Total'
df['Total'] = df['HP'] + df['Attack'] + df['Defense'] + df['Sp. Atk'] + df['Sp. Def'] + df['Speed']

# Adicionando coluna booleana 'Very Fast'
rapido = df['Very Fast'] = df["Speed"] > 70

# Exibindo colunas específicas
display(df[['Name', 'Type 1', 'Attack']])

# Filtrando dados com condições múltiplas
filtro = (df['Type 1'] == 'Grass') & (df['Type 2'] == 'Poison')
display(df[filtro][['Name', 'Type 1', 'Attack']])

# Outro exemplo de filtragem
filtro = df['Attack'] > 100
display(df[filtro][['Name', 'Type 1', 'Attack']])

# --------------------------------------
# 10. ACESSANDO DADOS COM LOC E ILOC
# --------------------------------------

# Lendo arquivo CSV
df = pd.read_csv('fifa.csv')

# Usando loc (acesso por rótulos)
display(df.loc[5:12])  # Linhas de 5 a 12
display(df.loc[5:12, ["country"]])  # Linhas de 5 a 12, apenas coluna 'country'

# Usando iloc (acesso por índices numéricos)
display(df.iloc[12, [0, 1, 2]])  # Linha 12, colunas 0, 1 e 2
display(df.iloc[12:50, [3, 4]])  # Linhas 12 a 49, colunas 3 e 4

# --------------------------------------
# 11. ORDENANDO DADOS 
# --------------------------------------
# Ordem Crescente (ascending=True)
df = df.sort_values(by='country', ascending=True) # Ordenando em ordem crescente
df = df.sort_values(by=['country', 'confederation'], ascending=True) # Ordenando por múltiplas colunas em ordem crescente

# Ordem decrescente (ascending=False)
df = df.sort_values(by='country', ascending=False) # Ordenando em ordem decrescente
df = df.sort_values(by=['country', 'confederation'], ascending=False) # Ordenando por múltiplas colunas em ordem decrescente

# --------------------------------------
# 12. FILTRANDO DADOS
# --------------------------------------

# Filtrando países que começam com 'A'
filtro = df['country'].str.startswith('A')
display(df[filtro])

# --------------------------------------
# 13. ADICIONANDO E REMOVENDO DADOS
# --------------------------------------

# Adicionar coluna
adicionar = df['fans'] = 250000

# Remover Coluna
del df['confederation']
