# Exercícios de Estrutura de Dados com Pandas

## Objetivo
Neste notebook você irá praticar diferentes formas de estruturar dados usando:
- **Dados Estruturados**: Listas organizadas e regulares
- **Dados Semi-estruturados**: Dicionários e estruturas aninhadas
- **Pandas**: Para exibição e manipulação dos resultados

## Instruções Gerais
- Complete cada exercício no espaço indicado
- Use o pandas para exibir os resultados finais
- Analise qual tipo de estrutura é mais adequada para cada situação

## Importação de Bibliotecas

Execute a célula abaixo para importar as bibliotecas necessárias:

In [None]:
import pandas as pd
from datetime import datetime
import json

# Configuração para melhor exibição dos DataFrames
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
print("Bibliotecas importadas com sucesso!")

Bibliotecas importadas com sucesso!


---

## 📊 Exercício 1: Dados Estruturados com Listas

**Tipo**: Dados Estruturados (obrigatório usar listas)

**Cenário**: Você é analista de uma escola e precisa organizar as notas de 5 alunos em 4 disciplinas.

**Dados fornecidos**:
- Alunos: Ana, Bruno, Carlos, Diana, Eduardo
- Disciplinas: Matemática, Português, História, Ciências
- Notas: [8.5, 7.2, 9.1, 6.8], [7.8, 8.3, 7.5, 8.9], [6.2, 9.0, 8.1, 7.4], [9.3, 6.7, 8.8, 7.9], [7.1, 8.5, 6.9, 9.2]

**Tarefa**:
1. Organize os dados em listas Python estruturadas
2. Use pandas para converter em DataFrame com índices e colunas apropriados
3. Exiba o resultado final

In [None]:
# EXERCÍCIO 1 - Complete o código abaixo

import pandas as pd
from datetime import datetime
import json

# Configuração para melhor exibição dos DataFrames
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

# Dados das notas (cada sublista representa as notas de um aluno)
notas_data = [
    ["Nome", "Matemática", "Português", "História", "Ciências" ],
    ["Ana", 8.5, 7.2, 9.1, 6.8],
    ["Bruno", 7.8, 8.3, 7.5, 8.9],
    ["Carlos", 6.2, 9.0, 8.1, 7.4],
    ["Diana", 9.3, 6.7, 8.8, 7.9],
    ["Eduardo", 7.1, 8.5, 6.9, 9.2]
]


# 1. Organize os dados em listas estruturadas (já fornecido acima)
# 2. Crie um DataFrame pandas usando as listas
df_notas = pd.DataFrame(notas_data[1:], columns=notas_data[0])


# 3. Exiba o resultado
print("📊 Notas dos Alunos:")
print(df_notas)

📊 Notas dos Alunos:
      Nome  Matemática  Português  História  Ciências
0      Ana         8.5        7.2       9.1       6.8
1    Bruno         7.8        8.3       7.5       8.9
2   Carlos         6.2        9.0       8.1       7.4
3    Diana         9.3        6.7       8.8       7.9
4  Eduardo         7.1        8.5       6.9       9.2


---

## 📚 Exercício 2: Dados Semi-estruturados com Dicionário

**Tipo**: Dados Semi-estruturados (obrigatório usar dicionário)

**Cenário**: Você trabalha em uma biblioteca e precisa catalogar informações de livros que possuem estruturas diferentes.

**Dados fornecidos**:
```
Livro 1: "1984" - George Orwell, 1949, Ficção, 328 páginas, disponível
Livro 2: "Dom Casmurro" - Machado de Assis, 1899, Romance, 256 páginas, emprestado (usuário: João Silva, data: 15/09/2024)
Livro 3: "Sapiens" - Yuval Harari, 2011, História, 512 páginas, disponível, traduzido
Livro 4: "O Cortiço" - Aluísio Azevedo, 1890, Romance, 304 páginas, danificado
```

**Tarefa**:
1. Crie um dicionário aninhado para armazenar essas informações
2. Use pandas para converter em DataFrame
3. Exiba o resultado final

In [None]:
# EXERCÍCIO 2 - Complete o código abaixo

import pandas as pd
from datetime import datetime
import json

# Configuração para melhor exibição dos DataFrames
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

# Crie um dicionário aninhado para os livros
# SEU CÓDIGO AQUI - estruture os dados dos livros
# Dica: cada livro pode ter informações diferentes

biblioteca = [
    {
        "Título": "1984",
        "Autor": "George Orwell",
        "Ano de Publicação": 1949,
        "Gênero": "Ficção",
        "Número de Páginas": 328,
        "Status": "Disponível"
    },
    {
        "Título": "Dom Casmurro",
        "Autor": "Machado de Assis",
        "Ano de Publicação": 1899,
        "Gênero": "Romance",
        "Número de Páginas": 256,
        "Status": "Emprestado",
        "Dados do empréstimo": {
            "Usuário": "João Silva",
            "Data de Empréstimo": "15/09/2024"
        }
    },
    {
        "Título": "Sapiens",
        "Autor": "Yuval Harari",
        "Ano de Publicação": 2011,
        "Gênero": "História",
        "Número de Páginas": 512,
        "Status": "Disponível",
        "Traduzido": "Sim"
    },
    {
        "Título": "O Cortiço",
        "Autor": "Aluísio Azevedo",
        "Ano de Publicação": 1890,
        "Gênero": "Romance",
        "Número de Páginas": 304,
        "Status": "Danificado"
    }
]

# Converta para DataFrame
df_biblioteca = pd.DataFrame(biblioteca)

# Exiba o resultado
print("📚 Catálogo da Biblioteca:")
print(df_biblioteca)

📚 Catálogo da Biblioteca:
         Título             Autor  Ano de Publicação    Gênero  \
0          1984     George Orwell               1949    Ficção   
1  Dom Casmurro  Machado de Assis               1899   Romance   
2       Sapiens      Yuval Harari               2011  História   
3     O Cortiço   Aluísio Azevedo               1890   Romance   

   Número de Páginas      Status  \
0                328  Disponível   
1                256  Emprestado   
2                512  Disponível   
3                304  Danificado   

                                 Dados do empréstimo Traduzido  
0                                                NaN       NaN  
1  {'Usuário': 'João Silva', 'Data de Empréstimo'...       NaN  
2                                                NaN       Sim  
3                                                NaN       NaN  


---

## 🎯 Exercício 3: Livre Escolha - Vendas de Produtos

**Tipo**: Você escolhe (estruturado ou semi-estruturado)

**Cenário**: Você trabalha no setor de vendas e recebeu dados de diferentes produtos vendidos no mês.

**Dados fornecidos**:
```
Produto A: Notebook, R$ 2500.00, 15 unidades vendidas, categoria eletrônicos
Produto B: Mesa de escritório, R$ 450.00, 8 unidades vendidas, categoria móveis  
Produto C: Mouse wireless, R$ 85.00, 32 unidades vendidas, categoria eletrônicos
Produto D: Cadeira ergonômica, R$ 680.00, 12 unidades vendidas, categoria móveis
Produto E: Teclado mecânico, R$ 320.00, 18 unidades vendidas, categoria eletrônicos
```

**Tarefa**:
1. **DECIDA**: Estes dados são mais adequados para estrutura de listas ou dicionário? Por quê?
2. Implemente sua escolha
3. Use pandas para exibir o resultado de forma organizada

In [None]:
# EXERCÍCIO 3 - Complete o código abaixo

import pandas as pd
from datetime import datetime
import json

# Configuração para melhor exibição dos DataFrames
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

# 1. RESPONDA: Qual estrutura você escolheu e por quê?
resposta = """
Minha escolha: estruturado
Justificativa: porque desta forma eu conseguirei categorizar melhor os ítens e desta forma ter mais insights para a análise.
"""
print("🎯 Minha Análise:")
print(resposta)

# 2. Implemente sua estrutura de dados escolhida
vendas_data = [
    ["Produto:", "Preço:", "Quantidade:", "Categoria:" ],
    ["Notebook", 2500.00, 15, "Eletrônicos"],
    ["Mesa de escritório", 450.00, 8, "Móveis"],
    ["Mouse wireless", 85.00, 32, "Eletrônicos"],
    ["Cadeira ergonômica", 680.00, 12, "Móveis"],
    ["Teclado mecânico", 320.00, 18, "Eletrônicos"]
]

# 3. Crie o DataFrame
df_vendas = pd.DataFrame(vendas_data[1:], columns=vendas_data[0])

# 4. Exiba o resultado
print("💰 Relatório de Vendas:")
print(df_vendas)

🎯 Minha Análise:

Minha escolha: estruturado
Justificativa: porque desta forma eu conseguirei categorizar melhor os ítens e desta forma ter mais insights para a análise.

💰 Relatório de Vendas:
             Produto:  Preço:  Quantidade:   Categoria:
0            Notebook  2500.0           15  Eletrônicos
1  Mesa de escritório   450.0            8       Móveis
2      Mouse wireless    85.0           32  Eletrônicos
3  Cadeira ergonômica   680.0           12       Móveis
4    Teclado mecânico   320.0           18  Eletrônicos


---

## 🏥 Exercício 4: Livre Escolha - Dados de Pacientes

**Tipo**: Você escolhe (estruturado ou semi-estruturado)

**Cenário**: Você trabalha em um hospital e precisa organizar informações de pacientes para um relatório médico.

**Dados fornecidos**:
```
Paciente 001: Maria Santos, 34 anos, Consulta Cardiologia, Dr. Silva, pressão alta, medicamento prescrito
Paciente 002: João Oliveira, 28 anos, Consulta Ortopedia, Dra. Costa, sem problemas detectados  
Paciente 003: Ana Ferreira, 45 anos, Consulta Cardiologia, Dr. Silva, colesterol alto, dieta recomendada, retorno em 30 dias
Paciente 004: Pedro Lima, 52 anos, Consulta Neurologia, Dr. Mendes, enxaqueca crônica, exames solicitados
Paciente 005: Carla Souza, 39 anos, Consulta Ortopedia, Dra. Costa, dor nas costas, fisioterapia indicada
```

**Tarefa**:
1. **ANALISE**: Que tipo de estrutura é mais apropriada? Considere que alguns pacientes têm informações extras.
2. Implemente sua escolha
3. Use pandas para exibir os resultados de forma organizada

In [None]:
# EXERCÍCIO 4 - Complete o código abaixo

import pandas as pd
from datetime import datetime
import json

# Configuração para melhor exibição dos DataFrames
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

# 1. ANÁLISE: Justifique sua escolha de estrutura
analise = """
Tipo de estrutura escolhida: semi-estruturado
Justificativa: Como cada paciente pode ter informações diferentes, a estrutura semi-estruturada é mais adequada e atende melhor a este cenário.
Vantagens da minha escolha: Consigo inserir as particularidades de cada atendimento de forma individualizada.
"""
print("🏥 Análise da Estrutura de Dados:")
print(analise)

# 2. Implemente a estrutura de dados
pacientes_data = [{
      "Código do Paciente": "001",
      "Nome": "Maria Santos",
      "Idade": 34,
      "Especialidade": "Cardiologia",
      "Médico": "Dr. Silva",
      "Sintoma" : "Pressão Alta",
      "Conduta" :{
          "Ação": "Medicamento Prescrito"}
  },
  {
      "Código do Paciente": "002",
      "Nome": "João Oliveira",
      "Idade": 28,
      "Especialidade": "Ortopedia",
      "Médico": "Dra. Costa",
      "Sintoma" : "Sem Problemas Detectados"
  },
  {
      "Código do Paciente": "003",
      "Nome": "Ana Ferreira",
      "Idade": 45,
      "Especialidade": "Cardiologia",
      "Médico": "Dr. Silva",
      "Sintoma" : "Colesterol Alto",
      "Conduta": {
          "Ação": "Dieta Recomendada",
          "Retorno": "30 Dias"
      }
  },
  {
      "Código do Paciente": "004",
      "Nome": "Pedro Lima",
      "Idade": 52,
      "Especialidade": "Neurologia",
      "Médico": "Dr. Mendes",
      "Sintoma" : "Enxaqueca Crônica",
      "Conduta": {
          "Ação": "Exames Solicitados"
      }
  },
  {
      "Código do Paciente": "005",
      "Nome": "Carla Souza",
      "Idade": 39,
      "Especialidade": "Ortopedia",
      "Médico": "Dra. Costa",
      "Sintoma" : "Dor nas Costas",
      "Conduta": {
          "Ação": "Fisioterapia Indicada"
      }
  }

]

# 3. Crie DataFrame e agrupe por especialidade
df_pacientes = pd.DataFrame(pacientes_data)

# 3. Exiba os resultados
print("👨‍⚕️ Relatório de Pacientes:")
print(df_pacientes)

🏥 Análise da Estrutura de Dados:

Tipo de estrutura escolhida: semi-estruturado
Justificativa: Como cada paciente pode ter informações diferentes, a estrutura semi-estruturada é mais adequada e atende melhor a este cenário.
Vantagens da minha escolha: Consigo inserir as particularidades de cada atendimento de forma individualizada. 

👨‍⚕️ Relatório de Pacientes:
  Código do Paciente           Nome  Idade Especialidade      Médico  \
0                001   Maria Santos     34   Cardiologia   Dr. Silva   
1                002  João Oliveira     28     Ortopedia  Dra. Costa   
2                003   Ana Ferreira     45   Cardiologia   Dr. Silva   
3                004     Pedro Lima     52    Neurologia  Dr. Mendes   
4                005    Carla Souza     39     Ortopedia  Dra. Costa   

                    Sintoma                                            Conduta  
0              Pressão Alta                  {'Ação': 'Medicamento Prescrito'}  
1  Sem Problemas Detectados             

---

## 🌟 Exercício 5: Livre Escolha - Análise Complexa de E-commerce

**Tipo**: Você escolhe (estruturado, semi-estruturado ou híbrido)

**Cenário**: Você é analista de dados de um e-commerce e recebeu informações complexas sobre vendas, incluindo dados de diferentes formatos.

**Dados fornecidos**:
```json
Dados de Transações:
- Transação 1: ID #1001, Cliente: "Ana Silva", Produtos: ["Smartphone", "Capa"], Valores: [899.99, 29.99], Data: "2024-10-01", Desconto: 5%, Método: "Cartão"
- Transação 2: ID #1002, Cliente: "Bruno Costa", Produtos: ["Notebook"], Valores: [2499.99], Data: "2024-10-01", Frete Grátis: true, Método: "PIX"  
- Transação 3: ID #1003, Cliente: "Carlos Lima", Produtos: ["Mouse", "Teclado", "Monitor"], Valores: [45.99, 189.99, 799.99], Data: "2024-10-02", Desconto: 10%, Cupom: "PRIMEIRA_COMPRA", Método: "Boleto"
- Transação 4: ID #1004, Cliente: "Diana Ferreira", Produtos: ["Tablet"], Valores: [649.99], Data: "2024-10-02", Método: "Cartão", Parcelado: 12x
- Transação 5: ID #1005, Cliente: "Eduardo Santos", Produtos: ["Fone Bluetooth", "Carregador"], Valores: [299.99, 79.99], Data: "2024-10-03", Desconto: 15%, Método: "PIX", Cliente_VIP: true
```

**Tarefa**:
1. **DECISÃO ESTRATÉGICA**: Analise a complexidade dos dados e escolha a melhor abordagem de estruturação
2. Implemente sua solução considerando:
   - Diferentes números de produtos por transação
   - Informações opcionais (desconto, frete, parcelamento, etc.)
   - Flexibilidade para futuras expansões
3. Use pandas para exibir os dados de forma clara e organizada

In [35]:
# EXERCÍCIO 5 - Complete o código abaixo

# 1. DECISÃO ESTRATÉGICA: Documente sua análise
estrategia = """
🎯 ANÁLISE DA COMPLEXIDADE DOS DADOS:
- Complexidades identificadas: Cada compra tem sua particularidade, como se teve desconto ou não, se é cliente VIP ou não.
- Estrutura escolhida: Semi-estruturado.
- Razões da escolha: Tendo em vista que cada compra pode ter características diferentes, a estrutura semi-estruturada é mais adequada.
- Vantagens para análises futuras: Permite análises rápidas e precisas.
"""
print(estrategia)
import pandas as pd
from datetime import datetime
import json

# 2. Implemente sua estrutura de dados
# SEU CÓDIGO AQUI - considere a complexidade dos dados
ecommerce_data = [
    {
        "id_transacao": 1001,
        "cliente": "Ana Silva",
        "produtos": [
            {"Nome_Produto": "Smartphone", "Valor": 899.99},
            {"Nome_Produto": "Capa", "Valor": 29.99}
        ],
        "data": datetime(2024, 10, 1).strftime("%d/%m/%Y"),
        "desconto": 5,
        "metodo_pagamento": "Cartão"
    },
    {
        "id_transacao": 1002,
        "cliente": "Bruno Costa",
        "produtos": [
            {"Nome_Produto": "Notebook", "Valor": 2499.99}
        ],
        "data": datetime(2024, 10, 1).strftime("%d/%m/%Y"),
        "frete_gratis": True,
        "metodo_pagamento": "PIX"
    },
    {
        "id_transacao": 1003,
        "cliente": "Carlos Lima",
        "produtos": [
            {"Nome_Produto": "Mouse", "Valor": 45.99},
            {"Nome_Produto": "Teclado", "Valor": 189.99},
            {"Nome_Produto": "Monitor", "Valor": 799.99}
        ],
        "data": datetime(2024, 10, 2).strftime("%d/%m/%Y"),
        "desconto": 10,
        "cupom": "PRIMEIRA_COMPRA",
        "metodo_pagamento": "Boleto"
    },
    {
        "id_transacao": 1004,
        "cliente": "Diana Ferreira",
        "produtos": [
            {"Nome_Produto": "Tablet", "Valor": 649.99}
        ],
        "data": datetime(2024, 10, 2).strftime("%d/%m/%Y"),
        "metodo_pagamento": "Cartão",
        "parcelado": "12x"
    },
    {
        "id_transacao": 1005,
        "cliente": "Eduardo Santos",
        "produtos": [
            {"Nome_Produto": "Fone Bluetooth", "Valor": 299.99},
            {"Nome_Produto": "Carregador", "Valor": 79.99}
        ],
        "data": datetime(2024, 10, 3).strftime("%d/%m/%Y"),
        "desconto": 15,
        "metodo_pagamento": "PIX",
        "cliente_vip": True
    }
]

# 3. Crie DataFrame principal
# SEU CÓDIGO AQUI
df_transacoes = pd.DataFrame(ecommerce_data)

# 3. Exiba os dados estruturados
print("🛒 Dados do E-commerce:")
print(df_transacoes)


🎯 ANÁLISE DA COMPLEXIDADE DOS DADOS:
- Complexidades identificadas: Cada compra tem sua particularidade, como se teve desconto ou não, se é cliente VIP ou não. 
- Estrutura escolhida: Semi-estruturado.
- Razões da escolha: Tendo em vista que cada compra pode ter características diferentes, a estrutura semi-estruturada é mais adequada.
- Vantagens para análises futuras: 

🛒 Dados do E-commerce:
   id_transacao         cliente  \
0          1001       Ana Silva   
1          1002     Bruno Costa   
2          1003     Carlos Lima   
3          1004  Diana Ferreira   
4          1005  Eduardo Santos   

                                            produtos        data  desconto  \
0  [{'Nome_Produto': 'Smartphone', 'Valor': 899.9...  01/10/2024       5.0   
1   [{'Nome_Produto': 'Notebook', 'Valor': 2499.99}]  01/10/2024       NaN   
2  [{'Nome_Produto': 'Mouse', 'Valor': 45.99}, {'...  02/10/2024      10.0   
3      [{'Nome_Produto': 'Tablet', 'Valor': 649.99}]  02/10/2024       NaN   
4

---

## 🎉 Conclusão e Reflexão

Parabéns! Você completou todos os exercícios de estruturação de dados.

**Reflexões importantes:**

1. **Quando usar dados estruturados (listas organizadas)?**
   - Dados homogêneos e regulares
   - Estrutura tabular simples
   - Facilidade de manipulação com Python nativo

2. **Quando usar dados semi-estruturados (dicionários)?**
   - Dados heterogêneos com campos opcionais
   - Flexibilidade na estrutura
   - Facilidade de expansão

3. **Pandas como ferramenta unificadora:**
   - Converte qualquer estrutura em DataFrame
   - Facilita análises e visualizações
   - Oferece métodos poderosos de manipulação

**Próximos passos:**
- Experimente com datasets reais
- Explore outras funcionalidades do pandas
- Pratique análises exploratórias de dados