# Capítulo 01: A Iniciação no Mundo dos Dados

Seja bem-vindo ao emocionante mundo da Ciência de Dados! Neste primeiro capítulo, você dará os primeiros passos em direção a se tornar um ninja nessa arte. Vamos começar com o básico e construir uma base sólida para seus futuros trabalhos.

**Objetivo:**
Neste estágio inicial, é importante ter um conhecimento básico de Python. Você não precisa ser um expert, mas ter uma compreensão sólida das estruturas de dados e da sintaxe Python será fundamental para o seu sucesso.

**Conteúdo:**
Neste capítulo, vamos explorar os seguintes tópicos:
- Introdução às estruturas de dados: listas, tuplas e dicionários.
- Entrando no mundo dos DataFrames com o Pandas.
- Dominando a arte dos filtros em DataFrames.

**Requisitos:**
Para tirar o máximo proveito deste capítulo, é aconselhável que você tenha conhecimentos básicos de Python. Não é necessário ser um mestre, mas ter uma compreensão sólida das estruturas de dados e da sintaxe Python será muito útil.

**Instruções de Uso:**
- Siga os blocos de código e as explicações passo a passo.
- Experimente as técnicas nos seus próprios conjuntos de dados ou utilize os dados que forneceremos aqui.

Estamos apenas começando esta jornada emocionante de aprendizado e descoberta! Vamos em frente? 😎🚀

# Trabalhando com listas

Claro, vou explicar com mais detalhes o que são listas e como funcionam.

**O que são listas:**

Em Python, uma lista é uma estrutura de dados que permite armazenar e organizar uma coleção de itens. Esses itens podem ser de qualquer tipo: números, strings (textos), objetos complexos e até mesmo outras listas. Listas são extremamente versáteis e úteis quando você precisa lidar com conjuntos de dados, pois permitem que você agrupe informações relacionadas em um único local.

**Características das listas:**

- **Ordem Preservada:** Os elementos em uma lista são armazenados na ordem em que foram inseridos. Isso significa que você pode acessar os elementos na mesma ordem em que os adicionou.

- **Itens Diversos:** Uma lista pode conter itens de tipos diferentes. Por exemplo, você pode ter números, strings e objetos em uma única lista.

- **Mutabilidade:** Listas são mutáveis, o que significa que você pode modificar, adicionar ou remover elementos após a criação da lista.


Listas são uma ferramenta fundamental em Python e são amplamente utilizadas para armazenar e manipular dados em projetos de programação. À medida que você avança na sua jornada de aprendizado, ficará cada vez mais confortável trabalhando com listas e realizando operações sofisticadas com elas. Continue explorando e praticando! 😊📊🚀

Acessando Elementos:

Você pode acessar elementos individuais de uma lista usando índices. Por exemplo

In [17]:
lista_filiados = ['eogabs', 'patraozim', 'parede']
lista_idfiliado = [101010, 202020, 303030]

Neste exemplo, `lista_filiados` é uma lista que armazena nomes de filiados, e `lista_idfiliado` é uma lista que armazena IDs correspondentes a esses filiados. Essas listas permitem que você relacione os nomes às identificações de forma organizada.

**Operações com listas:**

- **Acessando Elementos:** Você pode acessar elementos em uma lista usando índices. Os índices começam em 0 para o primeiro elemento, 1 para o segundo, e assim por diante.

In [18]:
lista_filiados[0]  # Isso irá pegar 'eogabs'

'eogabs'

In [19]:
lista_idfiliado[1]  # Isso irá pegar 202020

202020

- **Adicionando Elementos:** Você pode adicionar elementos a uma lista usando o método `append`. Isso adiciona um elemento ao final da lista.

In [20]:
lista_filiados.append('cassin')

In [21]:
lista_filiados

['eogabs', 'patraozim', 'parede', 'cassin']

In [22]:
lista_filiados[3]

'cassin'

In [23]:
lista_filiados[-1]

'cassin'

- **Removendo Elementos:** Você pode remover elementos de uma lista usando o método `remove` para remover um elemento específico ou a função `del` para remover um elemento pelo índice.

In [24]:
lista_filiados.remove('cassin')

In [25]:
lista_filiados

['eogabs', 'patraozim', 'parede']

In [26]:
lista_filiados.append('cassin')

In [27]:
del lista_filiados[-1]

In [28]:
lista_filiados

['eogabs', 'patraozim', 'parede']

# Trabalhando com Tuplas

Tuplas são estruturas de dados em Python que armazenam uma coleção de elementos, como listas, mas com a diferença de que são imutáveis, ou seja, não podem ser alteradas após sua criação. As tuplas são úteis quando você precisa garantir que os dados não sejam modificados acidentalmente.



**Criando Tuplas:**

In [29]:
# Criando uma tupla de ids
ids = (1010, 2020, 3030)
ids

(1010, 2020, 3030)

Neste caso, sua tupla "ids" contém três elementos, que são números inteiros. Você pode acessar os elementos individuais da tupla usando índices, assim como faria com uma lista. Por exemplo:

In [30]:
ids[0]  # Isso irá pegar o primeiro elemento, que é 1010

1010

In [31]:
ids[1]  # Isso irá pegar o segundo elemento, que é 2020

2020

In [32]:
ids[2]  # Isso irá pegar o terceiro elemento, que é 3030

3030

Lembre-se de que, como as tuplas são imutáveis, você não pode adicionar, remover ou modificar elementos após a criação. Elas são úteis quando você precisa garantir que os dados não sejam acidentalmente alterados em seu código.

**Quando utilizar tuplas ao invés de listas?**

A utilização de tuplas em vez de listas é importante em situações em que você deseja garantir que os elementos de dados sejam imutáveis, ou seja, não possam ser alterados acidentalmente durante a execução do programa. Vou fornecer um exemplo prático para ilustrar a importância disso:

Suponha que você esteja trabalhando em um sistema de gerenciamento de configuração para um aplicativo de nível empresarial. Este sistema armazena informações críticas de configuração, como endereços de servidores, credenciais de banco de dados e chaves de criptografia. Você deseja garantir que essas informações não sejam modificadas acidentalmente durante a execução do programa, pois qualquer alteração indevida poderia resultar em problemas sérios de segurança ou funcionamento.

Usando uma lista para armazenar essas informações de configuração, você pode ter o seguinte código:

```python
configuracao = [
    ("servidor", "localhost"),
    ("banco_de_dados", "dados_empresariais"),
    ("usuario_bd", "admin"),
    ("senha_bd", "senha_secreta")
]
```

Aqui, estamos usando uma lista de tuplas para armazenar as informações de configuração. No entanto, como as listas são mutáveis, alguém pode modificar esses dados em algum lugar do código, introduzindo uma vulnerabilidade de segurança.

Agora, vamos considerar o uso de tuplas para a mesma finalidade:

```python
configuracao = (
    ("servidor", "localhost"),
    ("banco_de_dados", "dados_empresariais"),
    ("usuario_bd", "admin"),
    ("senha_bd", "senha_secreta")
)
```

Ao usar tuplas, você torna esses dados de configuração imutáveis. Isso significa que ninguém pode acidentalmente ou intencionalmente modificar essas informações durante a execução do programa. Qualquer tentativa de modificar uma tupla resultará em um erro, o que é desejável neste cenário.

Portanto, a importância de usar tuplas em vez de listas é garantir a integridade e a imutabilidade de dados quando isso é crítico, como em situações de segurança ou configuração.

In [33]:
# consigo deletar algum objeto da tupla?
del ids[2]

TypeError: 'tuple' object doesn't support item deletion

In [None]:
# consigo alterar o valor de algum objeto da tupla?
ids[2] = 1010

TypeError: 'tuple' object does not support item assignment

# Trabalhando com Dicionários
Dicionários são estruturas de dados em Python que armazenam pares chave-valor. Cada valor é associado a uma chave exclusiva, permitindo que você acesse rapidamente os valores usando suas chaves. Os dicionários são ideais para representar informações relacionadas em um formato estruturado.

Neste exemplo, o dicionário `pessoa` contém informações sobre uma pessoa, como nome, idade e cidade.


In [None]:
# Criando um dicionário de informações de uma pessoa
pessoa = {
    "nome": "Victor",
    "idade": 26,
    "cidade": "Ipatinga"
}
pessoa

{'nome': 'Victor', 'idade': 26, 'cidade': 'Ipatinga'}

**Acessando Valores:**

Você pode acessar os valores em um dicionário usando suas chaves. Por exemplo:

In [None]:
pessoa["nome"]

'Victor'

In [None]:
pessoa["idade"]

26

In [None]:
pessoa["cidade"]

'Ipatinga'

**Adicionando e Atualizando Valores:**

Você pode adicionar novos pares chave-valor ou atualizar os valores existentes em um dicionário. Por exemplo:

In [None]:
pessoa["profissao"] = "Analista de Dados"
pessoa["idade"] = 27  # Atualizando a idade
pessoa

{'nome': 'Victor',
 'idade': 27,
 'cidade': 'Ipatinga',
 'profissao': 'Analista de Dados'}

**Removendo Chave-Valor:**

Você pode remover um par chave-valor de um dicionário usando o comando `del`. Por exemplo:

In [None]:
del pessoa["cidade"]  # Isso irá remover a chave "cidade" e seu valor
pessoa

{'nome': 'Victor', 'idade': 27, 'profissao': 'Analista de Dados'}

**LOOP FOR:**

Aicionando um exemplo de loop `for` usando um dicionário que contém informações de nome, idade e profissão de várias pessoas.
Vamos supor que temos um dicionário com várias pessoas e suas informações:

In [None]:
pessoas = [
    {"nome": "João", "idade": 30, "profissao": "Engenheiro",},
    {"nome": "Maria", "idade": 25, "profissao": "Designer"},
    {"nome": "Pedro", "idade": 35, "profissao": "Programador"},
    {"nome": "Ana", "idade": 28, "profissao": "Contadora"}
]
pessoas

[{'nome': 'João', 'idade': 30, 'profissao': 'Engenheiro'},
 {'nome': 'Maria', 'idade': 25, 'profissao': 'Designer'},
 {'nome': 'Pedro', 'idade': 35, 'profissao': 'Programador'},
 {'nome': 'Ana', 'idade': 28, 'profissao': 'Contadora'}]

Agora, podemos usar um loop `for` para iterar sobre esse dicionário e imprimir as informações de cada pessoa:

In [None]:
for pessoa in pessoas:
    nome = pessoa["nome"]
    idade = pessoa["idade"]
    profissao = pessoa["profissao"]
    print(f"Nome: {nome}, Idade: {idade}, Profissão: {profissao}")

Nome: João, Idade: 30, Profissão: Engenheiro
Nome: Maria, Idade: 25, Profissão: Designer
Nome: Pedro, Idade: 35, Profissão: Programador
Nome: Ana, Idade: 28, Profissão: Contadora


# FOR LOOP

Loop for:
O loop for é usado quando você sabe antecipadamente quantas vezes deseja executar um conjunto de instruções. Ele é especialmente útil para percorrer elementos em uma sequência, como uma lista ou uma tupla.

In [52]:
clientes = ["naruto", "minato", "kushina"]
for cliente in clientes:
    print(cliente)

naruto
minato
kushina


Neste código:

- `clientes` é uma lista que armazena os nomes dos clientes.
- `ids` é uma lista que armazena os IDs correspondentes aos clientes.
- Usamos o loop `for` em combinação com a função `zip` para percorrer simultaneamente as duas listas. A função `zip` cria pares de elementos correspondentes das duas listas.
- Dentro do loop, a cada iteração, pegamos o nome do cliente e seu ID usando as variáveis `cliente` e `id_cliente`.
- Finalmente, imprimimos o nome do cliente e seu ID usando uma f-string para formatar a saída.

Este código demonstra como usar o `zip` para iterar sobre várias listas simultaneamente, o que pode ser útil quando você tem dados relacionados em diferentes listas.

In [51]:
# Lista de clientes
clientes = ["naruto", "minato", "kushina"]

# Lista de IDs correspondentes aos clientes
ids = [1, 2, 3]

# Usando o loop for com a função zip para percorrer simultaneamente as duas listas
for cliente, id_cliente in zip(clientes, ids):
    # Imprime o nome do cliente e seu ID
    print(f'Cliente: {cliente}, id: {id_cliente}')

Cliente: naruto, id: 1
Cliente: minato, id: 2
Cliente: kushina, id: 3


# Exercício 1

Explicação e instruções:

1. Você recebeu dados de uma API que contém informações sobre tarefas de uma sprint.

2. Seu objetivo é organizar esses dados em listas separadas para os atributos "id", "titulo" e "descricao" de cada tarefa.

3. Para fazer isso, você precisa criar três listas vazias chamadas "ids", "titulos" e "descricoes".

4. Dentro do loop `for`, você deve adicionar o código necessário para extrair os valores apropriados de cada tarefa e adicioná-los às listas correspondentes.

5. Após o loop, você terá três listas separadas, uma para cada atributo.

6. Finalmente, imprima as listas para verificar se os dados foram organizados corretamente.

Vocês podem seguir as instruções e praticar a extração de informações de uma estrutura de dados complexa (os dicionários na lista `dados_da_api`) e armazená-las em listas separadas. Isso é uma habilidade útil ao trabalhar com dados do mundo real em Python.

In [None]:
# Suponha que você obteve os seguintes dados de uma API, fornecendo informações da sprint de cada funcionário
dados_da_api = [
    {"id": 1, "titulo": "Tarefa 1", "descricao": "Realizar análise de dados"},
    {"id": 2, "titulo": "Tarefa 2", "descricao": "Preparar apresentação"},
    {"id": 3, "titulo": "Tarefa 3", "descricao": "Enviar relatório"}
]
dados_da_api

[{'id': 1, 'titulo': 'Tarefa 1', 'descricao': 'Realizar análise de dados'},
 {'id': 2, 'titulo': 'Tarefa 2', 'descricao': 'Preparar apresentação'},
 {'id': 3, 'titulo': 'Tarefa 3', 'descricao': 'Enviar relatório'}]

In [None]:
# Crie listas vazias para armazenar os diferentes atributos dos dados da API
ids = []
titulos = []
descricoes = []

# Organize os dados da API nas listas

# Descomente e inicie o código por aqui
# for tarefa in dados_da_api:

    # ...
    # ...
    # ...

# Agora você tem três listas separadas para ids, títulos e descrições das tarefas
print("IDs:", ids)
print("Títulos:", titulos)
print("Descrições:", descricoes)

IDs: []
Títulos: []
Descrições: []


# Exercício 2

**Exercício de Registro de Tarefas da Sprint**

Suponha que você esteja trabalhando em um projeto de desenvolvimento ágil e precisa criar um programa para registrar as tarefas de uma sprint. Cada tarefa deve ter um ID, um título e uma descrição.

Aqui está o que você deve fazer:

1. Crie um dicionário vazio chamado `sprint_tasks` para armazenar as tarefas da sprint. A chave será o ID da tarefa e o valor será um dicionário com o título e a descrição.
2. Peça ao usuário para inserir informações sobre tarefas da sprint, incluindo ID, título e descrição. Você pode usar um loop para permitir que o usuário insira várias tarefas.
3. Adicione cada tarefa ao dicionário `sprint_tasks` como um novo par chave-valor, onde a chave é o ID da tarefa e o valor é um dicionário com o título e a descrição.
4. Continue permitindo que o usuário insira tarefas até que eles decidam parar.
5. Por fim, exiba o dicionário `sprint_tasks` completo, que conterá todas as tarefas registradas.

Este exercício ensinará seus alunos a usar dicionários para armazenar informações estruturadas e a interagir com o usuário para preencher esses dados. Eles também aprenderão a usar loops para permitir a entrada contínua de informações até que eles decidam parar.

In [53]:
# Crie um dicionário vazio para armazenar as tarefas da sprint
sprint_tasks = {}

# Peça ao usuário para inserir informações sobre as tarefas da sprint
while True:
    tarefa_id = input("Digite o ID da tarefa (ou 'sair' para finalizar): ")
    
    if tarefa_id.lower() == "sair":
        break
    
    titulo = input("Digite o título da tarefa: ")
    descricao = input("Digite a descrição da tarefa: ")
    
    # Adicione a tarefa ao dicionário sprint_tasks
    sprint_tasks[tarefa_id] = {"Título": titulo, "Descrição": descricao}

# Exiba o dicionário completo de tarefas da sprint
print("\nTarefas da Sprint:")
for tarefa_id, info in sprint_tasks.items():
    print(f"ID: {tarefa_id}")
    print(f"Título: {info['Título']}")
    print(f"Descrição: {info['Descrição']}")
    print()


Tarefas da Sprint:
ID: 1
Título: tarefa1
Descrição: ficar a toa



# Respostas dos Exercícios

In [None]:
# Suponha que você obteve os seguintes dados de uma API
dados_da_api = [
    {"id": 1, "titulo": "Tarefa 1", "descricao": "Realizar análise de dados"},
    {"id": 2, "titulo": "Tarefa 2", "descricao": "Preparar apresentação"},
    {"id": 3, "titulo": "Tarefa 3", "descricao": "Enviar relatório"}
]

# Crie listas vazias para armazenar os diferentes atributos dos dados da API
ids = []
titulos = []
descricoes = []

# Organize os dados da API nas listas
for tarefa in dados_da_api:
    ids.append(tarefa["id"])
    titulos.append(tarefa["titulo"])
    descricoes.append(tarefa["descricao"])

# Agora você tem três listas separadas para ids, títulos e descrições das tarefas
print("IDs:", ids)
print("Títulos:", titulos)
print("Descrições:", descricoes)


IDs: [1, 2, 3]
Títulos: ['Tarefa 1', 'Tarefa 2', 'Tarefa 3']
Descrições: ['Realizar análise de dados', 'Preparar apresentação', 'Enviar relatório']
