***
# <font size=10>Introdução à Análise de Dados com Python</font>
***

# Sobre o Minicurso

Python é uma linguagem de programação de uso geral que está se tornando cada vez mais popular na ciência de dados. Neste minicurso, você explorará conceitos fundamentais da linguagem, incluindo tipos de dados, controle de fluxo e funções. Também aprenderá a usar bibliotecas essenciais para análise e visualização de dados. O curso oferece uma visão geral prática, cobrindo algumas das principais ferramentas e técnicas para começar a trabalhar com dados em Python.

# <font>1 Primeiros passos</font>
***

## <font>1.1. Tipos de dados</font>
***

### 1.1.1. Int e Float

Em Python, os tipos numéricos mais comuns são:

 - int: Representa números inteiros, positivos ou negativos, sem casas decimais.

 - float: Representa números com casas decimais, também chamados de números de ponto flutuante.

In [None]:
# Exemplos de inteiros (int)
numero_de_alunos = 25
temperatura = -5

print(numero_de_alunos)
print(temperatura)

In [None]:
# Exemplos de números com casas decimais (float)
preco_do_produto = 19.99
altura = 1.75

In [None]:
# Exibindo os valores e seus respectivos tipos de dados
print("Número de alunos:", numero_de_alunos, type(numero_de_alunos))
print("Temperatura:", temperatura, type(temperatura))
print("Preço do produto:", preco_do_produto, type(preco_do_produto))
print("Altura:", altura, type(altura))

No exemplo acima:

 - Criamos variáveis usando nomes significativos (`numero_de_alunos`, `temperatura`, `preco_do_produto` e `altura`) e atribuímos valores a elas usando o sinal de igual (`=`).

 - A função `print()` exibe o valor da variável e a função `type()` revela o tipo de dado.

 - Observe que Python é uma linguagem case-sensitive, ou seja, diferencia letras maiúsculas de minúsculas.

### 1.1.2. String

O tipo de dado string representa uma sequência de caracteres e é declarada entre aspas simples (`'...'`) ou duplas (`"..."`).

In [None]:
# Exemplos de strings
nome = "Maria"
saudacao = 'Olá, mundo!'

In [None]:
# Exibindo as strings
print(nome)
print(saudacao)

In [None]:
# Concatenando strings
frase = saudacao + " Meu nome é " + nome + "."
print(frase)

 - Declaramos variáveis do tipo string e exibimos seus valores.

 - O sinal de mais (+) concatena (junta) strings.

### 1.1.3. Booleano

O tipo bool (booleano) representa valores lógicos True (verdadeiro) ou False (falso).

In [None]:
# Exemplos de booleanos
sol_esta_brilhando = True
chovendo = False

In [None]:
# Exibindo os valores booleanos
print("Sol está brilhando?", sol_esta_brilhando)
print("Está chovendo?", chovendo)

### Exercício

Crie um programa que:

 -  Peça ao usuário para inserir seu nome e idade.

 -  Armazene essas informações em variáveis com os tipos de dados apropriados.

 - Exiba uma mensagem personalizada, como `"Olá, [nome]! Você tem [idade] anos."`

Dicas:

 - Utilize a função `input()` para receber dados do usuário.

 - Lembre-se de converter a idade para o tipo de dado correto acom a função `int()`.

## Métodos de formatação:

F-strings:
```python
 print(f"Olá, {nome}! Você tem {idade} anos.")
 ```

Format():
```python
print("Olá, {}! Você tem {} anos.".format("Lucas", 60))
```
Operador `%` (antigo):
``` python
print("Olá, %s! Você tem %d anos." % (nome, idade))
```

## 1.2. Listas
***

Até agora, vimos como trabalhar com tipos de dados individuais. Mas e se precisarmos armazenar um conjunto de dados relacionados, como uma lista de compras ou as temperaturas diárias de uma semana? É aí que as listas entram em ação!

Em Python, uma lista é uma sequência ordenada de elementos. Podemos criar listas utilizando colchetes `[]`, separando os elementos por vírgula.

In [None]:
# Criando listas
lista_de_compras = ["maçã", "banana", "leite", "pão"]
temperaturas_semana = [25.5, 24.0, 26.8, 23.9, 27.2, 28.1, 25.9]

In [None]:
# Exibindo as listas
print("Lista de Compras:", lista_de_compras)
print("Temperaturas da Semana:", temperaturas_semana)

Características Importantes:

 - Elementos Diversos: Listas podem conter elementos de diferentes tipos de dados, inclusive outras listas!

 - Elementos Diversos: Listas podem conter elementos de diferentes tipos de dados, inclusive outras listas!

```python
lista_mista = [10, "Python", 3.14, True, [1, 2, 3]]
```

 - Ordenação: As listas mantêm a ordem dos elementos como foram inseridos.

 - Mutabilidade: Podemos modificar elementos de uma lista após sua criação.

Exemplo de Mutabilidade:

In [None]:
# Modificando um elemento da lista
lista_de_compras = "laranja"
print("Lista de Compras Atualizada:", lista_de_compras)

### 1.2.1. Acessando Elementos pelo Índice
***

Após a criação de uma lista, frequentemente precisamos acessar seus elementos individualmente. Em Python, fazemos isso utilizando o índice de cada elemento, que representa sua posição na lista. É crucial destacar que:

 - Índices Iniciam em Zero: O primeiro elemento da lista possui índice `0`, o segundo índice `1`, e assim por diante.

 - Índices Negativos: Podemos usar índices negativos para acessar elementos a partir do final da lista. O último elemento tem índice `-1`, o penúltimo `-2`, etc.

Exemplo:

In [None]:
linguagens = ["Python", "R", "Java", "C++"]

print("Primeira Linguagem:", linguagens[0])
print("Última Linguagem:", linguagens[-1])
print("Terceira Linguagem:", linguagens[2])

### 1.2.2. Fatiamento de Listas
***

O fatiamento permite extrair uma subsequência de elementos de uma lista. Utilizamos a sintaxe `lista[inicio:fim:passo]` para fatiar listas, onde:

 - **inicio**: Índice do primeiro elemento a ser incluído na fatia.

 - **fim**: Índice do primeiro elemento a ser excluído da fatia.

 - **passo**: Define o intervalo entre os elementos incluídos na fatia.

Exemplos:

In [None]:
numeros = list(range(1, 10))

print("Do início ao quinto elemento:", numeros[:5])
print("Do terceiro ao penúltimo elemento:", numeros[2:-1])
print("Elementos pares:", numeros[1::2])
print("Invertendo a lista:", numeros[::-1])

### 1.2.3. Métodos de Lista
***

Python oferece métodos embutidos (funções específicas para listas) que permitem modificar, acessar e manipular listas de diversas maneiras. Alguns métodos importantes:

 - `append(elemento)`: Adiciona um elemento ao final da lista.

 - `insert(índice, elemento)`: Insere um elemento em uma posição específica.

 - `remove(elemento)`: Remove a primeira ocorrência do elemento na lista.

 - `pop(índice)`: Remove e retorna o elemento no índice especificado (remove o último elemento se o índice não for especificado).

 - `index(elemento)`: Retorna o índice da primeira ocorrência do elemento.

 - `count(elemento)`: Conta quantas vezes o elemento aparece na lista.

 - `sort()`: Ordena a lista em ordem crescente (modifica a lista original).

 - `reverse()`: Inverte a ordem dos elementos na lista (modifica a lista original).

Exemplos:

In [None]:
cores = ["vermelho", "verde", "azul"]

In [None]:
cores.append("amarelo")
print("Após append:", cores)

In [None]:
cores.insert(1, "roxo")
print("Após insert:", cores)

In [None]:
cores.remove("verde")
print("Após remove:", cores)

In [None]:
cor_removida = cores.pop()
print("Cor removida:", cor_removida)
print("Após pop:", cores)

In [None]:
print("Índice do 'azul':", cores.index("azul"))

### 1.2.4. Iterando sobre Listas com Laços for

Laços `for` são estruturas de controle que permitem executar um bloco de código repetidamente para cada elemento de uma sequência (como uma lista).

Exemplo:

In [None]:
nomes = ["Alice", "Bob", "Carol"]

In [None]:
for nome in nomes:
    print("Olá,", nome + "!")

### Exercícios

1° Crie um programa que peça ao usuário para inserir 5 números, armazene-os em uma lista e, em seguida:

 - Imprima o maior e o menor número da lista.

 - Calcule a média dos números na lista.

 - Crie uma nova lista contendo apenas os números pares da lista original.

2° Crie um programa que peça ao usuário para inserir uma frase e, em seguida:

 - Crie uma lista de palavras da frase (dica: use o método split()).

 - Conte quantas palavras existem na frase.

 - Imprima a frase com as palavras em ordem inversa.

## 1.3. Estruturas de Dados Adicionais em Python
***

### 1.3.1. Tuplas - Semelhantes, Mas Imutáveis

As tuplas são estruturas de dados muito similares às listas, porém com uma diferença crucial: são imutáveis. Isso significa que, após criada, uma tupla não pode ser modificada – não podemos adicionar, remover ou alterar seus elementos.

Criando Tuplas:

In [None]:
coordenadas = (10, 20)
dias_da_semana = ("segunda", "terça", "quarta", "quinta", "sexta", "sábado", "domingo")

In [None]:
print("Coordenadas:", coordenadas)
print("Dias da Semana:", dias_da_semana)

Características:

 - Definidas por Parênteses: Usamos parênteses `()` para criar tuplas, separando os elementos por vírgula.

 - Imutáveis: A imutabilidade é a principal característica das tuplas, tornando-as úteis em situações onde a integridade dos dados é crucial.

 - Acessíveis por Índice: Assim como nas listas, acessamos elementos de uma tupla utilizando índices numéricos.

Exemplo de Impossibilidade de Modificação:

In [None]:
coordenadas = (10, 20)

In [None]:
coordenadas[0] = 30  # Isso gerará um erro!

In [None]:
print("Coordenadas:", coordenadas)  # A tupla permanece inalterada

Quando Usar Tuplas?

 - Dados Constantes: Quando os dados não precisam ser modificados após a criação, como coordenadas geográficas, constantes físicas, etc.

 - Segurança: A imutabilidade garante que os dados não sejam alterados acidentalmente durante a execução do programa.

 - Chaves de Dicionário: Tuplas podem ser usadas como chaves em dicionários (abordado na próxima seção), pois são imutáveis.

### 1.3.2. Dicionários - Mapeando Dados com Chaves e Valores

Os dicionários são estruturas de dados poderosas que permitem armazenar dados na forma de pares chave-valor. Cada chave em um dicionário é única e está associada a um valor específico.

Criando Dicionários:

In [None]:
usuario = {
    "nome": "Ana",
    "idade": 30,
    "cidade": "São Paulo"
}

In [None]:
print("Usuário:", usuario)

Características:

 - Definidos por Chaves: Usamos chaves `{}` para criar dicionários, separando os pares chave-valor por dois pontos :.

 - Chaves Únicas e Imutáveis: As chaves em um dicionário devem ser únicas e imutáveis, como strings ou tuplas.

 - Valores Mutáveis: Os valores podem ser de qualquer tipo de dado e podem ser modificados.

 - Acesso por Chave: Diferente de listas e tuplas, acessamos elementos em um dicionário utilizando suas chaves.

Exemplo de Acesso e Modificação:

In [None]:
print("Nome do Usuário:", usuario["nome"])  # Acessando o valor da chave "nome"

In [None]:
usuario["idade"] = 31  # Modificando o valor da chave "idade"

In [None]:
print("Usuário Atualizado:", usuario)

Quando Usar Dicionários?

 - Armazenamento Estruturado: Quando precisamos armazenar dados relacionados de forma organizada, como informações de um usuário, configurações de um sistema, etc.

 - Busca Rápida: Os dicionários permitem encontrar valores rapidamente com base em suas chaves, tornando-os eficientes para buscas em grandes conjuntos de dados.

### Exercícios:
1. Crie um programa que peça ao usuário para inserir o nome de um produto e seu preço, armazenando essas informações em um dicionário. Permita que o usuário adicione múltiplos produtos ao dicionário. Ao final, exiba o nome e o preço de cada produto.

2. Crie um programa que simule um dicionário de palavras. O programa deve solicitar ao usuário que insira uma palavra, e então exibir sua definição (você pode definir algumas palavras e definições previamente). Caso a palavra não seja encontrada, exiba uma mensagem informando.

## 1.4. Substrings
***

### 1.4.1. O Que São Substrings?

Uma substring é simplesmente uma sequência contígua de caracteres dentro de uma string. Por exemplo, na string "Python", as substrings "Pyt", "thon" e "th" são apenas alguns exemplos. Podemos pensar em uma substring como uma "fatia" da string original.

### 1.4.2. Extraindo Substrings - Fatiamento em Ação

Em Python, utilizamos a técnica de fatiamento (slicing) para extrair substrings. O fatiamento utiliza a sintaxe `string[inicio:fim:passo]`, onde:

 - **inicio**: Índice do primeiro caractere a ser incluído na substring (inclusivo).

 - **fim**: Índice do primeiro caractere a ser excluído da substring (exclusivo).

 - **passo**: Define o intervalo entre os caracteres incluídos na substring.

Exemplos:

In [None]:
linguagem = "Python"

In [None]:
print(linguagem[:3])  # Imprime "Pyt"

In [None]:
print(linguagem[2:5])  # Imprime "thon"

In [None]:
print(linguagem[4:])  # Imprime "on" (do índice 4 até o final)

In [None]:
print(linguagem[::2])  # Imprime "Pto" (caracteres alternados)

In [None]:
print(linguagem[::-1])  # Imprime "nohtyP" (string invertida)

### 1.4.3. Substrings e Métodos de String

Diversos métodos de string em Python retornam ou manipulam substrings. Alguns exemplos relevantes:

 - `find(substring)`: Retorna o índice da primeira ocorrência da substring na string. Se a substring não for encontrada, retorna -1.

 - `replace(substring_antiga, substring_nova)`: Retorna uma nova string com todas as ocorrências da substring antiga substituídas pela nova substring.

 - `split(separador)`: Divide a string em uma lista de substrings, utilizando o separador especificado.

Exemplos:

In [None]:
frase = "Python é uma linguagem poderosa."

In [None]:
indice = frase.find("linguagem")
print("Índice da substring 'linguagem':", indice)

In [None]:
nova_frase = frase.replace("poderosa", "incrível")
print("Frase modificada:", nova_frase)

In [None]:
palavras = frase.split()
print("Lista de palavras:", palavras)

### 1.4.4. Substrings na Análise de Dados

O domínio de substrings é fundamental para diversas tarefas em análise de dados, como:

 - Limpeza de Dados: Remover espaços em branco extras, caracteres especiais indesejados e formatar strings de forma consistente.

 - Extração de Informações: Extrair informações específicas de strings, como nomes de arquivos, endereços de email, datas, etc.

 - Tokenização de Texto: Dividir um texto em palavras individuais (tokens) para análise.

Exemplo:

In [None]:
dados_brutos = "  Arquivo123.csv; Data: 2023-10-27  "

In [None]:
dados_limpos = dados_brutos.strip()  # Remove espaços extras

In [None]:
nome_arquivo = dados_limpos.split(";")
data = dados_limpos.split("Data: ")[-1]

In [None]:
print("Nome do Arquivo:", nome_arquivo)

In [None]:
print("Data:", data)

### Exercícios:

1. Crie um programa que peça ao usuário para inserir uma frase e, em seguida, imprima apenas as vogais presentes na frase.

2. Crie um programa que solicite ao usuário um endereço de email. Valide se o endereço de email contém o símbolo "@" e se possui pelo menos um ponto "." após o "@". Exiba uma mensagem informando se o endereço é válido ou não.

## <font color=orange> Problema </font>
***

Análise de Dados de Contatos de Clientes

Você foi contratado por uma empresa para analisar uma lista de contatos de clientes e extrair informações úteis. A lista de contatos está armazenada em um arquivo de texto e contém informações sobre cada cliente, como nome, idade, e-mail e cidade. Seu objetivo é processar essas informações e realizar algumas análises.

Dados Fornecidos

```python
João Silva;28;joao.silva@gmail.com;São Paulo
Maria Oliveira;35;maria.oliveira@gmail.com;Rio de Janeiro
Carlos Pereira;22;carlos.pereira@outlook.com;São Paulo
Ana Costa;30;ana.costa@@yahoo.com;Belo Horizonte
```
Tarefas

***
1. Processamento de Dados
***

1° Leitura e Processamento dos dados

 - Divida cada linha em informações individuais usando `split(';')`.

2° Armazenamento das Informações

 - Armazene as informações de cada contato em uma lista de dicionários. Cada dicionário deve conter as chaves `nome`, `idade`, `email` e `cidade`.

***
2. Análise de Dados
***

1° Listagem de Dados

 - Utilize uma lista para armazenar todos os nomes dos clientes e imprima a lista de nomes.

2° Extração de Domínios de E-mail

 - Extraia o domínio de cada e-mail (a parte após o @) e armazene em um conjunto para encontrar quais domínios são mais comuns.

3° Filtragem por Cidade

 - Crie uma lista com os nomes dos clientes que moram em "São Paulo" e imprima essa lista.

4° Manipulação de Strings

 - Crie uma função que receba um e-mail e retorne o nome do cliente e o domínio do e-mail.

# 2 Controle de fluxo
***

O controle de fluxo é uma parte essencial da programação que permite direcionar a ordem em que as instruções são executadas em um programa. Em Python, as estruturas de controle de fluxo são usadas para criar programas que podem tomar decisões e executar diferentes blocos de código com base em condições específicas.

## 2.1. Instruções Condicionais (if, elif, else)

As instruções condicionais são a base da tomada de decisão em Python. Elas permitem que você execute diferentes blocos de código com base no valor de uma expressão booleana (verdadeiro ou falso).

Sintaxe:
```python
if condição1:
    # Código a ser executado se a condição1 for verdadeira
elif condição2:
    # Código a ser executado se a condição2 for verdadeira
else:
    # Código a ser executado se nenhuma das condições anteriores for verdadeira
```

Exemplo:

In [None]:
nota = 7

In [None]:
if nota >= 9:
    print("Conceito A")
elif nota > 7:
    print("Conceito B")
elif nota >= 5:
    print("Conceito C")
else:
    print("Conceito D")

Observações:

 - O bloco elif é opcional e pode haver vários blocos elif em uma instrução if.
   
 - O bloco else também é opcional e é executado apenas se todas as condições anteriores forem falsas.


Exercícios:

1. Verificação de Número Par/Ímpar: Crie um programa que solicite ao usuário um número inteiro e utilize instruções condicionais (if, else) para determinar se o número é par ou ímpar. Exiba uma mensagem informando o resultado.

2. Calculadora Simples: Crie uma calculadora que solicite ao usuário dois números e a operação desejada (+, -, *, /). Utilize if, elif e else para realizar a operação correspondente e exibir o resultado.

3. Validação de Idade: Crie um programa que solicite a idade do usuário e utilize instruções condicionais para determinar se ele é menor de idade (idade < 18), adulto (idade >= 18) ou idoso (idade >= 65). Exiba uma mensagem informando a classificação.

## 2.2. Laços de Repetição (for, while)

### 2.2.1. Laço for

O laço `for` é uma estrutura de controle de fluxo utilizada para iterar sobre uma sequência de elementos. Isso significa que o código dentro do laço for será executado para cada elemento presente na sequência, um de cada vez. Esse tipo de laço é muito útil para automatizar tarefas repetitivas que precisam ser realizadas em cada um dos elementos de uma coleção de dados.

Sintaxe:
```python
for <variavel> in <sequencia>:
    # Bloco de código a ser repetido
```

● `<variavel>`: É uma variável que assumirá o valor de cada elemento da sequência a cada iteração do laço.

● `<sequencia>`: Representa a sequência de elementos sobre a qual o laço irá iterar. Pode ser uma lista, tupla, string, etc.

Exemplo:

In [None]:
# Imprimir cada dia da semana a partir de uma tupla
dias_da_semana = ("segunda", "terça", "quarta", "quinta", "sexta", "sábado", "domingo")

In [None]:
for dia in dias_da_semana:
    print("Hoje é", dia)

Neste exemplo, o laço for percorre a tupla `dias_da_semana`. A cada iteração, a variável dia recebe o valor do próximo dia da semana na tupla, e a instrução print("Hoje é", dia) imprime esse valor.

Exercício:

Crie um programa que utilize um laço `for` para iterar sobre uma lista de números e calcular a soma de todos os elementos da lista.

Observações:

 - A legibilidade do código Python, que utiliza indentação em vez de chaves para delimitar blocos de código, é um dos seus pontos fortes.

 - O uso de laços `for` é fundamental para manipular dados de forma eficiente em Python, especialmente quando se trabalha com grandes conjuntos de dados, como é comum em análise de dados.

 - O pandas, uma biblioteca essencial para análise de dados em Python, foi projetado para trabalhar com dados tabulares e heterogêneos, e o uso de laços `for` em conjunto com as estruturas de dados do pandas é muito comum.

### 2.2.2. Laço while

O laço `while` é uma estrutura de controle de fluxo em Python que permite executar um bloco de código repetidamente enquanto uma determinada condição for avaliada como verdadeira. Diferentemente do laço `for`, que itera sobre uma sequência predefinida de elementos, o laço `while` oferece mais flexibilidade, pois ele continuará a executar o bloco de código até que a condição se torne falsa, independentemente do número de iterações.

Sintaxe:
```python
while <condicao>:
    # Bloco de código a ser repetido
```

 - `<condicao>`: Uma expressão booleana (que retorna True ou False) que determina se o laço deve continuar executando.

Exemplo:

In [None]:
contador = 1

In [None]:
while contador <= 5:
    print("Contador:", contador)
    contador = contador + 1

Exercício:

Crie um programa que utilize um laço `while` para solicitar que o usuário digite números até que ele digite o número `0`. Em seguida, o programa deve imprimir a soma de todos os números digitados.

Observações:

 - O uso de laços `while` exige atenção especial à condição de parada. É fundamental garantir que a condição se torne falsa em algum momento durante a execução do laço para evitar laços infinitos.

 - As fontes fornecidas, embora abordem conceitos de programação em Python, não mencionam explicitamente o laço `while`. Esta explicação e os exemplos são baseados em meu conhecimento geral de programação em Python.

## 2.3. Instruções de Controle de Laço (break, continue)

### 2.3.1 Instrução break

A instrução `break` fornece uma maneira de sair abruptamente de um laço `for` ou `while` antes que ele termine sua iteração normal. Quando `break` é encontrado dentro do bloco de código de um laço, a execução do laço é interrompida imediatamente, e o programa continua a partir da próxima instrução após o laço.

Exemplo:

In [None]:
numeros = list(range(1, 6)) # Cria uma lista de números de 1 a 5

In [None]:
for numero in numeros:
    print(numero)
    if numero == 3:
        break
print("Laço interrompido!")

Neste exemplo, o laço `for` itera sobre a lista numeros. A cada iteração, o valor de numero é impresso. Quando numero atinge o valor `3`, a condição `numero == 3` se torna verdadeira, o que faz com que a instrução `break` seja executada, interrompendo o laço.

Exercício:

Crie um programa que solicite ao usuário que digite uma senha. O programa deve permitir no máximo três tentativas. Utilize a instrução break para sair do laço de tentativas se o usuário digitar a senha correta ou se ele exceder o número de tentativas.

### 2.3.2 Instrução continue

A instrução `continue`, ao contrário de `break`, não interrompe completamente um laço. Em vez disso, `continue` interrompe a iteração atual do laço e passa imediatamente para a próxima iteração, ignorando qualquer código restante dentro do bloco de código do laço para aquela iteração específica.

Exemplo:

In [None]:
numeros = list(range(1, 6)) # Cria uma lista de números de 1 a 5

In [None]:
for numero in numeros:
    if numero == 3:
        continue
    print(numero)
print("Laço concluído!")

Neste exemplo, o laço `for` itera sobre a lista numeros. Quando numero é igual a `3`, a condição `numero == 3` se torna verdadeira, e a instrução `continue` é executada. Isso faz com que o programa ignore a instrução `print(numero)` para aquela iteração e passe para a próxima iteração do laço.

Exercício:

Crie um programa que leia uma lista de números e imprima apenas os números pares. Utilize a instrução continue para ignorar os números ímpares.

Observações:

 - A instrução `continue` é útil para pular iterações de um laço quando determinadas condições são atendidas, evitando processamentos desnecessários.

 - Assim como `break`, `continue` afeta apenas o laço em que está contida quando usada em laços aninhados.

## <font color=orange> Problemas </font>
***

Agora que você aprendeu sobre controle de fluxo, é hora de aplicar esse conhecimento para resolver um problema prático. Você foi encarregado de desenvolver um sistema para uma biblioteca que automatize o processo de empréstimo de livros, considerando as diferentes regras para cada tipo de usuário (estudante, professor, visitante).

  - Solicite ao usuário que informe seu tipo de usuário (estudante, professor, visitante) e o número de livros já emprestados.

  - Utilize estruturas de controle de fluxo (if, elif, else) para determinar se o usuário pode pegar mais livros emprestados ou se atingiu o limite.

  - Exiba uma mensagem informando o resultado.

# 3 Funções
***

## 3.1 Anatomia de uma Função

### 3.1.1 Definindo uma Função:  A Palavra-Chave def

Em Python, a palavra-chave `def` é usada para indicar o início da definição de uma função. Ela instrui o interpretador Python a criar um novo objeto de função, que pode ser chamado posteriormente pelo seu nome.

Sintaxe:
```python
def nome_da_funcao(parametro1, parametro2, ...):
    """Docstring da função."""
    # Corpo da função
    # ...
    return valor  # Opcional
```

Exemplo:

In [None]:
def calcular_area_retangulo(largura, altura):
    """Calcula a área de um retângulo.

    Args:
        largura: A largura do retângulo.
        altura: A altura do retângulo.

    Returns:
        A área do retângulo.
    """
    area = largura * altura
    return area

In [None]:
calcular_area_retangulo(5, 10)

Exercício:

Escreva uma função chamada `calcular_media` que recebe uma lista de números como entrada e retorna a média aritmética dos números na lista.

Observações:

 - É crucial escolher nomes de função descritivos que reflitam claramente o propósito da função.

 - Os parênteses após o nome da função podem estar vazios ou conter um ou mais parâmetros.

 - A instrução `return` é opcional; se omitida, a função retornará `None`.

 - As **docstrings** são altamente recomendadas para documentar o código, explicando o que a função faz, quais parâmetros ela recebe e o que ela retorna.

 - A indentação é **essencial** em Python para definir blocos de código. O código dentro do corpo da função deve ser indentado para indicar que pertence à função.

### 3.1.2  A Instrução return (Opcional)

A instrução `return` em Python é responsável por retornar um valor de uma função para o local onde ela foi chamada. Ela define o resultado da função e, opcionalmente, pode enviar dados de volta para o código que a chamou.

Exemplo:

In [None]:
def dobrar(x):
    """Multiplica a entrada por 2."""
    return x * 2

In [None]:
resultado = dobrar(5)  # Chama a função 'dobrar' com o argumento 5
print(resultado)  # Imprime o valor retornado pela função, que é 10

Casos Especiais:

 - Múltiplos `return`: Uma função pode ter múltiplas instruções `return`, cada uma retornando um valor diferente com base em condições dentro da função.

 - Retorno sem valor: Se uma função não tiver uma instrução `return` explícita, ela retornará automaticamente o valor None, indicando que a função não produz nenhum resultado específico.

Exercício:

Escreva uma função chamada `eh_par` que recebe um número inteiro como entrada. A função deve retornar `True` se o número for par e `False` caso contrário.

Observações:

 - A instrução return é opcional. No entanto, é uma boa prática incluí-la explicitamente para tornar o código mais legível e compreensível.

 - O valor retornado por uma função pode ser de qualquer tipo de dado em Python, incluindo números, strings, listas, tuplas, dicionários e até mesmo outras funções.

## 3.2 Passagem de Argumentos e Valores de Retorno

### 3.2.1 Tipos de Argumentos

Em Python, os argumentos são os valores que você passa para uma função quando a chama. Esses argumentos são então usados pela função para realizar sua tarefa. Existem dois tipos principais de argumentos em Python: argumentos posicionais e argumentos nomeados (keywords).

#### Argumentos Posicionais

Argumentos posicionais são aqueles cujo significado é determinado pela sua posição na chamada da função. Em outras palavras, a ordem em que você coloca os argumentos na chamada da função é crucial, pois cada posição corresponde a um parâmetro específico na definição da função.

Exemplo:

In [None]:
def saudar(nome, mensagem):
  """
  Esta função recebe um nome e uma mensagem e imprime uma saudação.
  """
  print(f"{mensagem}, {nome}!")

In [None]:
saudar("Alice", "Olá")

#### Argumentos Nomeados (Keywords)

Argumentos nomeados (keywords) permitem que você especifique explicitamente a qual parâmetro cada argumento corresponde, usando o nome do parâmetro na chamada da função. Isso oferece maior flexibilidade e legibilidade, especialmente em funções com muitos parâmetros, pois você não precisa se preocupar com a ordem em que os argumentos são passados.

In [None]:
def descrever_pessoa(nome, idade, cidade):
  """
  Esta função imprime uma descrição de uma pessoa.
  """
  print(f"{nome} tem {idade} anos e mora em {cidade}.")

In [None]:
descrever_pessoa("David", 24, "Natal")

In [None]:
descrever_pessoa(nome="Bob", idade=30, cidade="São Paulo")

In [None]:
descrever_pessoa(idade=25, cidade="Rio de Janeiro", nome="Carol")

### 3.2.2 Valores Padrão (Default) para Argumentos

Em Python, você pode definir valores padrão para os argumentos de uma função. Esses valores são usados automaticamente quando a função é chamada sem que o argumento correspondente seja fornecido.

Sintaxe:

```python
def nome_da_funcao(parametro1=valor_padrão1, parametro2=valor_padrão2, ...):
    # corpo da função
```

Valores padrão são definidos na declaração da função, usando o operador de atribuição (=) após o nome do parâmetro.

Exemplo:

In [None]:
def saudar(nome="Usuário", lingua="Português"):
    """
    Saúda o usuário com uma mensagem na língua especificada.
    """
    if lingua == "Português":
        print(f"Olá, {nome}!")
    elif lingua == "Inglês":
        print(f"Hello, {nome}!")
    else:
        print(f"Desculpe, não sei falar '{lingua}'.")

In [None]:
saudar()

In [None]:
saudar("Alice")

In [None]:
saudar("Bob", "Inglês")

In [None]:
saudar(lingua="Espanhol")

## 3.3 Funções Lambda e suas Aplicações

### 3.3.1 Introdução às Funções Lambda

Uma função `lambda` em Python é uma função anônima, ou seja, uma função que não possui um nome formal. Em vez de usar a palavra-chave `def` para defini-las, usamos a palavra-chave `lambda`. A estrutura básica de uma função `lambda` é a seguinte:

Onde:
 - `lambda`: A palavra-chave que indica a definição de uma função lambda.

 - argumentos: Uma lista de argumentos separados por vírgula, semelhante aos argumentos de uma função tradicional.

 - `:` : O operador que separa a lista de argumentos da expressão.

 - expressão: Uma única expressão que é avaliada e retornada pela função lambda quando ela é chamada.

A principal restrição das funções lambda é que elas podem conter apenas uma única expressão. Isso significa que elas são mais adequadas para operações simples e concisas.

Exemplo:

In [None]:
somar_cinco = lambda x: x + 5
somar_cinco(10)

### 3.3.2 Aplicações Comuns de Funções Lambda

Funções lambda, devido à sua sintaxe compacta, são particularmente úteis em situações onde uma função é necessária como argumento para outra função. As fontes fornecem diversos exemplos de como as funções lambda podem ser utilizadas em conjunto com funções de alta ordem e para implementar currying.

Funções Lambda com Funções de Alta Ordem:

 -  Mapeamento (`map`):  A função map aplica uma função a cada elemento de uma sequência, retornando uma nova sequência com os resultados.

In [None]:
numeros = [1, 2, 3, 4, 5] # Definir a lista original
dobrados = map(lambda x: x * 2, numeros) # Usar map para aplicar uma função que dobra o valor de cada número
print(list(dobrados))  # Converter o resultado em uma lista e exibir

 -  Filtragem (`filter`): A função filter  usa uma função para selecionar elementos de uma sequência que satisfazem uma determinada condição, retornando uma nova sequência apenas com esses elementos.

In [None]:
numeros = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # Definir a lista original
pares = filter(lambda x: x % 2 == 0, numeros) # Usar filter para selecionar apenas os números pares
print(list(pares))  # Converter o resultado em uma lista e exibir

 - Ordenação (`sort`): A função sort, aplicada a listas, pode usar uma função como chave para determinar a ordem de classificação.

In [None]:
palavras = ['maçã', 'banana', 'kiwi', 'abacaxi', 'uva'] # Definir a lista de strings
palavras.sort(key=len) # Usar sort com a função len como chave para ordenar pelo comprimento das strings
print(palavras)  # Exibir a lista ordenada

### 3.3.3 Vantagens do Uso de Funções Lambda

Funções lambda, como destacado em nossa conversa anterior, oferecem vantagens significativas em termos de concisão e flexibilidade na programação Python, especialmente em cenários onde a criação de uma função nomeada tradicional com a palavra-chave `def` seria excessivamente verbosa.

Vantagens:

 - Concisão: Funções lambda permitem expressar operações simples de forma muito mais compacta em comparação com funções definidas com def. Essa concisão pode melhorar significativamente a legibilidade do código, tornando-o mais fácil de entender e manter, especialmente quando se trata de operações simples aplicadas em contextos específicos.

 - Flexibilidade: A natureza anônima das funções lambda oferece grande flexibilidade em sua aplicação. Elas podem ser usadas diretamente como argumentos para funções de alta ordem, como `map()`, `filter()` e `sort()`, sem a necessidade de definir uma função nomeada separadamente. Essa capacidade de definir funções "on-the-fly" torna o código mais fluido e adaptável a diferentes situações, especialmente ao lidar com operações em coleções de dados.

Exemplo Ilustrativo:

Considere a tarefa de calcular o quadrado de cada número em uma lista. Sem funções lambda, poderíamos escrever:

In [None]:
def quadrado(x):
    return x * x

numeros = list(range(8, 13))
quadrados = list(map(quadrado, numeros))
print(quadrados)

Com uma função lambda, a mesma operação se torna muito mais concisa:

In [None]:
numeros = list(range(8, 13))
quadrados = list(map(lambda x: x * x, numeros))
print(quadrados)

## <font color=orange> Problemas </font>
***

Você foi contratado para desenvolver uma calculadora de descontos para uma loja online. A loja oferece descontos personalizados para diferentes clientes, dependendo do valor total da compra e do código de desconto inserido. Sua tarefa é escrever uma função que recebe o valor total da compra, o percentual de desconto, e opcionalmente o código de desconto. O código de desconto aplica um desconto adicional ao total final.
Requisitos:

1° Defina uma função chamada `calcular_preco_final()` que receba os seguintes argumentos:

 - `valor_total`: o valor total da compra (posicional).

 - `percentual_desconto`: o percentual de desconto aplicado à compra (posicional).

 - `codigo_desconto`: um código opcional que, se informado, aplica um desconto adicional de 10% no total final (default: `None`).

2° Retorne o preço final da compra após aplicar o desconto. Se o código de desconto for informado, aplique um desconto adicional de 10% sobre o valor já com desconto.

 - A função deve utilizar: Argumentos posicionais (`valor_total` e `percentual_desconto`). Um argumento com valor padrão (`codigo_desconto`).

Dicas:

 - O desconto deve ser calculado sobre o valor total da compra: `valor_total - (valor_total * percentual_desconto / 100)`.

 - Se o código de desconto for fornecido, aplique um desconto adicional de 10% sobre o valor final.

# <font color=lightblue>4 Bibliotecas para data science</font>
***

## 4.1. Numpy</font>
***

A NumPy é uma biblioteca fundamental para quem trabalha com dados numéricos em Python. Ela oferece um array multidimensional rápido e eficiente, permitindo a realização de operações matemáticas em grandes conjuntos de dados de forma simples e eficaz. Além disso, a NumPy facilita a leitura e gravação de dados e fornece funções básicas para álgebra linear e geração de números aleatórios, tornando-se uma ferramenta indispensável para manipulação de dados numéricos no Python.

Importando numpy

In [None]:
import numpy as np

### 4.1.1. Criando Arrays

Arrays NumPy são estruturas de dados fundamentais para trabalhar com dados numéricos em Python. Eles são objetos multidimensionais de alto desempenho que permitem operações matemáticas eficientes e rápidas em grandes conjuntos de dados.

1. **Criando um array a partir de uma lista**

In [None]:
array_1d = np.array([1, 2, 3, 4, 5]) # Array unidimensional a partir de uma lista
array_1d

In [None]:
array_2d = np.array([[1, 2, 3], [4, 5, 6]]) # Array bidimensional a partir de uma lista de listas
array_2d

2. **Criando um array preenchido com zeros ou uns**

In [None]:
zeros_array = np.zeros((3, 4)) # Array de zeros com dimensões 3x4
zeros_array

In [None]:
ones_array = np.ones((2, 3)) # Array de uns com dimensões 2x3
ones_array

3. **Criando um array com valores igualmente espaçados**

In [None]:
array_range = np.arange(0, 11, 2) # Array com valores de 0 a 10, com espaçamento de 2
array_range

In [None]:
array_linspace = np.linspace(0, 1, 10) # Array com 10 valores igualmente espaçados entre 0 e 1
array_linspace

4. **Criando um array com números aleatórios**

In [None]:
random_array = np.random.rand(5) # Array com 5 números aleatórios entre 0 e 1
random_array

In [None]:
normal_array = np.random.randn(3) # Array com 3 números aleatórios com distribuição normal
normal_array

 - Existem diversas outras funções disponíveis no NumPy para criar arrays, como `empty()`, `full()`, `eye()`, etc. Explore a documentação do [NumPy](https://numpy.org/doc/) para obter mais informações.

### 4.1.2. Operações com Arrays

O NumPy permite a realização de operações matemáticas e lógicas diretamente em arrays. Essas operações são vetorizadas, o que significa que são aplicadas a cada elemento do array de forma eficiente, sem a necessidade de laços explícitos em Python. Isso resulta em um código mais conciso, rápido e legível.

1. **Operações Aritméticas**

In [None]:
array1 = np.array([1, 2, 3, 4])
array2 = np.array([5, 6, 7, 8])

In [None]:
soma = array1 + array2
subtracao = array1 - array2
multiplicacao = array1 * array2
divisao = array1 / array2

In [None]:
print("Soma:", soma)
print("Subtração:", subtracao)
print("Multiplicação:", multiplicacao)
print("Divisão:", divisao)

2. **Operações com Arrays e Escalares**

In [None]:
array = np.array([1, 2, 3, 4])

In [None]:
soma_escalares = array + 10
multiplicacao_escalares = array * 2

In [None]:
print("Soma com escalar:", soma_escalares)
print("Multiplicação com escalar:", multiplicacao_escalares)

3. **Comparação e Operações Lógicas**

In [None]:
array1 = np.array([1, 2, 3, 4])
array2 = np.array([2, 2, 4, 4])

In [None]:
igualdade = array1 == array2
maior_que = array1 > array2
menor_que = array1 < array2

In [None]:
print("Igualdade:", igualdade)
print("Maior que:", maior_que)
print("Menor que:", menor_que)

### 4.1.3. Indexação e Slicing em Arrays

Indexação e Slicing em Arrays NumPy permitem que você acesse e manipule elementos específicos ou subconjuntos de um array de forma eficiente e flexível. A indexação é a forma de selecionar elementos individuais, enquanto o Slicing extrai uma sequência de elementos.

1. **Indexação Básica**

In [None]:
array_1d = np.array([10, 20, 30, 40, 50])

In [None]:
array_1d[0]  # Primeiro elemento

In [None]:
array_1d[3]  # Quarto elemento

2. **Slicing**

In [None]:
array_1d = np.array([10, 20, 30, 40, 50])

In [None]:
fatia_1 = array_1d[1:4]  # Elementos do índice 1 ao 3
fatia_2 = array_1d[:3]   # Elementos do início até o índice 2
fatia_3 = array_1d[2:]   # Elementos do índice 2 até o final

In [None]:
print("Fatia do índice 1 ao 3:", fatia_1)
print("Fatia do início até o índice 2:", fatia_2)
print("Fatia do índice 2 até o final:", fatia_3)

3. **Indexação com Arrays**

In [None]:
array_1d = np.array([10, 20, 30, 40, 50])

In [None]:
indices = np.array([1, 3, 4])  # Índices que queremos acessar
elementos = array_1d[indices]

In [None]:
print("Elementos nos índices [1, 3, 4]:", elementos)

4. **Slicing Multidimensional**

In [None]:
array_2d = np.array([[1, 2, 3], [4, 5, 6]])

In [None]:
fatia_2d = array_2d[0:2, 1:3]  # Seleciona todas as linhas e as colunas 1 e 2
fatia_2d

### 4.1.4. Gerando Dados Aleatórios

O NumPy oferece um módulo robusto para geração de números pseudoaleatórios, permitindo criar arrays com valores aleatórios provenientes de diversas distribuições estatísticas. Esse recurso é fundamental para tarefas como simulação de dados, amostragem aleatória, inicialização de parâmetros em aprendizado de máquina e muito mais.

1. **Gerando Números Aleatórios Uniformemente Distribuídos**

In [None]:
np.random.uniform(0, 1, 5) # 5 números aleatórios uniformemente distribuídos entre 0 e 1

In [None]:
np.random.uniform(10, 20, 3) # 3 números aleatórios uniformemente distribuídos entre 10 e 20

2. **Gerando Inteiros Aleatórios**

In [None]:
np.random.randint(1, 10, 5) # 5 inteiros aleatórios entre 1 e 10

In [None]:
np.random.randint(0, 100, (2, 3)) # Matriz 2x3 de inteiros aleatórios entre 0 e 100

3. **Amostragem Aleatória de um Array**

In [None]:
array = np.array([10, 20, 30, 40, 50])

In [None]:
# Amostragem aleatória de 3 elementos do array com substituição
amostra = np.random.choice(array, 3, replace=True)
print("Amostra aleatória com substituição:", amostra)

In [None]:
# Amostragem aleatória de 3 elementos do array sem substituição
amostra_sem_substituicao = np.random.choice(array, 3, replace=False)
print("Amostra aleatória sem substituição:", amostra_sem_substituicao)

1. Amostragem com Substituição (`replace=True`)

Quando Usar:

 - Simulação de Eventos Repetitivos: Em situações onde você está simulando eventos que podem ocorrer várias vezes, como o lançamento de uma moeda, onde o mesmo resultado (cara ou coroa) pode ocorrer várias vezes.
    
 - Distribuição de Recursos: Quando você está simulando a alocação de recursos onde a reposição é possível, como a escolha repetida de produtos de um estoque para diferentes clientes.

 2. Amostragem sem Substituição (`replace=False`)

Quando Usar:

 - Seleção de Amostras Únicas: Quando você precisa de uma amostra onde cada item é único, como selecionar alunos para uma pesquisa onde cada aluno deve ser selecionado apenas uma vez.

 - Experimentos Sem Reposição: Em situações onde você está simulando um processo onde uma vez que um item é escolhido, ele não pode ser escolhido novamente, como na escolha de cartas de um baralho sem reposição.

4. **Gerando Dados Aleatórios de Distribuições Específicas**

In [None]:
np.random.normal(0, 1, 5) # 5 números aleatórios com distribuição normal (média=0, desvio padrão=1)

In [None]:
np.random.binomial(10, 0.5, 5) # 5 números aleatórios com distribuição binomial (n=10, p=0.5)

In [None]:
np.random.poisson(3, 5) # 5 números aleatórios com distribuição de Poisson (lambda=3)

In [None]:
np.random.exponential(1.0, 5) # 5 números aleatórios com distribuição exponencial (scale=1.0)

In [None]:
np.random.randint(1, 10, 5) # 5 números inteiros aleatórios entre 1 e 10

### <font color=orange> Problemas </font>

Crie um programa em Python que utilize a biblioteca NumPy para realizar as seguintes tarefas:

1. Geração de Dados: Crie um array unidimensional chamado temperaturas com 10 valores aleatórios representando temperaturas diárias em graus Celsius. Os valores devem estar dentro do intervalo de -10°C a 35°C.

2. Conversão de Unidades: Crie um novo array chamado temperaturas_fahrenheit que contenha as temperaturas em graus Fahrenheit. Utilize a fórmula de conversão: `F = (C * 9/5) + 32`.

3. Estatísticas Descritivas: Calcule e imprima as seguintes estatísticas descritivas para as temperaturas em graus Celsius:

 - Média

 - Mediana

 - Desvio padrão

 - Temperatura máxima

 - Temperatura mínima
4. Indexação e Filtragem:

 - Selecione e imprima as temperaturas acima de 25°C.

 - Crie um novo array contendo apenas as temperaturas abaixo de 0°C.

 Dicas:

 - Utilize as funções do NumPy para geração de dados aleatórios (`np.random.uniform()` ou `np.random.randint()`), operações matemáticas vetorizadas, funções estatísticas (`np.mean()`, `np.median()`, `np.std()`, `np.max()`, `np.min()`) e indexação booleana.

## 4.2. Pandas
***

O Pandas é uma biblioteca essencial em Python para análise de dados, especialmente para lidar com dados estruturados, como dados tabulares. Ele fornece estruturas de dados eficientes e flexíveis, como DataFrames e Series, que facilitam a manipulação, limpeza, análise e transformação de dados.

Importando pandas

In [None]:
import pandas as pd

### 4.2.1. Introdução ao Pandas e suas principais funções

#### 4.2.1.1. O que é um DataFrame?

Um DataFrame é uma estrutura de dados tabular bidimensional provida pela biblioteca Pandas. Imagine uma tabela com linhas e colunas, onde cada coluna pode conter um tipo diferente de dado, como números, texto ou datas. É como uma versão mais poderosa e flexível de uma planilha do Excel ou uma tabela de um banco de dados.

Características Principais:

 - **Dados Organizados em Linhas e Colunas**: Pense em um DataFrame como uma tabela com linhas e colunas. Cada linha representa uma observação (ex: um cliente, uma transação) e cada coluna representa uma característica dessa observação (ex: nome do cliente, idade, cidade).

 - **Rótulos para Linhas e Colunas**:  Tanto as linhas quanto as colunas em um DataFrame têm rótulos. Os rótulos das colunas são como os cabeçalhos das colunas em uma planilha, e os rótulos das linhas permitem a identificação única de cada linha.

 - **Tipos de Dados Flexíveis**:  Cada coluna em um DataFrame pode armazenar um tipo de dados diferente, como números inteiros, números de ponto flutuante (decimais), strings (texto) ou datas.

 - **Base para Análise de Dados**: DataFrames são a base para muitas operações de análise de dados em Pandas, como filtragem, agrupamento, junção com outros DataFrames, estatísticas descritivas, e muito mais.

Exemplo:

In [None]:
dados = {
    'Nome': ['Alice', 'Bob', 'Charlie'],
    'Idade': [5, 6, 7],
    'Cidade': ['Nova York', 'São Paulo', 'Londres']
}

df = pd.DataFrame(dados)
df

**Por Que DataFrames são Importantes?**

DataFrames são essenciais em análise de dados porque permitem:

 - Organizar Dados de Forma Estruturada:  Facilitando a manipulação e análise.

 - Lidar com Dados Complexos: Com múltiplos tipos de dados em uma única estrutura.

 - Aplicar Operações em Lotes:  Em vez de trabalhar linha por linha, você pode aplicar operações a colunas inteiras ou ao DataFrame como um todo, tornando a análise muito mais eficiente.

O DataFrame é uma das estruturas de dados mais importantes do Pandas e serve como base para a maioria das tarefas de análise de dados realizadas com essa biblioteca.

#### 4.2.1.2. O que é uma Series?

Uma Series é uma estrutura de dados unidimensional do Pandas que pode ser pensada como uma coluna em um DataFrame ou uma lista com rótulos. Ela é capaz de armazenar dados de tipos variados, como inteiros, strings e valores booleanos, e cada elemento na Series é associado a um rótulo de índice.

Pense em uma Series como uma lista onde cada elemento tem um nome (rótulo) associado a ele. Isso a torna muito mais poderosa do que uma lista comum, pois você pode acessar e manipular os dados usando os rótulos, e não apenas a posição numérica.

**Exemplo**:

In [None]:
alturas = pd.Series([1.75, 1.80, 1.65], index=['Alice', 'Bob', 'Charlie'])

 - Você pode usar os rótulos de índice para acessar os dados em uma Series

In [None]:
altura_do_bob = alturas['Bob']

Neste exemplo:

 - `alturas` é o nome da sua Series.

 - `[1.75, 1.80, 1.65]` são os dados da Series, representando as alturas.

 - `['Alice', 'Bob', 'Charlie']` são os rótulos de índice, associando cada altura a uma pessoa.

Você pode criar uma Series do Pandas de diversas maneiras, como:

 - A partir de uma lista:
```python
dados = [10, 20, 30, 40]
s = pd.Series(dados)
```

 - A partir de um dicionário:
```python
dados = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
obj3 = pd.Series(dados)
```


Por Que Series são Úteis?

 - Armazenamento de Dados com Rótulos: A capacidade de associar rótulos aos dados torna a Series muito útil para armazenar e manipular dados que possuem um significado associado a cada valor.

 - Base para DataFrames: Series são os blocos de construção de DataFrames. Cada coluna em um DataFrame é essencialmente uma Series.

 - Operações Eficientes: Assim como os DataFrames, as Series permitem realizar operações eficientes em grandes conjuntos de dados.

Compreender as Series é fundamental para trabalhar com a biblioteca Pandas, pois elas formam a base para a estrutura de dados mais poderosa do Pandas, o DataFrame.

#### 4.2.1.3. Criando um DataFrame

Um DataFrame, a estrutura de dados tabular do Pandas, pode ser criado de várias maneiras. Aqui estão alguns métodos comuns.

**A partir de um dicionário de listas de mesmo tamanho:**

In [None]:
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2000, 2001, 2002],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data)
df

Você pode especificar a ordem desejada das colunas ao criar um DataFrame a partir de um dicionário.

In [None]:
pd.DataFrame(data, columns=['year', 'state', 'pop'])

**A partir de um dicionário de dicionários aninhados:**

Se você tiver um dicionário onde cada chave está associada a outro dicionário, pode criar um DataFrame onde:

 - As chaves externas se tornam nomes de colunas.

 - As chaves internas se tornam índices de linha.

In [None]:
pop = {'Nevada': {2001: 2.4, 2002: 2.9},
       'Ohio': {2000: 1.5, 2001: 1.7, 2002: 3.6}}
df = pd.DataFrame(pop)
df

**A partir de uma lista de dicionários:**

Cada dicionário na lista pode representar uma linha de dados no DataFrame resultante. As chaves dos dicionários se tornam os nomes das colunas.

In [None]:
data = [{'a': 1, 'b': 2}, {'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
df

#### 4.2.1.4. Manipulando Dados em um DataFrame

Agora abordaremos os métodos essenciais para manipular dados em um DataFrame. Exploraremos técnicas para selecionar, filtrar, e transformar dados, além de gerenciar índices e trabalhar com diferentes tipos de dados. O objetivo é fornecer ferramentas práticas para que você possa organizar e analisar os dados de forma eficiente.

**Criando um DataFrame de exemplo:**

In [None]:
data = {'Nome': ['Ana', 'Bruno', 'Carlos', 'Diana'],
        'Idade': [19, 25, 33, 41],
        'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Curitiba']}
df = pd.DataFrame(data)

1. Selecionando Dados

In [None]:
df['Nome']

In [None]:
df.loc[1:2, ['Idade', 'Cidade']]

In [None]:
df[df['Idade'] > 25]

2. Adicionando e Removendo Colunas

In [None]:
df['Profissão'] = ['Engenheiro', 'Médico', 'Professor', 'Analista']
df

In [None]:
df.drop('Cidade', axis=1, inplace=True)
df

 - `axis`: Especifica se a remoção deve ser feita ao longo das linhas ou colunas.
 - `inplace`: Controla se a operação deve modificar o DataFrame original ou retornar uma nova cópia.

3. Lidando com Dados Ausentes

In [None]:
df.loc[2, 'Profissão'] = None
df

In [None]:
df.fillna('Desconhecido', inplace=True)
df

4. Aplicando Funções e Transformações

In [None]:
df['Idade em 5 anos'] = df['Idade'].apply(lambda x: x + 5)
df

5. Ordenando Dados

In [None]:
df.sort_values('Idade', ascending=False, inplace=True)
df

### Exercício:
1. Crie um DataFrame com pelo menos 5 linhas e 4 colunas, com dados numéricos e de texto.
2. Selecione as linhas onde o valor de uma coluna específica atenda a uma determinada condição.
3. Crie uma nova coluna que seja o resultado de uma operação matemática em duas colunas existentes.
4. Ordene o DataFrame por duas colunas, em ordem crescente e decrescente.

### 4.2.2. Leitura e Escrita de Dados com Pandas

O Pandas simplifica a leitura e escrita de dados de diversas fontes, incluindo arquivos, bancos de dados e APIs web. As funções `read_csv`, `read_excel`, `read_sql` e `to_csv` são algumas das ferramentas disponíveis para estas operações.

Exemplos:

1. Escrevendo dados para um arquivo CSV

In [None]:
dados = {'coluna1': [2, 3, 4], 'coluna2': [5, 6, 7]}
df = pd.DataFrame(dados)
df.to_csv('dados.csv')

2. Lendo dados de um arquivo CSV

In [None]:
df = pd.read_csv('dados.csv')

3. Escrevendo dados para um arquivo XLSX

In [None]:
dados = {'Nome': ["João", "Paulo", "Matheus"], 'Altura': [1.2, 1.9, 2]}
df = pd.DataFrame(dados)
df.to_excel("dados.xlsx", index=False)

4. Lendo dados de um arquivo XLSX

In [None]:
df = pd.read_excel('dados.xlsx')
df

### 4.2.3. Limpeza e Preparação de Dados

A limpeza e preparação de dados são etapas cruciais em qualquer projeto de análise de dados. Elas envolvem identificar e lidar com dados ausentes, inconsistentes, inválidos ou irrelevantes para garantir a qualidade, a precisão e a confiabilidade dos resultados da análise.

**Cria um DataFrame com dados ausentes:**

In [None]:
dados = {'Nome': ['Ana', 'Bruno', 'Carlos', 'Ana', 'Bruno', 'Carlos'],
         'Departamento': ['RH', 'TI', 'TI', 'RH', 'TI', 'RH'],
         'Salário': [3000, None, 5000, 3500, 4500, None]}

df = pd.DataFrame(dados)
df

1. Verifica a existência de dados ausentes

In [None]:
df.isnull()

2. Remove linhas com dados ausentes

In [None]:
df_sem_nulos = df.dropna()
df_sem_nulos

3. Preenche dados ausentes com a média da coluna

In [None]:
df_preenchido = df.fillna(df["Salário"].mean())
df_preenchido

4. Agrupando os dados pelo valor da coluna `Departamento`

In [None]:
soma_salarial = df.groupby('Departamento')['Salário'].sum()
soma_salarial

Outros métodos comuns com groupby:

 - `sum()`: Soma os valores dentro de cada grupo.
 - `count()`: Conta o número de elementos em cada grupo.
 - `min()` e `max()`: Encontra o menor e maior valor em cada grupo.

### <font color=orange> Problemas </font>

Você recebeu um conjunto de dados contendo informações sobre vendas de produtos em uma loja. Utilize o Pandas para carregar, manipular e analisar esses dados.

Dados do Arquivo CSV (vendas.csv):

Data       | Produto   | Quantidade | Preço Unitário
-----------|-----------|------------|----------------
2024-01-01 | Camiseta  | 10         | 29.90          
2024-01-01 | Calça     | 5          | 59.90          
2024-01-02 | Jaqueta   | 2          | 99.90          
2024-01-03 | Camiseta  | 7          | 29.90          
2024-01-03 | Calça     | 3          | 59.90      



1° Utilize o Pandas para carregar o arquivo CSV (vendas.csv) em um DataFrame.

2° Exiba as primeiras linhas do DataFrame para verificar o conteúdo.

3° Crie uma nova coluna no DataFrame chamada Total, que será o resultado da multiplicação da Quantidade pelo Preço Unitário.

4° Calcule o valor total das vendas para cada produto e exiba o resultado.

5° Filtre os dados para mostrar apenas as vendas realizadas no dia 2024-01-03 e exiba o resultado.

6° Salve o DataFrame atualizado com a nova coluna Total em um novo arquivo CSV chamado vendas_atualizadas.csv.


## 4.3. Matplotlib
***

A Matplotlib é a biblioteca Python mais popular para criar plotagens e outras visualizações bidimensionais de dados. Projetada para gerar visualizações adequadas para publicação, a Matplotlib é amplamente utilizada e bem integrada ao ecossistema Python, sendo uma escolha confiável como ferramenta de visualização padrão.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

### 4.3.1. Introdução à Matplotlib

Vamos criar um gráfico de linha simples para ilustrar o uso básico da Matplotlib. Neste exemplo, visualizamos a função seno ao longo de um intervalo:

In [None]:
x = np.linspace(0, 10, 100)  # 100 pontos igualmente espaçados entre 0 e 10
y = np.sin(x)  # Função seno para os dados y

In [None]:
plt.plot(x, y, color='blue', linestyle='-', marker='o') # Gráfico de linha

# Título e rótulos aos eixos
plt.title('Gráfico de Linha da Função Seno')
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')

plt.show()

### 4.3.2. Tipos de Gráficos

Matplotlib oferece uma ampla gama de tipos de gráficos que são essenciais para diferentes formas de visualização de dados. Cada tipo de gráfico tem uma aplicação específica dependendo da natureza dos dados e das informações que você deseja destacar. Neste subtópico, vamos explorar alguns dos tipos de gráficos mais comuns e suas aplicações.

1. Gráfico de Linha

 - Os gráficos de linha são usados para mostrar tendências ao longo do tempo. Eles são úteis para visualizar mudanças contínuas e comparações entre diferentes séries temporais.

In [None]:
# Dados
x = np.arange(10)
y1 = np.sin(x)
y2 = np.cos(x)

In [None]:
# Gráfico de linha
plt.plot(x, y1, label='Seno', color='blue')
plt.plot(x, y2, label='Cosseno', color='red')

# Título e rótulos
plt.title('Gráfico de Linha')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()

plt.show()

2. Gráfico de Barras

 - Os gráficos de barras são usados para comparar valores em diferentes categorias. Eles são úteis para mostrar a distribuição de dados em diferentes grupos.

In [None]:
# Dados
categorias = ['A', 'B', 'C', 'D']
valores = [4, 7, 2, 5]

In [None]:
# Gráfico de barras
plt.bar(categorias, valores, color='green')

# Título e rótulos
plt.title('Gráfico de Barras')
plt.xlabel('Categorias')
plt.ylabel('Valores')

plt.show()

3. Gráfico de Dispersão

 - Os gráficos de dispersão são usados para mostrar a relação entre duas variáveis numéricas. Eles são úteis para identificar padrões, correlações e outliers.

In [None]:
# Dados
x = np.random.rand(50)
y = np.random.rand(50)

In [None]:
# Gráfico de dispersão
plt.scatter(x, y, color='purple', marker='o')

# Título e rótulos
plt.title('Gráfico de Dispersão')
plt.xlabel('X')
plt.ylabel('Y')

plt.show()

4. Histograma

 - Os histogramas são usados para mostrar a distribuição de um conjunto de dados contínuos. Eles são úteis para entender a frequência dos dados em intervalos específicos.

In [None]:
# Dados
dados = np.random.randn(1000)

In [None]:
# Criar o histograma
plt.hist(dados, bins=30, color='orange', edgecolor='black')

# Adicionar título e rótulos
plt.title('Histograma')
plt.xlabel('Valores')
plt.ylabel('Frequência')

plt.show()

### 4.3.3. Personalização de Gráficos

A personalização de gráficos é uma etapa crucial na criação de visualizações de dados eficazes. A Matplotlib oferece uma vasta gama de opções para personalizar a aparência dos seus gráficos, permitindo que você ajuste cores, estilos de linha, marcadores, legendas, títulos e muito mais. Personalizar gráficos não só melhora a estética, mas também facilita a comunicação de insights de forma clara e impactante.

In [None]:
# Dados
x = np.arange(10)
y1 = np.sin(x)
y2 = np.cos(x)

In [None]:
# Gráfico de linha com personalização
plt.plot(x, y1, color='blue', linestyle='--', marker='o', markersize=8, label='Seno')
plt.plot(x, y2, color='red', linestyle='-', marker='x', markersize=8, label='Cosseno')

# Título e rótulos aos eixos
plt.title('Gráfico de Linha Personalizado')
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')

# Legenda
plt.legend()

# Grade
plt.grid(True)

plt.show()

 - `color`: Define a cor da linha. Pode ser um nome de cor (como 'blue') ou um código hexadecimal (como '#0000FF').

 - `linestyle`: Define o estilo da linha. Opções comuns incluem `'-'` (linha sólida), `'--'` (linha pontilhada), `':'` (linha pontilhada) e `'-.'` (linha mista).

 - `marker`: Define o marcador usado para os pontos de dados. Exemplos incluem `'o'` (círculo), `'x'` (x), `'^'` (triângulo), etc.

 - `markersize`: Define o tamanho do marcador.

 - `plt.title()`: Adiciona um título ao gráfico.

 - `plt.xlabel()` e `plt.ylabel()`: Adicionam rótulos aos eixos X e Y, respectivamente.

 - `plt.legend()`: Adiciona uma legenda ao gráfico.

 - `plt.grid(True)`: Adiciona uma grade ao fundo do gráfico para melhor visualização dos dados.

### 4.3.4. Salvando Gráficos

Salvar gráficos é uma etapa importante para compartilhar e apresentar visualizações de dados de forma eficaz. A Matplotlib permite que você salve gráficos em vários formatos de arquivo, como PNG, JPG, PDF e SVG. Isso é útil para incluir gráficos em relatórios, apresentações e documentos.

In [None]:
x = np.arange(10)
y = np.sin(x)

In [None]:
plt.plot(x, y, marker='o', linestyle='-', color='b', label='Seno')
plt.title('Gráfico de Seno')
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')

plt.savefig('grafico_seno.png', format='png')  # Salvar como PNG
plt.savefig('grafico_seno.pdf', format='pdf')  # Salvar como PDF
plt.savefig('grafico_seno.svg', format='svg')  # Salvar como SVG

 - `plt.savefig`(`'nome_arquivo.extensao'`, `format='formato'`): Esta função salva o gráfico atual em um arquivo. O primeiro parâmetro é o nome do arquivo e a extensão define o formato (por exemplo, `.png`, `.pdf`, `.svg`). O parâmetro `format` define o formato do arquivo explicitamente (opcional se a extensão já estiver correta).

### <font color=orange> Problemas </font>
***

Você foi contratado para analisar e visualizar dados de desempenho de uma equipe de vendas em diferentes regiões ao longo de um ano. Seu gerente pediu que você criasse várias visualizações para entender melhor os dados e apresentar insights relevantes em uma reunião.
Dados:

Você tem um conjunto de dados fictícios de vendas com o seguinte formato:

 - Meses: Janeiro, Fevereiro, Março, ..., Dezembro
 - Vendas por Região:
  - Região Norte
  - Região Sul
  - Região Leste
  - Região Oeste

In [None]:
# Dados
meses = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho',
         'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro']
vendas_norte = np.random.randint(5000, 15000, size=12)
vendas_sul = np.random.randint(3000, 12000, size=12)
vendas_leste = np.random.randint(4000, 14000, size=12)
vendas_oeste = np.random.randint(6000, 16000, size=12)

**Tarefas**:

1. Gráfico de Linha:
 - Crie um gráfico de linha para mostrar a evolução das vendas ao longo dos meses para cada região. Utilize diferentes cores e estilos de linha para cada região. Adicione título e rótulos aos eixos.

2. Gráfico de Barras:
 - Crie um gráfico de barras que compare as vendas totais de cada região ao longo do ano. Mostre as vendas totais para cada região com barras de cores diferentes.

3. Histograma:
 - Gere um histograma das vendas mensais para uma das regiões (por exemplo, Região Norte) para visualizar a distribuição das vendas ao longo do ano. Ajuste o número de bins e as cores das barras.

4. Personalização e Salvamento:
 - Para o gráfico de linha criado, adicione uma legenda, ajuste as cores e os estilos das linhas, e salve o gráfico em três formatos diferentes (PNG, PDF, SVG). Verifique se todos os arquivos foram salvos corretamente.