# NumPy, Pandas e Manipulação de Strings

## Parte 1 – NumPy (Biblioteca Numérica)
NumPy é uma biblioteca usada para trabalhar com arrays (listas de listas), cálculos matemáticos e vetores de forma rápida e eficiente.

In [1]:
import numpy as np

# Criando uma lista normal
lista = [1, 2, 3, 4]
print("Lista comum:", lista)

# Criando um array NumPy
arr = np.array([1, 2, 3, 4])
print("Array NumPy:", arr)
print("Tipo:", type(arr))

Lista comum: [1, 2, 3, 4]
Array NumPy: [1 2 3 4]
Tipo: <class 'numpy.ndarray'>


In [2]:
# Arrays podem ter mais de uma dimensão
matriz = np.array([[1, 2], [3, 4]])
print("Matriz 2x2:")
print(matriz)
print("Shape (formato):", matriz.shape)

Matriz 2x2:
[[1 2]
 [3 4]]
Shape (formato): (2, 2)


In [4]:
# Operações vetorizadas (sem for)
print(arr)

dobro = arr * 2
print("Dobro de cada elemento:", dobro)

quadrado = arr ** 2
print("Quadrado de cada elemento:", quadrado)

[1 2 3 4]
Dobro de cada elemento: [2 4 6 8]
Quadrado de cada elemento: [ 1  4  9 16]


In [5]:
# Indexação e Fatiamento (slicing)
print("Primeiro elemento:", arr[0])
print("Últimos dois elementos:", arr[-2:])

Primeiro elemento: 1
Últimos dois elementos: [3 4]


In [6]:
# Filtrando valores com boolean masking
print("Valores maiores que 2:", arr[arr > 2])

Valores maiores que 2: [3 4]


In [7]:
# Estatísticas básicas
print("Soma:", arr.sum())
print("Média:", arr.mean())
print("Desvio padrão:", arr.std())

Soma: 10
Média: 2.5
Desvio padrão: 1.118033988749895


### **Questões**


### 1. **Sequência Misteriosa**

Crie um vetor com os 20 primeiros números pares positivos. Em seguida, exiba apenas os múltiplos de 4.

---

### 2. **Transforme a Temperatura**

Você recebeu um vetor com 5 temperaturas em Celsius: `[25, 30, 28, 22, 19]`. Converta todas elas para Fahrenheit usando a fórmula: `F = C * 1.8 + 32`.

---

### 3. **Custo Total de Produtos**

Um supermercado tem 5 produtos. Os preços estão em um vetor `precos = [10.0, 20.0, 5.0, 8.0, 15.0]` e as quantidades compradas em `quantidades = [2, 1, 4, 3, 1]`. Calcule o custo total da compra.

---

### 4. **Desempenho de Alunos**

Dado o vetor `notas = [6.5, 7.0, 8.2, 5.5, 9.0]`, calcule:

* A nota média da turma
* Quantos alunos tiraram nota maior que 7.0

---

### 5. **Sensor de Pressão**

Simule a leitura de um sensor de pressão com 10 valores aleatórios entre 100 e 200. Mostre:

* O maior valor lido
* O menor valor
* A média das pressões

---

### 6. **Quem passou?**

Dado o vetor `notas = [4.5, 6.0, 7.8, 3.0, 8.5, 9.2, 5.0]`, crie um novo vetor com 1 para "Aprovado" (nota >= 6) e 0 para "Reprovado".

---

### 7. **Explorador de Matrizes**

Crie uma matriz `3x4` com os números de 1 a 12. Depois:

* Exiba a segunda linha completa
* Exiba a terceira coluna completa
* Exiba o número que está na 1ª linha, 4ª coluna


## Parte 2 – Pandas (Análise de Dados)
Pandas é uma biblioteca poderosa para trabalhar com tabelas de dados (como planilhas do Excel ou arquivos CSV).

In [10]:
import pandas as pd

# Criando uma tabela com dados fictícios
dados = {
    'Nome': ['Ana', 'Bruno', 'Carlos'],
    'Idade': [25, 30, 22],
    'Nota': [8.5, 7.0, 9.2]
}

df = pd.DataFrame(dados)
print(df)
df

     Nome  Idade  Nota
0     Ana     25   8.5
1   Bruno     30   7.0
2  Carlos     22   9.2


Unnamed: 0,Nome,Idade,Nota
0,Ana,25,8.5
1,Bruno,30,7.0
2,Carlos,22,9.2


In [11]:
# Selecionando uma coluna
print("Notas:")
print(df['Nota'])
df['Nota']

Notas:
0    8.5
1    7.0
2    9.2
Name: Nota, dtype: float64


Unnamed: 0,Nota
0,8.5
1,7.0
2,9.2


In [12]:
# Filtrando alunos com nota acima de 8
print(df[df['Nota'] > 8])

     Nome  Idade  Nota
0     Ana     25   8.5
2  Carlos     22   9.2


In [13]:
# Adicionando uma nova coluna chamada "Status"
df['Status'] = ['Aprovado' if nota >= 7 else 'Reprovado' for nota in df['Nota']]
print(df)

     Nome  Idade  Nota    Status
0     Ana     25   8.5  Aprovado
1   Bruno     30   7.0  Aprovado
2  Carlos     22   9.2  Aprovado


In [14]:
# Cálculo de estatísticas
print("Média das notas:", df['Nota'].mean())

Média das notas: 8.233333333333333


### **Questões**

### 1. **Cadastro de Alunos**

Crie um `DataFrame` com os seguintes dados de 3 alunos: Nome, Idade, Curso. Depois, exiba:

* A lista de colunas
* O número total de linhas

---

### 2. **Notas da Turma**

Monte um `DataFrame` com 5 alunos e suas notas em Matemática. Em seguida:

* Calcule a média geral
* Liste os alunos que tiraram acima de 7.0

---

### 3. **Estoque de Produtos**

Crie um `DataFrame` com 4 produtos, seus preços e quantidades em estoque. Calcule:

* O valor total de cada item (preço × quantidade)
* O valor total do estoque

---

### 4. **Filtrando uma Planilha**

Dado um `DataFrame` com filmes (nome, ano, gênero, nota), mostre:

* Apenas os filmes lançados depois de 2010
* Apenas os filmes de gênero "Ação"

---

### 5. **Planilha com Dados Faltando**

Crie um `DataFrame` com alguns valores `None` nas colunas "nome" e "nota". Use:

* `isnull()` para verificar onde estão os valores ausentes
* `fillna()` para preencher os nomes com "Desconhecido" e as notas com a média

---

### 6. **Organizando uma Tabela**

Crie um `DataFrame` com dados embaralhados e:

* Ordene pela coluna "idade", do mais novo para o mais velho
* Ordene pela coluna "nota", do maior para o menor

---

### 7. **Cálculo por Grupo**

Crie uma coluna “curso” e use `groupby()` para:

* Calcular a média de notas por curso

---

### 8. **Adicionando e Removendo Colunas**

Adicione uma nova coluna chamada `status` com valores `"Ativo"`. Depois, remova essa coluna do `DataFrame`.

---

### 9. **Contando Categorias**

Dado um `DataFrame` com uma coluna de gêneros musicais (ex: 'Rock', 'Pop', 'Sertanejo', 'Rock', 'Pop'), conte:

* Quantas vezes aparece cada gênero com `value_counts()`

---

### 10. **Leitura de Arquivo CSV (simulada)**

Simule a leitura de um arquivo `.csv` criando um `DataFrame` com dados de cidades (nome, população, estado). Depois:

* Exiba as 3 primeiras linhas com `head()`
* Exiba as últimas 2 linhas com `tail()`


## Parte 3 – Manipulação de Strings e Dados Categóricos
Essencial para preparar os dados antes de usar modelos de IA.

In [15]:
# Manipulando texto
texto = "  Olá, Mundo! Python é legal.  "
texto = texto.strip().lower().replace("!", "")
print("Texto limpo:", texto)

Texto limpo: olá, mundo python é legal.


In [16]:
# Separando palavras
palavras = texto.split()
print("Palavras:", palavras)

Palavras: ['olá,', 'mundo', 'python', 'é', 'legal.']


In [17]:
# Criando dados categóricos
animais = pd.DataFrame({'Animal': ['cachorro', 'gato', 'gato', 'pássaro']})
print(animais)

     Animal
0  cachorro
1      gato
2      gato
3   pássaro


In [18]:
# Transformando em colunas binárias (One-hot encoding)
pd.get_dummies(animais)

Unnamed: 0,Animal_cachorro,Animal_gato,Animal_pássaro
0,True,False,False
1,False,True,False
2,False,True,False
3,False,False,True


### **Questões**


### 1. **Limpeza de Espaços e Capitalização**

Dada a lista de nomes `[' ana ', 'BRUNO', 'Carlos ']`, use `pandas` para:

* Remover espaços em branco
* Converter todos os nomes para apenas a primeira letra maiúscula

---

### 2. **Separação de Texto**

Crie uma coluna com frases do tipo `'Curso: IA'`, `'Curso: Python'`. Use `.str.split()` para separar o nome do curso em uma nova coluna.

---

### 3. **Substituição de Caracteres**

Crie uma coluna com nomes de cidades com acentos (ex: `'São Luís'`, `'Belo Horizonte'`). Remova os acentos manualmente com `.replace()`.

---

### 4. **Detecção de Palavras-chave**

Crie uma coluna com descrições de produtos e verifique quais linhas contêm a palavra `'inteligente'` usando `.str.contains()`.

---

### 5. **Conversão de Tudo para Minúsculo**

Dada uma lista de respostas de formulário (ex: `'SIM'`, `'sim'`, `'Sim'`, `'sIm'`), normalize todas para `'sim'`.

---

### 6. **Contagem de Palavras em Frases**

Crie uma coluna com avaliações textuais (ex: `'Muito bom!'`, `'Péssimo atendimento'`). Conte quantas palavras existem em cada frase.

---

### 7. **Combinação de Colunas Textuais**

Dado um `DataFrame` com `'nome'` e `'sobrenome'`, crie uma nova coluna `'nome_completo'` concatenando as duas.

---

### 8. **Verificação de Tamanho de Texto**

Crie uma coluna com frases e use `.str.len()` para verificar o tamanho de cada uma (quantidade de caracteres).

