## 🎓 **Aula sobre: Pandas Series**

<br>

### 🧭 Sumário da Aula

| # | Sub-tópico                       | Tempo Estimado | Complexidade |
|---|----------------------------------|----------------|--------------|
| 1 | Ficha de Revisão Rápida          | ~1 min         | ⭐           |
| 2 | Mergulho Profundo                | ~15 min        | ⭐⭐⭐⭐       |
| 3 | Profundezas e Conexões           | ~3 min         | ⭐⭐         |
| 4 | 🚀 Ação e Verificação             | ~5 min         | ⭐⭐         |
| 5 | 🌊 Mergulhos Adicionais Opcionais | Opcional      | ⭐⭐⭐⭐      |

<br>

---
<br>


### 1. 🧠 Ficha de Revisão Rápida | (O Essencial)

<br>

> - **Series:** estrutura unidimensional rotulada.  
> - **Index:** rótulos que identificam cada elemento.  
> - **Values:** array NumPy interno de dados.  
> - **Alinhamento automático:** operações entre Series alinham pelos índices.  
> - **Métodos vetorizados:** `.head()`, `.tail()`, `.describe()`.

<br>


### 2. 🔬 Mergulho Profundo | (Os Detalhes)

<br>

#### **🎯 O Conceito Central**  
Uma **Series** combina um array de valores e um *index* de rótulos. Cada operação vetorizada percorre o array em C, respeitando o index: se dois índices não baterem, o resultado vira `NaN`.

<br>

#### **🔗 Analogia de Data Science**  
Pense em uma lista de contatos:  
- O *index* é o nome de cada contato.  
- Os *values* são os números de telefone.  
- Somar duas listas de contatos combinaria os nomes, atribuindo números ausentes como `NaN`.

<br>


### **💻 Exemplos de Mercado (Abrangentes)**


#### **Nível Simples: Criando e Explorando uma Series**


In [None]:
import pandas as pd
# Criando Series de temperaturas diárias
temps = pd.Series([22, 24, 19, 23], index=['Seg','Ter','Qua','Qui'])
print(temps)
print(temps.head(2))
print(temps.describe())


In [None]:
# Pratique seu código aqui!

import pandas as pd

temps = pd.Series([22, 24, 19, 23], index=['Seg', 'Ter', 'Qua', 'Qui'])
print(temps)
print("\n")
print(temps.head(2))
print("\n")
print(temps.describe())

Seg    22
Ter    24
Qua    19
Qui    23
dtype: int64


Seg    22
Ter    24
dtype: int64


count     4.000000
mean     22.000000
std       2.160247
min      19.000000
25%      21.250000
50%      22.500000
75%      23.250000
max      24.000000
dtype: float64


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Importe pandas como pd.”  
  import pandas as pd

  # “Crie uma Series de temperaturas com rótulos de dias.”  
  temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])

  # “Mostre a Series completa.”  
  print(temps)

  # “Veja as 2 primeiras entradas.”  
  print(temps.head(2))

  # “Obtenha estatísticas básicas.”  
  print(temps.describe())
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo         | Expressão        | Saída                                  | O que é?                              |
  |:-------------:|:-----------------|:---------------------------------------|:--------------------------------------|
  | 1             | `temps`          | Seg 22; Ter 24; Qua 19; Qui 23         | Series com index de dias e valores    |
  | 2             | `temps.head(2)`  | Seg 22; Ter 24                         | Subserie das 2 primeiras entradas     |
  | 3             | `temps.describe()`| count, mean, std, min, max, quartis   | Estatísticas descritivas vetorizadas  |
  | 4             | –                | imprime                                | Saída final                           |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  Imagine uma tabela telefônica: coluna de nomes (index) e coluna de números (values). `head()` vê os dois primeiros contatos; `describe()` resume quantos contatos, média de número (imagine estatísticas sobre números).

* **Cenário de Mercado:**  
  - **O que são “features” no cenário de Series?** São atributos de uma única variável, como temperatura ao longo dos dias.  
  - **Por que usar `describe()`?** Em análise de qualidade do ar, obter rápido resumo (média, desvios) ajuda a detectar picos de poluição.  

* **Boas Práticas:**  
  - **Afirmação:** “Sempre defina índices significativos.”  
    - **Porquê:** Facilita filtragem, união e plotagem.  
    - **Analogia:** É como rotular as prateleiras de um estoque para encontrar produtos rápido.


#### **Nível Intermediário: Seleção e Filtragem por Rótulo**


In [None]:
import pandas as pd
temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])
# acesso por label
print(temps['Qua'])
# acesso por slice de labels (inclusive fim)
print(temps['Ter':'Qui'])
# condição booleana
print(temps[temps > 21])


In [None]:
# Pratique seu código aqui!

import pandas as pd
temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])
print(temps)
print("\n")
print(temps['Qua'])
print("\n")
print(temps['Ter':'Qui'])
print("\n")
print(temps[temps > 21])

Seg    22
Ter    24
Qua    19
Qui    23
dtype: int64


19


Ter    24
Qua    19
Qui    23
dtype: int64


Seg    22
Ter    24
Qui    23
dtype: int64


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Recrie a Series de temperaturas.”  
  temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])

  # “Pegue temperatura de Quarta.”  
  print(temps['Qua'])

  # “Recorte de Terça a Quinta.”  
  print(temps['Ter':'Qui'])

  # “Filtre dias com temp >21.”  
  print(temps[temps > 21])
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo            | Expressão          | Saída                  | O que faz?                     |
  |:----------------:|:-------------------|:-----------------------|:-------------------------------|
  | 1                | `temps['Qua']`     | `19`                   | Seleção label-based            |
  | 2                | `temps['Ter':'Qui']`| Ter 24; Qua 19; Qui 23| Slice por labels incluído      |
  | 3                | `temps[temps>21]`  | Seg 22; Ter 24; Qui 23 | Filtragem condicional          |
  | 4                | –                  | imprime                | Saída final                    |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  Label access é como buscar um livro por título; slice de labels é pegar todos os livros entre dois títulos; filtragem é selecionar só livros com mais de 300 páginas.

* **Cenário de Mercado:**  
  Em **monitoramento de sensores**, filtrar `readings[readings > threshold]` encontra só leituras anômalas.  

* **Boas Práticas:**  
  - **Afirmação:** “Use slice label para fatiar inclusive o fim.”  
    - **Porquê:** Ao contrário do Python puro, Pandas inclui o rótulo final.  
    - **Analogia:** É como contar de 1 a 10 incluindo o 10.


#### **Nível Avançado: Operações e Alinhamento Automático**


In [None]:
import pandas as pd
s1 = pd.Series([1,2,3], index=['A','B','C'])
s2 = pd.Series([4,5,6], index=['B','C','D'])
print(s1 + s2)


In [None]:
# Pratique seu código aqui!

import pandas as pd

s1 = pd.Series([1, 2, 3], index=['A', 'B', 'C'])
s2 = pd.Series([4, 5, 6], index=['B', 'C', 'D'])

print(s1)
print("\n")
print(s2)
print("\n")
print(s1 + s2)


A    1
B    2
C    3
dtype: int64


B    4
C    5
D    6
dtype: int64


A    NaN
B    6.0
C    8.0
D    NaN
dtype: float64


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Crie Series s1 e s2 com índices deslocados.”  
  s1 = pd.Series([1,2,3], index=['A','B','C'])
  s2 = pd.Series([4,5,6], index=['B','C','D'])

  # “Some s1 e s2 alinhando índices.”  
  print(s1 + s2)
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo      | Expressão  | Saída                  | O que faz?                       |
  |:----------:|:-----------|:-----------------------|:---------------------------------|
  | 1          | `s1`       | A:1; B:2; C:3          | Primeira Series                  |
  | 2          | `s2`       | B:4; C:5; D:6          | Segunda Series                   |
  | 3          | `s1 + s2`  | A:NaN; B:6; C:8; D:NaN | Soma com alinhamento automático  |
  | 4          | –          | imprime                | Saída final                      |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  Imagine duas listas de contatos com alguns nomes em comum; ao mesclar chamadas, só números cadastrados em ambos somam, os demais ficam em branco.

* **Cenário de Mercado:**  
  Em **combinação de bases**, ao somar vendas semanais de duas filiais, índices sem correspondência viram `NaN`, indicando falta de dados.

* **Boas Práticas:**  
  - **Afirmação:** “Trate `NaN` após operações.”  
    - **Porquê:** Evita propagação de valores faltantes em análise.  
    - **Analogia:** É como marcar ausentes em lista de presença antes de calcular média de frequência.


#### **Nível DEUS (1/3): Uso de `apply` e `map` para Transformações**


In [None]:
import pandas as pd
temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])
fahrenheit = temps.apply(lambda x: x * 9/5 + 32)
names_upper = temps.index.map(str.upper)
print(fahrenheit)
print(names_upper)


In [None]:
# Pratique seu código aqui!

import pandas as pd

temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])
fahrenheit = temps.apply(lambda x: x * 9/5 + 32)
names_upper = temps.index.map(str.upper)
print(fahrenheit)
print("\n")
print(names_upper)


Seg    71.6
Ter    75.2
Qua    66.2
Qui    73.4
dtype: float64


Index(['SEG', 'TER', 'QUA', 'QUI'], dtype='object')


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Reúna Series de temperaturas.”  
  temps = pd.Series([22,24,19,23], index=['Seg','Ter','Qua','Qui'])

  # “Converta para Fahrenheit com apply.”  
  fahrenheit = temps.apply(lambda x: x*9/5+32)

  # “Transforme rótulos para maiúsculas com map.”  
  names_upper = temps.index.map(str.upper)

  # “Mostre Series transformadas.”  
  print(fahrenheit)
  print(names_upper)
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo       | Expressão       | Saída                         | O que faz?                             |
  |:-----------:|:----------------|:------------------------------|:---------------------------------------|
  | 1           | `fahrenheit`    | Series em F                   | Conversão de unidades via apply        |
  | 2           | `names_upper`   | Index(['SEG','TER',...])      | Alteração de rótulos via map           |
  | 3           | –               | imprime                       | Saída final                            |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  `apply` é como aplicar uma resina a cada peça; `map` renomeia etiquetas em massa.

* **Cenário de Mercado:**  
  Em **normalização de dados**, aplicamos transformações (log, escala) em colunas de DataFrame via `apply`.

* **Boas Práticas:**  
  - **Afirmação:** “Prefira métodos vetorizados a apply quando possível.”  
    - **Porquê:** Métodos built-in são mais rápidos que lambdas Python.  
    - **Analogia:** Usar máquina industrial em vez de manual.


#### **Nível DEUS (2/3): Operações com Strings (`.str`)**


In [None]:
import pandas as pd
names = pd.Series(['Ana Silva','Bruno Costa','Carla Lima'])
last_names = names.str.split().str[1]
upper = names.str.upper()
print(last_names)
print(upper)


In [None]:
# Pratique seu código aqui!
import pandas as pd

names = pd.Series(['Ana Silva','Bruno Costa','Carla Lima'])
last_names = names.str.split().str[1]
upper = names.str.upper()
print(last_names)
print("\n")
print(upper)

0    Silva
1    Costa
2     Lima
dtype: object


0      ANA SILVA
1    BRUNO COSTA
2     CARLA LIMA
dtype: object


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Crie Series de nomes completos.”  
  names = pd.Series(['Ana Silva','Bruno Costa','Carla Lima'])

  # “Separe último nome.”  
  last_names = names.str.split().str[1]

  # “Converta todos para maiúsculas.”  
  upper = names.str.upper()

  # “Mostre resultados.”  
  print(last_names)
  print(upper)
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo      | Expressão                 | Saída                      | O que faz?                           |
  |:----------:|:--------------------------|:---------------------------|:-------------------------------------|
  | 1          | `last_names`              | Series de sobrenomes       | Extração via `.str.split()` e index  |
  | 2          | `upper`                   | Series em MAIÚSCULAS       | Transformação via `.str.upper()`     |
  | 3          | –                         | imprime                    | Saída final                          |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  O atributo `.str` é uma oficina de palavras: fatiamento, caso e substituições em massa.

* **Cenário de Mercado:**  
  Em **limpeza de dados**, padronizamos nomes de clientes antes de análises ou merges.

* **Boas Práticas:**  
  - **Afirmação:** “Use métodos `.str` em vez de Python puro.”  
    - **Porquê:** Opera em C e evita loops.  
    - **Analogia:** É como usar trituradora industrial de texto.


#### **Nível DEUS (3/3): Séries Temporais e Indexação por Datas**


In [None]:
import pandas as pd
rng = pd.date_range('2021-01-01', periods=5, freq='D')
ts = pd.Series([10,12,11,13,15], index=rng)
print(ts['2021-01-02':'2021-01-04'])


In [None]:
# Pratique seu código aqui!

import pandas as pd
rng = pd.date_range('2021-01-01', periods=5, freq='D')
ts = pd.Series([10, 12, 11, 13, 15], index=rng)

print(rng)
print("\n")
print(ts)
print("\n")
print(ts['2021-01-02':'2021-01-04'])



DatetimeIndex(['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04',
               '2021-01-05'],
              dtype='datetime64[ns]', freq='D')


2021-01-01    10
2021-01-02    12
2021-01-03    11
2021-01-04    13
2021-01-05    15
Freq: D, dtype: int64


2021-01-02    12
2021-01-03    11
2021-01-04    13
Freq: D, dtype: int64


* **O que o código faz:**  

  **1) Explicação Linha a Linha (Diálogo com o Código):**  
  ```python
  # “Crie index de datas diárias.”  
  rng = pd.date_range('2021-01-01', periods=5, freq='D')

  # “Crie Series com datas como index.”  
  ts = pd.Series([10,12,11,13,15], index=rng)

  # “Fatie de 2 a 4 Jan/2021.”  
  print(ts['2021-01-02':'2021-01-04'])
  ```

  **2) Tabela de Estados Intermediários:**

  ```markdown
  | Passo      | Expressão                       | Saída                      | O que faz?                         |
  |:----------:|:--------------------------------|:---------------------------|:-----------------------------------|
  | 1          | `ts`                            | Série datada 2021-01-01…01-05 | Série temporal                   |
  | 2          | `ts['2021-01-02':'2021-01-04']` | 2021-01-02 a 2021-01-04     | Slice por datas                   |
  | 3          | –                               | imprime                    | Saída final                        |
  ```

  **3) Diagrama Mental (A Analogia Central):**  
  Date slicing é como selecionar capítulos de um diário digital entre duas datas.

* **Cenário de Mercado:**  
  Em **finanças**, fatiar cotações por data gera séries de retornos para cálculo de indicadores.

* **Boas Práticas:**  
  - **Afirmação:** “Garanta índice datetime ao trabalhar com tempo.”  
    - **Porquê:** Desbloqueia resample, rolling e fatiamento intuitivo.  
    - **Analogia:** É como usar calendário em vez de números aleatórios para marcar compromissos.


### 3. 🕸️ Profundezas e Conexões

<br>

Pandas Series alimentam DataFrames e são base para **scikit-learn**, **statsmodels** e bibliotecas de visualização. Dominar Series é essencial para manipular colunas isoladas em ETL.

<br>

---
<br>


### 4. 🚀 Ação e Verificação

<br>

#### **🤔 Desafio Prático**
1. Crie uma Series de vendas semanais com 7 valores e labels “Seg” a “Dom”.  
2. Filtre dias com vendas ≥ média.  
3. Some duas Series de lucro e despesa com índices diferentes.  
4. Use `apply` para arredondar valores de uma Series de floats.  
5. Gere Series datada e fatie o período de meio.

<br>

#### **❓ Pergunta de Verificação**
Como o alinhamento automático afeta operações entre Series com índices distintos?

<br>

---

<br>
