# Bloco 1 - Refer√™ncias vs C√≥pias em Python

**Armadilha Comum**: Refer√™ncias Compartilhadas

In [None]:
a = [1, 2, 3]
b = a  # N√ÉO √© uma c√≥pia! √â uma REFER√äNCIA

print(a, b)

[1, 2, 3] [1, 2, 3]


In [None]:
b[0] = 42

print(a) # [42, 2, 3] - 'a' tamb√©m mudou!

[42, 2, 3]


Conceito fundamental:

- Python atribui REFER√äNCIAS, n√£o c√≥pias

- Ambas vari√°veis apontam para o MESMO objeto na mem√≥ria

- Modificar uma afeta a outra automaticamente

**Solu√ß√£o**: Criar C√≥pia Expl√≠cita

In [None]:
a = [1, 2, 3]
b = a.copy()  # ou b = a[:]
b[0] = 42


print(a)  # [1, 2, 3] - 'a' permanece inalterado

[1, 2, 3]


üí° Relev√¢ncia para Pandas: Mesmo comportamento se aplica a DataFrames!

---

# Bloco 2 - Cria√ß√£o de DataFrame com √çndice Customizado

**Estrutura de Dados Personalizada**

In [6]:
import pandas as pd

df = pd.DataFrame({
    "nome": ["Ana", "Bruno", "Carla"],
    "idade": [23, 35, 29],
    "cidade": ["SP", "RJ", "BH"]
}, index=[10, 11, 12]) # √çndices customizados (n√£o sequenciais)

print(df)

     nome  idade cidade
10    Ana     23     SP
11  Bruno     35     RJ
12  Carla     29     BH


Pontos importantes:

- √çndices customizados: N√£o precisam ser 0, 1, 2...

- Flexibilidade: Podem ser n√∫meros, strings, datas

- Identifica√ß√£o: Cada linha tem um identificador √∫nico

---

# Bloco 3 - Explorando M√©todos Dispon√≠veis

**Introspec√ß√£o de Objetos**

In [None]:
dir(df) # Fun√ß√µes implementadas dentro da classe para utilizar em express√µes

['T',
 '_AXIS_LEN',
 '_AXIS_ORDERS',
 '_AXIS_TO_AXIS_NUMBER',
 '_HANDLED_TYPES',
 '__abs__',
 '__add__',
 '__and__',
 '__annotations__',
 '__array__',
 '__array_priority__',
 '__array_ufunc__',
 '__arrow_c_stream__',
 '__bool__',
 '__class__',
 '__contains__',
 '__copy__',
 '__dataframe__',
 '__dataframe_consortium_standard__',
 '__deepcopy__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__divmod__',
 '__doc__',
 '__eq__',
 '__finalize__',
 '__firstlineno__',
 '__floordiv__',
 '__format__',
 '__ge__',
 '__getattr__',
 '__getattribute__',
 '__getitem__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__iand__',
 '__ifloordiv__',
 '__imod__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__invert__',
 '__ior__',
 '__ipow__',
 '__isub__',
 '__iter__',
 '__itruediv__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__matmul__',
 '__mod__',
 '__module__',
 '__mul__',
 '__ne__',
 '__neg__',
 '__new__',
 '__nonzero__',
 '__or__',
 '__pandas_priority__',
 '__pos__

In [None]:
# Alguns exemplos do que dir() mostra:

['head', 'tail', 'info', 'describe', 'loc', 'iloc', 
 'drop', 'fillna', 'groupby', 'merge', 'sort_values', ...]

üí° Uso pr√°tico: dir() √© como um "manual de instru√ß√µes" do objeto. Essencial para descobrir funcionalidades!

---

# Bloco 4 - Indexa√ß√£o por R√≥tulos com `.loc[]`

**Acesso por Identificadores L√≥gicos**

In [7]:
df.loc[10, "idade"]  # Linha com √≠ndice 10, coluna "idade" (np.int64(23))

np.int64(23)

üí° Vantagem: Modifica√ß√£o precisa usando identificadores sem√¢nticos.

**Modifica√ß√£o de Valores**

In [None]:
df.loc[10, "idade"] = 36
print(df)  # Ana agora tem 36 anos

     nome  idade cidade
10    Ana     36     SP
11  Bruno     35     RJ
12  Carla     29     BH


Caracter√≠sticas do `.loc[]`:

- Baseado em R√ìTULOS: Usa nomes de √≠ndices e colunas

- Inclusivo: Ranges incluem o √∫ltimo elemento

- Leg√≠vel: C√≥digo mais intuitivo e autodocumentado

---

# Bloco 5 - Sele√ß√µes M√∫ltiplas com `.loc[]`

**Subconjuntos Espec√≠ficos**

In [8]:
df.loc[[10, 12], ["nome", "cidade"]]  # Linhas 10 e 12, colunas nome e cidade

Unnamed: 0,nome,cidade
10,Ana,SP
12,Carla,BH


Sintaxe:

- Listas para m√∫ltiplas sele√ß√µes: [[10, 12]] e [["nome", "cidade"]]

- Flexibilidade total: Qualquer combina√ß√£o de linhas/colunas

- Mant√©m estrutura: Retorna DataFrame (n√£o Series)

---

# Bloco 6 - Indexa√ß√£o por Posi√ß√µes com `.iloc[]`

**Acesso por Posi√ß√µes Num√©ricas**

In [None]:
df.iloc[0, 1]   # Primeira linha (posi√ß√£o 0), segunda coluna (posi√ß√£o 1).

np.int64(36)

In [9]:
df.iloc[0, 1] = 24  # Altera primeira linha, segunda coluna

print(df.iloc[0, 1])

24


Caracter√≠sticas do .iloc[]:

- Baseado em POSI√á√ïES: Como arrays Python tradicionais

- Come√ßa em 0: Primeira linha = 0, primeira coluna = 0

- Independe de √≠ndices: Funciona mesmo com √≠ndices customizados

---

# Bloco 8 - Slicing com .iloc[]

**Fatiamento Estilo Python**

In [14]:
df.iloc[0:2, 0:2]

Unnamed: 0,nome,idade
10,Ana,24
11,Bruno,35


Comportamento:

- Exclusivo: 0:2 pega posi√ß√µes 0 e 1 (n√£o inclui 2)

- Familiar: Mesma sintaxe de listas Python

- Previs√≠vel: Independe dos valores dos √≠ndices

---

## Pontos de Aten√ß√£o Importantes

**Diferen√ßas de Slicing**

In [None]:
# Python/iloc: EXCLUSIVO
lista[0:2]     # Elementos 0, 1
df.iloc[0:2]   # Linhas 0, 1

# loc: INCLUSIVO  
df.loc[10:12]  # √çndices 10, 11, 12 (todos inclu√≠dos!)

**Refer√™ncias vs C√≥pias**

In [None]:
# Cria refer√™ncia (perigoso)
subset = df.loc[10:11]
subset.iloc[0, 1] = 999  # Pode alterar df original!

# Cria c√≥pia (seguro)
subset = df.loc[10:11].copy()
subset.iloc[0, 1] = 999  # df original inalterado

**Consist√™ncia na Escolha:**

- Seja consistente: Escolha .loc[] OU .iloc[] por projeto

- Documente a escolha: Facilita manuten√ß√£o da equipe

- Considere o contexto: Dados temporais ‚Üí .loc[], ML ‚Üí .iloc[]