# 0. Setup: Creando un DataFrame con "Personalidad"

Ejecuta esto primero. Vamos a usar un índice de texto (IDs de empleados) para que sea imposible confundir una etiqueta con un número.

In [2]:
import pandas as pd

data = {
    'nombre': ['Ana', 'Beto', 'Carla', 'Daniel', 'Elena'],
    'departamento': ['Ventas', 'IT', 'Ventas', 'HR', 'IT'],
    'salario': [2500, 4500, 2800, 3000, 4200],
    'ciudad': ['Bogotá', 'Medellín', 'Bogotá', 'Cali', 'Medellín']
}

# Creamos el DataFrame y definimos los IDs como el índice INMEDIATAMENTE
ids = ['EMP01', 'EMP02', 'EMP03', 'EMP04', 'EMP05']
df_data=pd.DataFrame(data, index=ids)

print("--- DATAFRAME ORIGINAL (Con Índice Personalizado) ---")
print(df_data)

--- DATAFRAME ORIGINAL (Con Índice Personalizado) ---
       nombre departamento  salario    ciudad
EMP01     Ana       Ventas     2500    Bogotá
EMP02    Beto           IT     4500  Medellín
EMP03   Carla       Ventas     2800    Bogotá
EMP04  Daniel           HR     3000      Cali
EMP05   Elena           IT     4200  Medellín


# Ejemplo 1: El Duelo (Buscar un solo dato)

Teoría: loc busca por el nombre de la etiqueta (Label). iloc busca por la posición física (Integer), empezando en 0.

Queremos saber el Salario de Carla (que es la tercera persona, ID 'EMP03').

In [3]:
print("---BUSCANDO EL SALARIO DE CARLA---")

#MÉTODO 1: LOC(Humano)
#" Busca la fila llamada 'EMP03' y la columna llamada 'salario' "
salario_loc=df_data.loc['EMP03','salario']
print(f"Con LOC: {salario_loc}")

#MÉTODO 2: ILOC(Robot)
# "Busca la fila en posición 2(0,1,2) y la columna en posicion 2(0,1,2)"
# Nota: 'salario' es la tercera columna, así que su índice es 2.
salario_iloc = df_data.iloc[2, 2]
print(f"Con iloc: {salario_iloc}")

---BUSCANDO EL SALARIO DE CARLA---
Con LOC: 2800
Con iloc: 2800


Reflexión: Si mañana ordenas el DataFrame por salario, EMP03 seguirá siendo Carla (loc funciona), pero la posición 2 podría ser cualquiera (iloc cambia). Por eso loc es más seguro para análisis.

# Ejemplo 2: El Misterio del Rango (Slicing)

Teoría: Aquí está la trampa mortal.

    loc['A':'C'] INCLUYE a C.

    iloc[0:2] EXCLUYE al 2.

In [4]:
print("----CORTANDO EL DATAFRAME (SLICING)----")

#Misión: Queremos las filas desde 'EMP02' hasta 'EMP04'

print("\n1. Usando LOC(Inclusivo):")
# Le pido de la 02 a la 04, y me da exactamente eso(3 filas)
print(df_data.loc['EMP02':'EMP04', ['nombre', 'ciudad']])

print("\n2. Usando ILOC(Exclusivo - Estándar Python):")
# La Fila 'EMP02' es la posición 1. La 'EMP04' es la posición 3
# Si hago 1:3, Python se detiene ANTES del 3
print(df_data.iloc[1:3, [0, 3]]) # Solo me dará EMP02 y EMP03. ¡Falta una!

print("\n3. Correción en ILOC:")
# Para tener las mismas 3 filas, debo pedir hasta la 4
print(df_data.iloc[1:4,[0,3]])

----CORTANDO EL DATAFRAME (SLICING)----

1. Usando LOC(Inclusivo):
       nombre    ciudad
EMP02    Beto  Medellín
EMP03   Carla    Bogotá
EMP04  Daniel      Cali

2. Usando ILOC(Exclusivo - Estándar Python):
      nombre    ciudad
EMP02   Beto  Medellín
EMP03  Carla    Bogotá

3. Correción en ILOC:
       nombre    ciudad
EMP02    Beto  Medellín
EMP03   Carla    Bogotá
EMP04  Daniel      Cali


# Ejemplo 3: El Francotirador (.at vs .iat)

Teoría: Si solo quieres un valor (no una tabla, sino un dato suelto) y quieres velocidad extrema, usa estos.

In [5]:
print("---- VELOCIDAD PURA (ESCALERAS)---")
# Recuperar ciudad de Daniel (EMP04)
# .at es el hermano rápido de .loc
ciudad=df_data.at['EMP04','ciudad']

#.iat es el hermano rápido de .iloc(Daniel es fila posición 3, Ciudad es la columna posición 3)
ciudad_fast = df_data.iat[3,3]

print(f"Daniel vive en: {ciudad}")


---- VELOCIDAD PURA (ESCALERAS)---
Daniel vive en: Cali


Nota: Úsalo cuando tengas que buscar millones de valores individuales en un bucle (aunque intenta evitar los bucles)

# Ejemplo 4: Modificación Segura (Evitando el Warning)

Teoría: Nunca modifiques datos encadenando corchetes df['col'][0] = x. Siempre usa loc.

Situación: Elena se mudó a 'Cartagena'. Vamos a actualizar su dato.

In [6]:
print("--- MODIFICANDO DATOS----")

# FORMA INCORRECTA (Encadenamiento)
# Esto a menudo lanza "SettingWithCopyWarning" y a veces NO guarda el cambio.
# df_data['ciudad']['EMP05'] = 'Cartagena' <--- ¡NO HAGAS ESTO!

# FORMA CORRECTA (Usando loc)
# "Ve a la intersección exacta de EMP05 y ciudad, y escribe Cartagena"
df_data.loc['EMP05', 'ciudad'] = 'Cartagena'

print("Dato actualizado correctamente:")
print(df_data.loc['EMP05'])

--- MODIFICANDO DATOS----
Dato actualizado correctamente:
nombre              Elena
departamento           IT
salario              4200
ciudad          Cartagena
Name: EMP05, dtype: object
