# El Concepto de "Alineación Intrínseca"
Teoría: Pandas no suma por posición (1º con 1º), suma por Etiqueta (Índice).

In [21]:
#Importar librerias 
import pandas as pd
import numpy as np

In [22]:
#Ventas de enero (Orden: Manzana, Pera)
ventas_enero=pd.Series([10,20],index=['Manzana','Pera'])

## Ventas de Febrero (Orden: Pera, Manzana - ¡Invertido!)
# Fíjate que añadimos 'Uva', que no estaba en Enero
ventas_feberero=pd.Series([30,50,5],index=['Pera','Manzana','Uva'])

In [23]:
print("--- Enero ---")
print(ventas_enero)
print("\n--- Febrero ---")
print(ventas_feberero)

--- Enero ---
Manzana    10
Pera       20
dtype: int64

--- Febrero ---
Pera       30
Manzana    50
Uva         5
dtype: int64


In [24]:
# LA MAGIA: Sumamos las series
# Pandas busca "Manzana" en ambos lados y las suma, sin importar el orden.
# Como 'Uva' no existe en Enero, el resultado será NaN (Not a Number).
total = ventas_enero + ventas_feberero

print("\n--- Total (Alineado por Índice) ---")
print(total)


--- Total (Alineado por Índice) ---
Manzana    60.0
Pera       50.0
Uva         NaN
dtype: float64


## Broadcasting (Difusión)

Teoría: Aplicar una operación escalar a toda la estructura sin bucles for.

In [None]:
#Tenemos precios en Dólares
precios_usd=pd.Series([10,20,30],index=['Juego A','Juego B','Juego C'])

# Queremos convertir a Pesos (Tasa: 3677)
# No usamos bucle. Multiplicamos la Serie entera.
precios_cop=precios_usd*3677

print("--- Precios convertidos (Broadcasting) ---")
print(precios_cop)

--- Precios convertidos (Broadcasting) ---
Juego A     36770
Juego B     73540
Juego C    110310
dtype: int64


## Estadísticas y Agregación (.value_counts)
Teoría: Métodos para entender la distribución de datos categóricos.

In [26]:
# Una serie con datos repetidos (Categorías)
encuesta=pd.Series(['Si','No','Si','Tal Vez','No'])

# .value_counts() cuenta la frecuencia automáticamente
conteo=encuesta.value_counts()

print("--- Frecuencia de Respuestas ---")
print(conteo)

#.describe() da un resumen diferente porque son textos(objetos)
print("\n--- Resumen Estadístico ---")
print(encuesta.describe())

--- Frecuencia de Respuestas ---
Si         2
No         2
Tal Vez    1
Name: count, dtype: int64

--- Resumen Estadístico ---
count      5
unique     3
top       Si
freq       2
dtype: object


## Gestión de Integridad (Nulos)

Teoría: Detectar y manejar huecos (NaN) usando .isna() y .fillna().

In [27]:
#Creamos una serie con hueco(np.nan)
temperaturas = pd.Series([25,28,np.nan,30,24],index=['Lun', 'Mar', 'Mie', 'Jue', 'Vie'])

print("--- Serie con Nulos ---")
print(temperaturas)

#1. Detectar:¿Quien es nulo? (Máscara Booleana)
print("\n--- ¿Es nulo? (.isna) ---")
print(temperaturas.isna())

#2. Imputar: Rellenar el huevo con el promedio de los otros días
promedio=temperaturas.mean()
temp_corregida=temperaturas.fillna(promedio)

print(f"\n--- Serie Corregida (Relleno con media: {promedio}) ---")
print(temp_corregida)

--- Serie con Nulos ---
Lun    25.0
Mar    28.0
Mie     NaN
Jue    30.0
Vie    24.0
dtype: float64

--- ¿Es nulo? (.isna) ---
Lun    False
Mar    False
Mie     True
Jue    False
Vie    False
dtype: bool

--- Serie Corregida (Relleno con media: 26.75) ---
Lun    25.00
Mar    28.00
Mie    26.75
Jue    30.00
Vie    24.00
dtype: float64


## Transformación (.apply)

Teoría: Proyectar una función personalizada sobre cada elemento.

In [28]:
#Definimos una función personalizada en Python
def clasificar_clima(grados):
    if grados >=28:
        return "Calor"
    else:
        return "Fresco"

#Aplicamos esa función a cada datos de la serie
estado_clima=temp_corregida.apply(clasificar_clima)

print("--- Transformación con .apply() ---")
print(estado_clima)

--- Transformación con .apply() ---
Lun    Fresco
Mar     Calor
Mie    Fresco
Jue     Calor
Vie    Fresco
dtype: str
