# 🧠 Introducción al uso de `selectExpr` en PySpark

La función `selectExpr()` de PySpark te permite escribir expresiones SQL dentro de un DataFrame de forma rápida y concisa.  
Es una forma poderosa de aplicar funciones, operaciones matemáticas, condiciones y alias **en una sola línea**, como si estuvieras escribiendo en SQL.

---

### ✅ Ventajas de `selectExpr`
- Más expresivo que `.select()` con `.alias()`.
- Permite aplicar múltiples transformaciones directamente.
- Ideal para operaciones simples de derivación de columnas.

---

### 🧪 Ejemplo básico


```python
df.selectExpr("first_name", "upper(last_name) as last_upper", "concat(first_name, ' ', last_name) as full_name")
```

In [0]:
# Leer tabla del catálogo
df_customers = spark.table("samples.bakehouse.sales_customers")

# Aplicar selectExpr
df_customers_expr = df_customers.selectExpr(
    "customerID",
    "first_name",
    "last_name",
    "concat(first_name, ' ', last_name) as full_name",
    "upper(gender) as gender_upper",
    "length(email_address) as email_length"
)

# Mostrar resultado
df_customers_expr.show(5, truncate=False)

## ✍️ Ejercicio — Usando `selectExpr` con transacciones

Trabajá sobre la tabla `samples.bakehouse.sales_transactions` y realizá las siguientes transformaciones usando `selectExpr`:

1. Mostrar `transactionID`, `product`, `quantity`, `unitPrice`, `totalPrice`.
2. Crear una columna llamada `subtotal` calculada como `quantity * unitPrice`.
3. Crear una columna llamada `es_gran_compra` que indique `"SI"` si `totalPrice > 100`, o `"NO"` en caso contrario.
4. Mostrar una nueva columna `metodo_pago_mayus` con el método de pago en mayúsculas.
5. Agregar un alias a cada nueva columna.

📤 Entregá un notebook `.ipynb` o script `.py` que muestre los resultados con `.show()`.

In [0]:
# Escribe aqui tu codigo