
# Introducción básica a Python y Pandas

En este cuaderno repasaremos:
- Tipos y estructuras básicas de Python (listas)
- Control de flujo (`for`, `if/else`)
- Funciones
- Introducción a **pandas** usando el dataset **Iris**
  - Cargar en un `DataFrame`
  - Seleccionar columnas y filas
  - Crear columnas nuevas a partir de operaciones
  - `groupby` para agregaciones
  - `map` y `apply` con `lambda`


## 1. Python básico: listas

In [None]:
# Crear una lista


In [None]:
# Acceso por índice

In [None]:
print("Últimos dos elementos:", numeros[-2:])

In [None]:
# Métodos útiles
numeros.append(2)           # añadir al final
numeros.insert(1, 7)       # insertar en posición 1
numeros.remove(1)          # elimina la primera aparición de 1
print("Lista tras operaciones:", numeros)

In [None]:
# Ordenar (.sort()) --> observa

In [None]:
# Nueva lista ordenada, sin modificar la original (sorted())

## 2. Control de flujo: `for`, `if/else`

In [None]:
# Haz una lista de palabras


In [None]:
# Crea una lista nueva con el numero de letras de las palabras


In [None]:

# Sumar solo los pares usando for + if
numeros = [3, 1, 4, 1, 5, 9, 2, 6]
suma_pares = 0
for n in numeros:
    if n % 2 == 0:
        suma_pares += n
print("Suma de pares:", suma_pares)

# List comprehension (azúcar sintáctico)
pares = [n for n in numeros if n % 2 == 0]
print("Pares:", pares)

## 3. Funciones

In [None]:
# Crea una funcion que dados dos números te devuelve la suma



In [None]:
# Funcion del area de un rectangulo
def area_rectangulo(base, altura):
    """Devuelve el área de un rectángulo."""
    return base * altura

print("Área 3x5:", area_rectangulo(3, 5))

# Función con valor por defecto y tipo simple
def saludo(nombre, mayusculas=False):
    texto = f"Hola, {nombre}"
    return texto.upper() if mayusculas else texto

print(saludo("Ana"))
print(saludo("Ana", mayusculas=True))


In [None]:
# Haz una función que de dos números te devuelva el más mayor


#### Ejercicio: haz una funcion para el juego de piedra, papel y tijeras

## 4. Introducción a pandas con el dataset Iris

In [None]:
import pandas as pd

In [None]:
# Cargar dataset Iris desde scikit-learn (sin descargas externas)
from sklearn.datasets import load_iris
iris = load_iris(as_frame=True)
iris

In [None]:
df = iris.frame  # incluye características + target
df.head()

In [None]:
df.rename(columns={
    "sepal length (cm)": "sepal_length",
    "sepal width (cm)": "sepal_width",
    "petal length (cm)": "petal_length",
    "petal width (cm)": "petal_width",
    "target": "species_id",
}, inplace=True)

In [None]:
# Mapear id a etiqueta de especie
species_map = {i: name for i, name in enumerate(iris.target_names)}
df["species"] = df["species_id"].map(species_map)

df.head()

In [None]:
# MAPEA DE OTRA MANERA


### 4.1 Seleccionar columnas y filas

In [None]:
# Haz un nuevo dataframe con solo las dos columnas de petal



### 4.2 Crear una columna nueva

In [None]:
# Ejemplo: área aproximada del pétalo (producto simple)




### 4.3 Agrupar con `groupby`

In [None]:

# Media de medidas por especie
mean_by_species = (
    df.groupby("species")[["sepal_length", "sepal_width", "petal_length", "petal_width", "petal_area"]]
      .mean()
      .round(2)
)
mean_by_species


### 4.4 `map` y `apply` con `lambda`

In [None]:

# map: transformar valores de una serie
genero_simple = {"setosa": "A", "versicolor": "B", "virginica": "C"}
df["species_code"] = df["species"].map(genero_simple)
df[["species", "species_code"]].head()


In [None]:
# Quedate solo con las dos primeras letras de la especie, usando apply lambda

In [None]:
# Vamos a categorizar la longitud del sepalo: 
# si es menor que 5cm es corto, si es mayor que 6.5 es largo, entremedias es normal
# apply lambda lo que hace es aplicar una funcion a toda una columna
df["sepal_category"] = df["sepal_length"].apply(
    lambda x: "corto" if x < 5 else ("medio" if x < 6.5 else "largo")
)

In [None]:

# apply con lambda a filas: crear etiqueta simple
def clasificar_petal(row):
    return "petalo_grande" if row["petal_area"] >= df["petal_area"].median() else "petalo_pequeño"

df["petal_size"] = df.apply(lamclasificar_petal, axis=1)
df[["petal_area", "petal_size", "species"]].head()



## 5. Ejercicios propuestos (opcionales)

1. Dada la lista `valores = [5, 7, 2, 8, 3, 4]`, crea otra lista con los **cuadrados** de los números **impares** usando list comprehension.
2. Escribe una función `es_primo(n)` que devuelva `True` si `n` es primo y `False` en caso contrario.
3. En el `DataFrame` `df`, crea una columna `sepal_ratio` = `sepal_length / sepal_width` y muestra las 5 primeras filas.
4. Calcula, con `groupby`, la **desviación estándar** de `petal_length` por `species`.
5. Usa `apply` para crear una columna `alerta` que valga `"OK"` si `sepal_length` < 6.0 y `"LARGO"` en caso contrario.
