# **Clase Práctica: Diccionarios, Funciones y Manejo de Datos en Python**

En esta clase, exploraremos conceptos fundamentales de Python mediante ejercicios prácticos. Trabajaremos con diccionarios, crearemos funciones personalizadas, utilizaremos funciones integradas como `count` y `sum`, y aprenderemos a manejar valores duplicados y ausentes.

---

## **1. Diccionarios**

### **Descripción:**
Un diccionario es una estructura de datos que almacena pares clave-valor. Se utiliza para acceder rápidamente a datos utilizando una clave.

### **Ejercicio 1: Creación y Acceso a Diccionarios**
1. Crea un diccionario llamado `estudiantes` que contenga los nombres de los estudiantes como claves y sus calificaciones como valores.
2. Accede a la calificación de un estudiante específico.
3. Añade un nuevo estudiante al diccionario.

In [25]:
# Crear el diccionario
estudiantes = {
    "Juan": 85,
    "Ana": 92,
    "Luis": 78
}

# Accede a la calificación de "Ana"
print("Calificación de Ana:", estudiantes["Ana"])

# Añade un nuevo estudiante
estudiantes["Carla"] = 88
print("Diccionario actualizado:", estudiantes)


Calificación de Ana: 92
Diccionario actualizado: {'Juan': 85, 'Ana': 92, 'Luis': 78, 'Carla': 88}


### **Ejercicio 2: Iterar sobre Diccionarios**
1. Itera sobre las claves del diccionario.
2. Itera sobre los valores del diccionario.
3. Calcula el promedio de las calificaciones.

In [26]:
# Iterar sobre las claves
for estudiante in estudiantes.keys():
    print("Estudiante:", estudiante)

# Iterar sobre los valores
for calificacion in estudiantes.values():
    print("Calificación:", calificacion)

# Calcular el promedio
promedio = sum(estudiantes.values()) / len(estudiantes)
print("Promedio de calificaciones:", promedio)

Estudiante: Juan
Estudiante: Ana
Estudiante: Luis
Estudiante: Carla
Calificación: 85
Calificación: 92
Calificación: 78
Calificación: 88
Promedio de calificaciones: 85.75


### **Ejercicio 3: Buscar y Eliminar Elementos**
1. Comprueba si "Luis" está en el diccionario.
2. Elimina a "Luis" del diccionario.
3. Limpia el diccionario por completo.

In [27]:
# Comprobar si "Luis" está en el diccionario
if "Luis" in estudiantes:
    print("Luis está en el diccionario.")

# Eliminar a "Luis"
estudiantes.pop("Luis", None)
print("Diccionario después de eliminar a Luis:", estudiantes)

# Limpiar el diccionario
estudiantes.clear()
print("Diccionario vacío:", estudiantes)

Luis está en el diccionario.
Diccionario después de eliminar a Luis: {'Juan': 85, 'Ana': 92, 'Carla': 88}
Diccionario vacío: {}


---

## **2. Funciones**
### **Descripción:**
Las funciones son bloques de código reutilizables que realizan una tarea específica. Se definen con la palabra clave def.

### **Ejercicio 1: Crear una Función**
1. Escribe una función llamada calcular_area que calcule el área de un rectángulo.
2. Prueba la función con diferentes valores.

In [28]:
def calcular_area(base, altura):
    return base * altura

# Prueba la función
print("Área del rectángulo:", calcular_area(5, 10))


Área del rectángulo: 50


### **Ejercicio 2: Función con Argumentos Predeterminados**
1. Crea una función saludar que tenga un argumento predeterminado nombre = "invitado".
2. Llama a la función con y sin un argumento.

In [29]:
def saludar(nombre="invitado"):
    return f"Hola, {nombre}!"

# Prueba la función
print(saludar())
print(saludar("Ana"))


Hola, invitado!
Hola, Ana!


### **Ejercicio 3: Función con Parámetros Variables**
1. Define una función suma_todos que acepte cualquier cantidad de números y devuelva su suma.
2. Prueba la función con diferentes números de argumentos.

In [30]:
def suma_todos(*numeros):
    return sum(numeros)

# Prueba la función
print("Suma de 1, 2 y 3:", suma_todos(1, 2, 3))
print("Suma de 5, 10, 15 y 20:", suma_todos(5, 10, 15, 20))


Suma de 1, 2 y 3: 6
Suma de 5, 10, 15 y 20: 50


---

## **3. Funciones Integradas: count y sum**
### **Descripción:**
Python tiene funciones integradas como count (para contar ocurrencias) y sum (para sumar valores).

### **Ejercicio 1: Contar Ocurrencias**
1. Dado un string, usa count para contar cuántas veces aparece un carácter específico.
2. Aplica count a una lista.

In [31]:
texto = "banana"
print("Ocurrencias de 'a':", texto.count('a'))

numeros = [1, 2, 3, 1, 4, 1]
print("Ocurrencias de 1:", numeros.count(1))


Ocurrencias de 'a': 3
Ocurrencias de 1: 3


### **Ejercicio 2: Sumar Valores**
1. Usa sum para calcular la suma de una lista de números.
2. Aplica sum con un rango de números.

In [32]:
numeros = [1, 2, 3, 4, 5]
print("Suma de la lista:", sum(numeros))

print("Suma del rango 1 a 10:", sum(range(1, 11)))


Suma de la lista: 15
Suma del rango 1 a 10: 55


---

# **Manejo de Duplicados y Valores Ausentes en Análisis de Datos**

En esta clase aprenderemos a identificar, manejar y procesar datos duplicados y valores ausentes, utilizando las funciones principales de **Pandas** en Python: `duplicated`, `drop_duplicates`, `isnull`, y `fillna`.

---

## **1. Manejo de Duplicados**

### **Descripción**
Los valores duplicados en un conjunto de datos pueden sesgar los análisis y deben ser identificados y tratados. Pandas ofrece métodos efectivos para este propósito:

- **`duplicated()`**: Identifica filas duplicadas.
- **`drop_duplicates()`**: Elimina filas duplicadas.

---

### **Ejercicio 1: Identificar Valores Duplicados**

1. Crea un DataFrame con datos ficticios.
2. Usa `duplicated()` para identificar las filas duplicadas.
3. Filtra únicamente las filas duplicadas.


In [33]:
import pandas as pd

# Crear un DataFrame ficticio
data = {
    "ID": [1, 2, 3, 4, 1],
    "Nombre": ["Ana", "Luis", "Juan", "Ana", "Ana"],
    "Edad": [25, 30, 22, 25, 25]
}

df = pd.DataFrame(data)

# Identificar duplicados
print("¿Es duplicado?\n", df.duplicated())

# Filtrar filas duplicadas
duplicados = df[df.duplicated()]
print("\nFilas duplicadas:\n", duplicados)


¿Es duplicado?
 0    False
1    False
2    False
3    False
4     True
dtype: bool

Filas duplicadas:
    ID Nombre  Edad
4   1    Ana    25


### **Ejercicio 2: Eliminar Duplicados**
1. Usa `drop_duplicates()` para eliminar las filas duplicadas.
2. Prueba diferentes configuraciones del método, como mantener la primera o la última aparición.

In [34]:
# Eliminar duplicados (manteniendo la primera aparición)
df_sin_duplicados = df.drop_duplicates()
print("\nDataFrame sin duplicados (primera aparición):\n", df_sin_duplicados)

# Eliminar duplicados (manteniendo la última aparición)
df_sin_duplicados = df.drop_duplicates(keep="last")
print("\nDataFrame sin duplicados (última aparición):\n", df_sin_duplicados)



DataFrame sin duplicados (primera aparición):
    ID Nombre  Edad
0   1    Ana    25
1   2   Luis    30
2   3   Juan    22
3   4    Ana    25

DataFrame sin duplicados (última aparición):
    ID Nombre  Edad
1   2   Luis    30
2   3   Juan    22
3   4    Ana    25
4   1    Ana    25


---

## **2. Manejo de Valores Ausentes**
### **Descripción**
Los valores ausentes pueden ocurrir debido a datos incompletos o errores de recolección. Pandas proporciona herramientas para detectarlos y tratarlos:

`isnull()`: Identifica valores nulos.
`fillna()`: Rellena los valores nulos con un valor específico.

### **Ejercicio 1: Identificar Valores Nulos**
1. Añade valores nulos a un DataFrame.
2. Usa `isnull()` para identificar las celdas nulas.
3. Calcula la cantidad total de valores nulos por columna.

In [35]:
# Crear un DataFrame con valores nulos
data = {
    "ID": [1, 2, 3, None],
    "Nombre": ["Ana", "Luis", None, "Juan"],
    "Edad": [25, 30, None, 22]
}

df = pd.DataFrame(data)

# Identificar valores nulos
print("\nValores nulos:\n", df.isnull())

# Contar valores nulos por columna
print("\nCantidad de valores nulos por columna:\n", df.isnull().sum())


Valores nulos:
       ID  Nombre   Edad
0  False   False  False
1  False   False  False
2  False    True   True
3   True   False  False

Cantidad de valores nulos por columna:
 ID        1
Nombre    1
Edad      1
dtype: int64


### **Ejercicio 2: Rellenar Valores Nulos**
1. Usa `fillna()` para rellenar valores nulos con:
    - Un valor constante.
    - El promedio o mediana de la columna.

In [36]:
# Rellenar valores nulos con un valor constante
df_relleno_constante = df.fillna("Desconocido")
print("\nDataFrame con valores constantes:\n", df_relleno_constante)

# Rellenar valores nulos con el promedio
df_relleno_promedio = df.fillna({"Edad": df["Edad"].mean()})
print("\nDataFrame con promedio:\n", df_relleno_promedio)


DataFrame con valores constantes:
             ID       Nombre         Edad
0          1.0          Ana         25.0
1          2.0         Luis         30.0
2          3.0  Desconocido  Desconocido
3  Desconocido         Juan         22.0

DataFrame con promedio:
     ID Nombre       Edad
0  1.0    Ana  25.000000
1  2.0   Luis  30.000000
2  3.0   None  25.666667
3  NaN   Juan  22.000000


### **Ejercicio 3: Eliminar Filas con Valores Nulos**
1. Usa `dropna()` para eliminar filas que contengan valores nulos.
1. Configura el método para eliminar solo si todos los valores de la fila son nulos.

In [37]:
# Eliminar filas con al menos un valor nulo
df_sin_nulos = df.dropna()
print("\nDataFrame sin valores nulos (cualquier columna):\n", df_sin_nulos)

# Eliminar filas solo si todos los valores son nulos
df_sin_nulos_totales = df.dropna(how="all")
print("\nDataFrame sin valores nulos (todas las columnas):\n", df_sin_nulos_totales)


DataFrame sin valores nulos (cualquier columna):
     ID Nombre  Edad
0  1.0    Ana  25.0
1  2.0   Luis  30.0

DataFrame sin valores nulos (todas las columnas):
     ID Nombre  Edad
0  1.0    Ana  25.0
1  2.0   Luis  30.0
2  3.0   None   NaN
3  NaN   Juan  22.0


---

## **3. Caso Práctico: Manejo Completo de Duplicados y Nulos**
Dado un DataFrame con duplicados y valores nulos:

1. Identifica y elimina duplicados.
2. Rellena valores nulos con estrategias personalizadas.
3. Realiza un análisis final para verificar la limpieza.

In [38]:
# Crear un DataFrame más complejo
data = {
    "ID": [1, 2, 2, 4, None],
    "Nombre": ["Ana", "Luis", "Luis", None, "Juan"],
    "Edad": [25, None, None, 22, 30],
    "Salario": [3000, 4000, 4000, None, None]
}

df = pd.DataFrame(data)

# Identificar duplicados
print("\nIdentificar duplicados:\n", df.duplicated())

# Eliminar duplicados
df = df.drop_duplicates()
print("\nDataFrame sin duplicados:\n", df)

# Rellenar valores nulos
df = df.fillna({
    "Nombre": "Desconocido",
    "Edad": df["Edad"].mean(),
    "Salario": df["Salario"].median()
})
print("\nDataFrame con valores nulos rellenados:\n", df)


Identificar duplicados:
 0    False
1    False
2     True
3    False
4    False
dtype: bool

DataFrame sin duplicados:
     ID Nombre  Edad  Salario
0  1.0    Ana  25.0   3000.0
1  2.0   Luis   NaN   4000.0
3  4.0   None  22.0      NaN
4  NaN   Juan  30.0      NaN

DataFrame con valores nulos rellenados:
     ID       Nombre       Edad  Salario
0  1.0          Ana  25.000000   3000.0
1  2.0         Luis  25.666667   4000.0
3  4.0  Desconocido  22.000000   3500.0
4  NaN         Juan  30.000000   3500.0
