# 🧪 Ejercicios de Visualización con Matplotlib y Seaborn

La visualización de datos es una de las herramientas más importantes en el análisis de datos y la ciencia de datos. No solo nos permite explorar y entender mejor los datos, sino que también nos ayuda a comunicar hallazgos de manera efectiva. A través de gráficos, podemos detectar patrones, relaciones y anomalías que serían difíciles de identificar solo con números o tablas.

In [1]:
# Importar librerías necesarias
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

# Crear datasets locales simulados
df_carreras = pd.DataFrame({
    'Carrera': ['Ingeniería', 'Medicina', 'Derecho', 'Psicología'],
    'Estudiantes': [120, 80, 60, 100]
})

df_iris = pd.DataFrame({
    'sepal_length': np.random.normal(5.8, 0.4, 150),
    'sepal_width': np.random.normal(3.0, 0.3, 150),
    'petal_length': np.random.normal(3.7, 1.5, 150),
    'petal_width': np.random.normal(1.2, 0.8, 150),
    'species': np.random.choice(['setosa', 'versicolor', 'virginica'], 150)
})

df_tips = pd.DataFrame({
    'total_bill': np.random.uniform(10, 50, 100),
    'tip': np.random.uniform(1, 10, 100),
    'sex': np.random.choice(['Male', 'Female'], 100),
    'smoker': np.random.choice(['Yes', 'No'], 100),
    'day': np.random.choice(['Thur', 'Fri', 'Sat', 'Sun'], 100),
    'time': np.random.choice(['Lunch', 'Dinner'], 100),
    'size': np.random.randint(1, 6, 100)
})

### Ejercicio 1 - Gráfico de líneas simple

Supongamos que, en mi oficina, me toma 10 segundos recorrer 25 metros caminando tranquilamente hacia la máquina de café. Si queremos expresar esta situación como una función lineal de la distancia respecto al tiempo, usamos la fórmula:

$
\text{distancia} = \text{velocidad} \times \text{tiempo}
$



Dado que la velocidad es constante, esta representa la pendiente de la función y se puede interpretar como la primera derivada de la distancia con respecto al tiempo. Es decir, nos indica qué tan rápido cambia la distancia mientras pasa el tiempo.

Calcula la velocidad constante a la que camino, usando los datos entregados y construye la función lineal que describe cómo cambia la distancia con el tiempo. Usa Matplotlib para graficar esta función para valores de tiempo entre 0 y 10 segundos.

In [3]:
x = np.arange(0, 11) # array con valores de 0 a 10

# tu codigo


### Ejercicio 2 - Representar visualmente datos categóricos.

Imagina que estamos analizando la cantidad de estudiantes matriculados en diferentes carreras dentro de una universidad. Estos datos categóricos (por carrera) pueden visualizarse fácilmente mediante un gráfico de barras, una de las formas más claras de comparar cantidades entre categorías.

Contamos con el siguiente conjunto de datos representado en el DataFrame df_carreras:

<!-- **📝 Instrucciones:**
- Usa el DataFrame `df_carreras`.
- Crea un gráfico de barras con `plt.bar`.
- Añade etiquetas y título. -->

In [6]:
df_carreras 

Unnamed: 0,Carrera,Estudiantes
0,Ingeniería,120
1,Medicina,80
2,Derecho,60
3,Psicología,100


**Representa gráficamente cuántos estudiantes hay en cada carrera y utiliza un gráfico de barras vertical con Matplotlib. Recuerda añadir un título descriptivo, así como etiquetas en los ejes.**



In [None]:
# tu codigo

## Ejercicio 3: Visualizar proporciones con un gráfico circular.

Supongamos que deseas entender cómo se distribuyen los estudiantes entre distintas carreras en una universidad. Aunque ya has representado estos datos en un gráfico de barras, ahora quieres ver **qué porcentaje del total representa cada carrera** para tener una visión más global y proporcional.

Una buena forma de hacerlo es mediante un **gráfico de pastel (pie chart)**, que permite visualizar proporciones de manera intuitiva.


**Representa los datos de `df_carreras` como un gráfico de pastel y muestra el **porcentaje** que representa cada carrera sobre el total de estudiantes. Agrega también un **título** descriptivo que indique el propósito del gráfico.**

In [9]:
# tu código

## 4. Gráfico de dispersión con Seaborn

### Ejercicio 4: Explorar la relación entre dos variables numéricas creando un gráfico de dispersión con Seaborn 

Imagina que estás analizando las características de distintas especies de flores. Cada flor tiene varias medidas: largo y ancho del sépalo, largo y ancho del pétalo, y una clasificación por especie. Una excelente forma de **visualizar la relación entre dos variables numéricas** (como el largo y ancho del sépalo) es mediante un **gráfico de dispersión (scatter plot)**.

Este tipo de gráfico permite identificar posibles patrones, tendencias o agrupamientos según distintas especies.

**Usa el conjunto de datos `df_iris` y grafica la relación entre `sepal_length` (eje x) y `sepal_width` (eje y). Diferencia las especies usando el argumento `hue` y añade un título descriptivo al gráfico.**


In [11]:
# tu código