# Análisis del Dataset Iris con Matplotlib

En este ejercicio trabajaremos con el famoso dataset de flores Iris para practicar la visualización de datos usando Matplotlib.

## Objetivos
1. Crear visualizaciones de dispersión (scatter plots) para analizar las relaciones entre variables
2. Diferenciar las especies de Iris por colores
3. Comparar las características de sépalos vs pétalos
4. Extraer conclusiones sobre qué variables son más útiles para clasificar las especies

## Parte 1: Visualización de Sépalos

1. Importa las librerías necesarias (matplotlib.pyplot, pandas, seaborn)
2. Carga el dataset iris de seaborn
3. Crea un scatter plot básico
4. Crea un segundo scatter plot diferenciando las especies por colores
5. Añade títulos, leyendas y etiquetas a los ejes

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

# Cargar el dataset
iris = sns.load_dataset('iris')

# Configurar el estilo de las gráficas
plt.style.use('classic')

# Crear la figura con dos subplots
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 5))

# Scatter plot básico
ax1.scatter(iris['sepal_length'], iris['sepal_width'])
ax1.set_title('Scatter Plot Básico - Sépalos')
ax1.set_xlabel('Longitud del Sépalo (cm)')
ax1.set_ylabel('Ancho del Sépalo (cm)')
ax1.grid(True)

# Scatter plot con especies diferenciadas por colores
colors = {'setosa': 'blue', 'versicolor': 'green', 'virginica': 'red'}
for species in iris['species'].unique():
    subset = iris[iris['species'] == species]
    ax2.scatter(subset['sepal_length'], subset['sepal_width'], 
                c=colors[species], label=species)

ax2.set_title('Scatter Plot por Especies - Sépalos')
ax2.set_xlabel('Longitud del Sépalo (cm)')
ax2.set_ylabel('Ancho del Sépalo (cm)')
ax2.legend()
ax2.grid(True)

plt.tight_layout()
plt.show()

In [None]:
# Configurar el estilo de Seaborn
sns.set_style("whitegrid")

# Crear la figura con dos subplots
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 5))

# Scatter plot básico con Seaborn
sns.scatterplot(
    data=iris,
    x='sepal_length',
    y='sepal_width',
    ax=ax1
)
ax1.set_title('Scatter Plot Básico - Sépalos')
ax1.set_xlabel('Longitud del Sépalo (cm)')
ax1.set_ylabel('Ancho del Sépalo (cm)')

# Scatter plot con especies diferenciadas por colores usando Seaborn
sns.scatterplot(
    data=iris,
    x='sepal_length',
    y='sepal_width',
    hue='species',
    palette={'setosa': 'blue', 'versicolor': 'green', 'virginica': 'red'},
    ax=ax2
)
ax2.set_title('Scatter Plot por Especies - Sépalos')
ax2.set_xlabel('Longitud del Sépalo (cm)')
ax2.set_ylabel('Ancho del Sépalo (cm)')

plt.tight_layout()
plt.show()

## Parte 2: Visualización de Pétalos

1. Crea un scatter plot para las medidas de los pétalos
2. Utiliza los mismos colores que antes para diferenciar especies
3. Añade los elementos decorativos necesarios

In [None]:
plt.figure(figsize=(8, 6))

# Scatter plot de pétalos con especies diferenciadas por colores
for species in iris['species'].unique():
    subset = iris[iris['species'] == species]
    plt.scatter(subset['petal_length'], subset['petal_width'],
                c=colors[species], label=species)

plt.title('Scatter Plot por Especies - Pétalos')
plt.xlabel('Longitud del Pétalo (cm)')
plt.ylabel('Ancho del Pétalo (cm)')
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()

## Parte 3: Análisis y Conclusiones

### Visualizaciones adicionales: Matriz de dispersión

In [None]:
# Crear una matriz de dispersión
sns.set_style("whitegrid")
sns.pairplot(iris, hue='species', palette={'setosa': 'blue', 'versicolor': 'green', 'virginica': 'red'})
plt.show()

### Análisis y Conclusiones:

1. Comparación de características:
   - Las medidas de los pétalos separan mejor las especies que las medidas de los sépalos
   - La especie setosa está claramente separada de las otras dos especies cuando se observan los pétalos
   - Existe cierto solapamiento entre versicolor y virginica, especialmente en las medidas de los sépalos

2. Patrones observados:
   - Setosa tiene los pétalos más pequeños (tanto en longitud como en ancho)
   - Virginica tiende a tener los pétalos más grandes
   - En cuanto a los sépalos, setosa tiene menor longitud pero mayor ancho en proporción

3. Conclusiones para clasificación:
   - Las características de los pétalos son más útiles para clasificar las especies
   - La combinación de longitud y ancho del pétalo permite una buena separación de setosa
   - Para distinguir entre versicolor y virginica, se necesitaría considerar múltiples características