In [None]:
# # Análisis y Visualización del Conjunto de Datos Iris

## En este notebook, vamos a trabajar con el conjunto de datos Iris. Aprenderemos a:
## 1. Importar y cargar los datos.
## 2. Procesar y limpiar los datos.
## 3. Visualizar las relaciones entre características.

# **1. Importar Librerías y Cargar Datos**

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from sklearn import datasets

# Cargar el conjunto de datos Iris
iris = datasets.load_iris()
df_data = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df_target = pd.DataFrame(data=iris.target, columns=['species'])

# Mostrar las primeras filas de cada DataFrame para ver cómo son los datos
print("Datos de las características:")
print(df_data.head())
print("\nDatos de las especies:")
print(df_target.head())

# **2. Procesar los Datos**

# Crear una copia del DataFrame df_target para agregar las especies como texto
df_target_categorical = df_target.copy()

# Convertir los números en nombres de especies usando una función lambda
df_target_categorical['species'] = df_target.apply(
    lambda x: 'setosa' if x.species == 0 else 'versicolor' if x.species == 1 else 'virginica',
    axis=1
)

# Mostrar las primeras filas del DataFrame con los nombres de especies
print("\nDatos con especies como texto:")
print(df_target_categorical.head())

# Contar cuántas especies hay en el dataset
print("\nCantidad de cada especie en el dataset:")
print(df_target_categorical['species'].value_counts())

# **3. Concatenar y Analizar Datos**

# Concatenar el DataFrame de características con el DataFrame de especies
df = pd.concat([df_data, df_target_categorical], axis=1)

# Mostrar las primeras filas del DataFrame combinado
print("\nDataFrame combinado:")
print(df.head())

# Analizar si hay valores faltantes en el DataFrame
des = df.describe()
des.loc['Nan'] = df.isna().sum()
des.loc['%Nan'] = (df.isna().mean()) * 100
print("\nDescripción del DataFrame con información sobre valores faltantes:")
print(des)

# Imprimir cuántas filas hay en el DataFrame
print("\nNúmero de datos disponibles para analizar:")
print('Datos disponibles para analizar: ', df.shape[0])

# **4. Separar por Tipo de Iris y Graficar**

# Separar el DataFrame en sub-DataFrames por especie
df_setosa = df[df['species'] == 'setosa']
df_versicolor = df[df['species'] == 'versicolor']
df_virginica = df[df['species'] == 'virginica']

# Función para graficar la relación entre 'petal length (cm)' y 'petal width (cm)'
def plot_petal(df, title):
    plt.figure(figsize=(8, 6))
    plt.scatter(df['petal length (cm)'], df['petal width (cm)'], label=title)
    plt.xlabel('Petal Length (cm)')
    plt.ylabel('Petal Width (cm)')
    plt.title(f'Scatter Plot of {title}')
    plt.legend()
    plt.show()

# Graficar la relación para cada especie
plot_petal(df_setosa, 'Setosa')
plot_petal(df_versicolor, 'Versicolor')
plot_petal(df_virginica, 'Virginica')
