# Análisis Estadístico del Conjunto de Datos Iris

## Objetivo:
Desarrollar una aplicación en Python que permita a los usuarios realizar un análisis estadístico básico del conocido conjunto de datos Iris. Este análisis incluirá el cálculo del promedio y la desviación estándar para las características de las flores (longitud y ancho del sépalo, longitud y ancho del pétalo) para cada especie de Iris presente en el conjunto de datos.

## Descripción:
El conjunto de datos Iris contiene 150 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor), con 50 muestras para cada especie. Cada muestra tiene cuatro características: la longitud y el ancho del sépalo, y la longitud y el ancho del pétalo, todas medidas en centímetros.

Tu tarea es crear una aplicación en Python que cargue este conjunto de datos desde un archivo CSV, organice los datos por especie y realice un análisis estadístico para cada tipo de característica mencionada. La aplicación debe ser capaz de informar los resultados de manera clara y concisa al usuario.


![](https://media.licdn.com/dms/image/D5612AQFvpSLdhkfa0g/article-cover_image-shrink_600_2000/0/1694107215197?e=2147483647&v=beta&t=aSiPQP37OssvFRNT_Gjf95WZfTlr5CB3n_apgLGLrqo)


In [25]:
import csv
import math

In [26]:
def cargar_datos(filepath):
    with open(filepath, 'r') as file:
        csv_reader = csv.reader(file)
        dataset = [row for row in csv_reader if row]  # Asegura excluir filas vacías
    return dataset

In [31]:
def agrupar_por_especie(datos):
    agrupados = {}
    for fila in datos:
        especie = fila[-1]
        caracteristicas = list(map(float, fila[:-1]))  # Convierte a float todas menos la especie
        if especie not in agrupados:
            agrupados[especie] = {'longitud_sepalo': [],
                                  'ancho_sepalo': [],
                                  'longitud_petalo': [],
                                  'ancho_petalo': []}
        agrupados[especie]['longitud_sepalo'].append(caracteristicas[0])
        agrupados[especie]['ancho_sepalo'].append(caracteristicas[1])
        agrupados[especie]['longitud_petalo'].append(caracteristicas[2])
        agrupados[especie]['ancho_petalo'].append(caracteristicas[3])
    return agrupados

In [33]:
class Flor:
    def __init__(self, longitud_sepalo, ancho_sepalo, longitud_petalo, ancho_petalo):
        """Inicializa la Flor con listas de sus características."""
        self.longitud_sepalo = longitud_sepalo
        self.ancho_sepalo = ancho_sepalo
        self.longitud_petalo = longitud_petalo
        self.ancho_petalo = ancho_petalo

    def promedio(self, datos):
        """Calcula el promedio de una lista de números."""
        return sum(datos) / len(datos)

    def desviacion_estandar(self, datos):
        """Calcula la desviación estándar de una lista de números."""
        prom = self.promedio(datos)
        varianza = sum((x - prom) ** 2 for x in datos) / len(datos)
        return math.sqrt(varianza)

    def analisis(self):
        """Devuelve el análisis de la flor: promedio y desviación estándar para cada característica."""
        analisis = {
            'longitud_sepalo': {'promedio': self.promedio(self.longitud_sepalo),
                                'desviacion_estandar': self.desviacion_estandar(self.longitud_sepalo)},
            'ancho_sepalo': {'promedio': self.promedio(self.ancho_sepalo),
                             'desviacion_estandar': self.desviacion_estandar(self.ancho_sepalo)},
            'longitud_petalo': {'promedio': self.promedio(self.longitud_petalo),
                                'desviacion_estandar': self.desviacion_estandar(self.longitud_petalo)},
            'ancho_petalo': {'promedio': self.promedio(self.ancho_petalo),
                             'desviacion_estandar': self.desviacion_estandar(self.ancho_petalo)}
        }
        return analisis

In [34]:
datos = cargar_datos('iris.data.txt')
Flores = agrupar_por_especie(datos)
Iris_setosa = Flor(Flores['Iris-setosa']['longitud_sepalo'],
                   Flores['Iris-setosa']['ancho_sepalo'],
                   Flores['Iris-setosa']['longitud_petalo'],
                   Flores['Iris-setosa']['ancho_petalo'])

In [36]:
print(Iris_setosa.analisis())

{'longitud_sepalo': {'promedio': 5.005999999999999, 'desviacion_estandar': 0.348946987377739}, 'ancho_sepalo': {'promedio': 3.4180000000000006, 'desviacion_estandar': 0.37719490982779713}, 'longitud_petalo': {'promedio': 1.464, 'desviacion_estandar': 0.17176728442867115}, 'ancho_petalo': {'promedio': 0.2439999999999999, 'desviacion_estandar': 0.10613199329137278}}


In [37]:
Iris_versicolor = Flor(Flores['Iris-versicolor']['longitud_sepalo'],
                   Flores['Iris-versicolor']['ancho_sepalo'],
                   Flores['Iris-versicolor']['longitud_petalo'],
                   Flores['Iris-versicolor']['ancho_petalo'])

In [38]:
print(Iris_versicolor.analisis())

{'longitud_sepalo': {'promedio': 5.936, 'desviacion_estandar': 0.5109833656783752}, 'ancho_sepalo': {'promedio': 2.7700000000000005, 'desviacion_estandar': 0.31064449134018135}, 'longitud_petalo': {'promedio': 4.26, 'desviacion_estandar': 0.4651881339845204}, 'ancho_petalo': {'promedio': 1.3259999999999998, 'desviacion_estandar': 0.19576516544063702}}
