In [14]:
import pandas as pd

class DataSetLoader:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = self.load_data()

    def load_data(self):
        try:
            data = pd.read_csv(self.file_path)
            return data
        except FileNotFoundError:
            print(f"El archivo {self.file_path} no se encontró.")
            return None

    def display_data(self):
        if self.data is not None:
            print(self.data.head())
        else:
            print("No se cargaron datos.")

# Uso de la clase para cargar datos del archivo iris.csv
if __name__ == "__main__":
    dataset_loader = DataSetLoader("iris.csv")
    dataset_loader.display_data()






                  ,"SepalLength","SepalWidth","PetalLength","PetalWidth","Species"
1 5.1 3.5 1.4 0.2                                             setosa              
2 4.9 3.0 1.4 0.2                                             setosa              
3 4.7 3.2 1.3 0.2                                             setosa              
4 4.6 3.1 1.5 0.2                                             setosa              
5 5.0 3.6 1.4 0.2                                             setosa              


In [26]:
import pandas as pd

class DataSetAnalyzer:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = self.load_data()

    def load_data(self):
        try:
            data = pd.read_csv(self.file_path)
            return data
        except FileNotFoundError:
            print(f"El archivo {self.file_path} no se encontró.")
            return None

    def display_data(self):
        if self.data is not None:
            print(self.data.head())
        else:
            print("No se cargaron datos.")

    def calculate_statistics(self):
        if self.data is not None:
            statistics = self.data.describe(include='all')
            return statistics
        else:
            print("No se pueden calcular estadísticas porque no se cargaron datos.")
            return None

# Uso de la clase para cargar datos del archivo iris.csv y calcular estadísticas
if __name__ == "__main__":
    dataset_analyzer = DataSetAnalyzer("iris.csv")
    dataset_analyzer.display_data()

    statistics = dataset_analyzer.calculate_statistics()

    if statistics is not None:
        print("\nEstadísticas descriptivas básicas:")
        print(statistics)


                  ,"SepalLength","SepalWidth","PetalLength","PetalWidth","Species"
1 5.1 3.5 1.4 0.2                                             setosa              
2 4.9 3.0 1.4 0.2                                             setosa              
3 4.7 3.2 1.3 0.2                                             setosa              
4 4.6 3.1 1.5 0.2                                             setosa              
5 5.0 3.6 1.4 0.2                                             setosa              

Estadísticas descriptivas básicas:
       ,"SepalLength","SepalWidth","PetalLength","PetalWidth","Species"
count                                                 150              
unique                                                  3              
top                                                setosa              
freq                                                   50              


In [27]:
import pandas as pd
import matplotlib.pyplot as plt

class DataSetAnalyzer:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = self.load_data()

    def load_data(self):
        try:
            data = pd.read_csv(self.file_path)
            return data
        except FileNotFoundError:
            print(f"El archivo {self.file_path} no se encontró.")
            return None

    def display_data(self):
        if self.data is not None:
            print(self.data.head())
        else:
            print("No se cargaron datos.")

    def calculate_statistics(self):
        if self.data is not None:
            statistics = self.data.describe(include='all')
            return statistics
        else:
            print("No se pueden calcular estadísticas porque no se cargaron datos.")
            return None

    def get_variable_names(self):
        if self.data is not None:
            return self.data.columns.tolist()
        else:
            print("No se pueden obtener los nombres de las variables porque no se cargaron datos.")
            return None

    def analyze_variable(self, variable_name):
        if self.data is not None and variable_name in self.data.columns:
            variable_data = self.data[variable_name]
            mean = variable_data.mean()
            median = variable_data.median()
            std_deviation = variable_data.std()
            q25 = variable_data.quantile(0.25)
            q50 = variable_data.quantile(0.50)
            q75 = variable_data.quantile(0.75)

            # Dibujar un histograma
            plt.figure(figsize=(8, 6))
            plt.hist(variable_data, bins=20, color='blue', alpha=0.7)
            plt.xlabel(variable_name)
            plt.ylabel('Frecuencia')
            plt.title(f'Histograma de {variable_name}')
            plt.grid(True)
            plt.show()

            print(f"Estadísticas para '{variable_name}':")
            print(f"Media: {mean}")
            print(f"Mediana: {median}")
            print(f"Desviación Estándar: {std_deviation}")
            print(f"Percentil 25: {q25}")
            print(f"Percentil 50 (Mediana): {q50}")
            print(f"Percentil 75: {q75}")
        else:
            print(f"No se pueden analizar '{variable_name}' porque no existe en los datos.")

# Uso de la clase para cargar datos del archivo iris.csv y realizar análisis de variables
if __name__ == "__main__":
    dataset_analyzer = DataSetAnalyzer("iris.csv")
    dataset_analyzer.display_data()

    variable_names = dataset_analyzer.get_variable_names()
    if variable_names is not None:
        print("\nNombres de las variables disponibles:")
        print(variable_names)

    variable_to_analyze = "SepalLength"  # Cambia el nombre de la variable según tus necesidades
    dataset_analyzer.analyze_variable(variable_to_analyze)


                  ,"SepalLength","SepalWidth","PetalLength","PetalWidth","Species"
1 5.1 3.5 1.4 0.2                                             setosa              
2 4.9 3.0 1.4 0.2                                             setosa              
3 4.7 3.2 1.3 0.2                                             setosa              
4 4.6 3.1 1.5 0.2                                             setosa              
5 5.0 3.6 1.4 0.2                                             setosa              

Nombres de las variables disponibles:
[',"SepalLength","SepalWidth","PetalLength","PetalWidth","Species"']
No se pueden analizar 'SepalLength' porque no existe en los datos.
