# Tablas de Frecuencias e Histograma con Python

## Introducción
El presente trabajo tiene como motivación facilitar la creación de tablas de frecuencia e histogramas de manera personalizada. Actualmente, el lenguaje de programación Python y su biblioteca Pandas, en conjunto con Matplotlib y Seaborn, permiten el análisis de datos para grandes conjuntos de datos, incluyendo su visualización. Sin embargo, su enfoque se centra principalmente en ámbitos más profesionales, dejando posiblemente de lado el ámbito educativo. ¿A qué me refiero? Al estudiar los temas pertinentes de estadística descriptiva, específicamente el diagrama diferencial conocido como histograma y su base de creación que son las tablas de frecuencia, me di cuenta de que realizar este proceso en las herramientas de oficina puede resultar tedioso, desviando tal vez la atención del estudiante de lo que, desde mi punto de vista personal, es la interpretación de los datos. Esto es así, ya que como mencioné, los paquetes informáticos actuales proporcionan poderosas herramientas que permiten realizar cálculos estadísticos y representaciones gráficas casi de forma automática. Incluso, actualmente, no es necesario tener conocimientos básicos de programación en Python debido a las innovaciones tecnológicas en el área de la inteligencia artificial.

En este trabajo, describo el procedimiento para la creación de un script en Python que solicita al usuario un conjunto de datos unidimensional continuos. Estos datos pueden ser ingresados manualmente o automáticamente al insertar la ruta local del archivo en formato CSV. Finalmente, con los datos proporcionados, el script crea una tabla de frecuencias siguiendo el estándar impartido en el salón de clases y, además, crea un histograma. Permite al usuario seleccionar el tipo de regla empírica que desea utilizar para determinar el número de clases. Todo esto se logra utilizando las bibliotecas de Python: Pandas, Seaborn y Matplotlib.

Para ejecutar este trabajo, simplemente abre un navegador web y busca el siguiente enlace: [Enlace a Google Colab](https://colab.research.google.com/). Luego, abre el presente archivo y ejecuta todas las celdas de este documento presionando Ctrl + F9.

Según Vargas(1995) "La representación del histograma esta fundamentada en la proporcionalidad de las áreas de rectángulos a las frecuencias de cada modalidad". Es decir, que cada rectángulo representado en el histograma tiene una altura correspondiente a la frecuencia de esa clase.

## Desarrollo
Para desarrollar el script descrito se sigue la siguiente metodología:
    1. Solicitamos al usuario ingrese los datos manualmente o en su caso la ruta del archivo CSV.
    2. Si los datos son ingresados via CSV, leemos dicho archivo y lo almacenamos como una serie de Pandas.
    3. Ordenamos los datos de manera ascendente.
    4. Se solicita el número de clases segun las reglas empíricas preprogramadas.
    5. Creamos las clases seggún el número de clases obtenido, el ancho de clase encontrado.
    6. Creamos la tabla de frecuencias.
    7. Creamos el histograma.


### 1. Solicitud de los datos al usuario

In [1]:
import pandas as pd
import seaborn as sns

In [12]:
# Definimos el menú principal
def main_menu():
    opc = input("¿Desea ingresar los datos manualmente (M) o cargar un archivo CSV (C)? ").upper()
    
    if opc == 'M':
        # Datos ingresados manualmente

        # Solicitar al usuario ingresar datos separados por comas
        datos_str = input("Ingrese datos separados por comas: ")

        # Convertir la cadena de entrada en una lista
        datos_lista = [dato.strip() for dato in datos_str.split(',')]

        # Crear una Serie de Pandas a partir de la lista
        serie_datos = pd.Series(datos_lista)

        # Mostrar la Serie resultante
        print("Serie de Pandas creada:")
        print(serie_datos)

    elif opc == 'C':
        # Datos cargados desde un archivo CSV
        # Solicitar al usuario ingresar la ruta del archivo CSV
        ruta_archivo = input("Ingrese la ruta del archivo CSV: ")

        try:
            # Intentar cargar el archivo CSV en una serie de Pandas
            nombre_columna = input("Ingrese el nombre de la columna de datos en el archivo CSV: ")
            serie_datos = pd.read_csv(ruta_archivo)[nombre_columna]

            # Verificar si la serie está vacía
            if serie_datos.empty:
                print("El archivo CSV está vacío o no contiene datos válidos.")
            else:
                # Mostrar la Serie resultante
                print("Serie de Pandas creada:")
                print(serie_datos)
        except FileNotFoundError:
            print(f"No se encontró el archivo '{ruta_archivo}'. Por favor, verifique la ruta.")
        except pd.errors.ParserError:
            print("El archivo CSV no es válido o no contiene datos válidos.")
        except Exception as e:
            print(f"Se produjo un error inesperado: {str(e)}")

# Llamar a la función principal
main_menu()


Serie de Pandas creada:
0      171,00
1      174,00
2      177,50
3      170,90
4      174,50
        ...  
595    170,30
596    170,00
597    179,00
598    177,30
599    173,90
Name: Estatura (cm), Length: 600, dtype: object
