<a href="https://colab.research.google.com/github/ingcarlosleon/MaestriaInteligenciaArtificial/blob/main/computeStatistics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análisis Estadístico de Datos
Este cuaderno contiene funciones para calcular estadísticas básicas como la media, la mediana, la moda y la desviación estándar de una lista de números.


In [61]:
# Importaciones necesarias
import time
import sys
import math
import os

base_path = '/content/CalidadSoftware'

Parte 2: Función para Calcular la Media

In [53]:
def calculate_mean(data):
    """
    Calcula la media de una lista de números.
    """
    return sum(data) / len(data) if len(data) > 0 else 0


Parte 3: Función para Calcular la Mediana

In [54]:
def calculate_median(data):
    """
    Calcula la mediana de una lista de números.
    """
    sorted_data = sorted(data)
    n = len(sorted_data)
    if n % 2 == 0:
        middle1 = sorted_data[n // 2 - 1]
        middle2 = sorted_data[n // 2]
        return (middle1 + middle2) / 2
    return sorted_data[n // 2]


Parte 4: Función para Calcular la Moda

In [55]:
def calculate_mode(data):
    """
    Calcula la moda de una lista de números.
    """
    frequency = {}
    for num in data:
        frequency[num] = frequency.get(num, 0) + 1
    max_freq = max(frequency.values())
    modes = [k for k, v in frequency.items() if v == max_freq]
    return modes[0] if modes else None  # Devuelve la primera moda si existe

Parte 5: Función para Calcular la Desviación Estándar

In [56]:
def calculate_standard_deviation(data, mean):
    """
    Calcula la desviación estándar de una lista de números.
    """
    variance = sum((x - mean) ** 2 for x in data) / len(data) if len(data) > 0 else 0
    return math.sqrt(variance)

Parte 6: Función para Calcular la Varianza

In [57]:
def calculate_variance(data, mean):
    """
    Calcula la varianza de una lista de números.
    """
    return sum((x - mean) ** 2 for x in data) / len(data) if len(data) > 0 else 0

Parte 7: Función para Manejar Datos Inválidos

In [58]:
def handle_invalid_data(data_str):
    """
    Maneja datos inválidos intentando convertirlos a float.
    Si la conversión falla, elimina los caracteres no numéricos y cuenta los datos.
    """
    try:
        return float(data_str)
    except ValueError:
        numeric_value = ''.join(char for char in data_str if char.isdigit() or char == '.')
        if numeric_value:
            print(f"Converted non-numeric data: {data_str} to {numeric_value}")
            return float(numeric_value)
        print(f"Ignoring invalid data: {data_str}")
        return None

Parte 8: Función para Leer Datos de un Archivo

In [59]:
def read_data_from_file(filename):
    """
    Lee datos de un archivo y maneja datos inválidos.
    Devuelve una lista de valores numéricos.
    """
    data = []
    with open(filename, 'r') as file:
        for line in file:
            for data_str in line.split():
                numeric_value = handle_invalid_data(data_str)
                if numeric_value is not None:
                    data.append(numeric_value)
    return data

Parte 9: Leer y Procesar Cada Archivo

In [60]:
file_names = ['TC1.txt', 'TC2.txt', 'TC3.txt', 'TC4.txt', 'TC5.txt', 'TC6.txt', 'TC7.txt']

for file_name in file_names:
    file_path = f"{base_path}/{file_name}"
    print(file_path)
    print(f"Procesando {file_name}...")
    data = read_data_from_file(file_path)
    # Aquí puedes llamar a tus funciones de estadísticas como calculate_mean, calculate_median, etc.
    # Por ejemplo:
    mean = calculate_mean(data)
    median = calculate_median(data)
    mode = calculate_mode(data)
    std_dev = calculate_standard_deviation(data, mean)

    # Mostrar resultados
    print(f"Media: {mean}, Mediana: {median}, Moda: {mode}, Desviación Estándar: {std_dev}")


/content/CalidadSoftware/TC1.txt
Procesando TC1.txt...
Media: 242.32, Mediana: 239.5, Moda: 393.0, Desviación Estándar: 145.25810683056557
/content/CalidadSoftware/TC2.txt
Procesando TC2.txt...
Media: 250.7840161861406, Mediana: 247.0, Moda: 230.0, Desviación Estándar: 144.17131868884059
/content/CalidadSoftware/TC3.txt
Procesando TC3.txt...
Media: 249.77621989860583, Mediana: 249.0, Moda: 94.0, Desviación Estándar: 145.31784980917962
/content/CalidadSoftware/TC4.txt
Procesando TC4.txt...
Media: 149.00267347908746, Mediana: 147.75, Moda: 123.75, Desviación Estándar: 130.41441961308894
/content/CalidadSoftware/TC5.txt
Procesando TC5.txt...
Ignoring invalid data: ABA
Converted non-numeric data: 23,45 to 2345
Converted non-numeric data: 11;54 to 1154
Ignoring invalid data: ll
Media: 251.25566343042073, Mediana: 246.0, Moda: 393.0, Desviación Estándar: 194.78713634976788
/content/CalidadSoftware/TC6.txt
Procesando TC6.txt...
Media: 1.8790659927977473e+20, Mediana: 1.88008049965543e+20, Mod