# Análisis Estadístico de Datos
Este cuaderno contiene funciones para calcular estadísticas básicas como la media, la mediana, la moda y la desviación estándar de una lista de números.


In [91]:
# Importaciones necesarias
import time
import sys
import math
import os

base_path = '/content/CalidadSoftware'

Parte 2: Función para Calcular la Media

In [92]:
def calculate_mean(data):
    """
    Calcula la media de una lista de números.
    """
    return sum(data) / len(data) if len(data) > 0 else 0


Parte 3: Función para Calcular la Mediana

In [93]:
def calculate_median(data):
    """
    Calcula la mediana de una lista de números.
    """
    sorted_data = sorted(data)
    n = len(sorted_data)
    if n % 2 == 0:
        middle1 = sorted_data[n // 2 - 1]
        middle2 = sorted_data[n // 2]
        return (middle1 + middle2) / 2
    return sorted_data[n // 2]


Parte 4: Función para Calcular la Moda

In [94]:
def calculate_mode(data):
    """
    Calcula la moda de una lista de números.
    """
    frequency = {}
    for num in data:
        frequency[num] = frequency.get(num, 0) + 1
    max_freq = max(frequency.values())
    modes = [k for k, v in frequency.items() if v == max_freq]
    return modes[0] if modes else None  # Devuelve la primera moda si existe

Parte 5: Función para Calcular la Desviación Estándar

In [95]:
def calculate_standard_deviation(data, mean):
    """
    Calcula la desviación estándar de una lista de números.
    """
    variance = sum((x - mean) ** 2 for x in data) / len(data) if len(data) > 0 else 0
    return math.sqrt(variance)

Parte 6: Función para Calcular la Varianza

In [96]:
def calculate_variance(data, mean):
    """
    Calcula la varianza de una lista de números.
    """
    return sum((x - mean) ** 2 for x in data) / len(data) if len(data) > 0 else 0

Parte 7: Función para Manejar Datos Inválidos

In [97]:
def handle_invalid_data(data_str):
    """
    Maneja datos inválidos intentando convertirlos a float.
    Si la conversión falla, elimina los caracteres no numéricos y cuenta los datos.
    """
    try:
        return float(data_str)
    except ValueError:
        numeric_value = ''.join(char for char in data_str if char.isdigit() or char == '.')
        if numeric_value:
            print(f"Converted non-numeric data: {data_str} to {numeric_value}")
            return float(numeric_value)
        print(f"Ignoring invalid data: {data_str}")
        return None

Parte 8: Función para Leer Datos de un Archivo

In [98]:
def read_data_from_file(filename):
    """
    Lee datos de un archivo y maneja datos inválidos.
    Devuelve una lista de valores numéricos.
    """
    data = []
    with open(filename, 'r') as file:
        for line in file:
            for data_str in line.split():
                numeric_value = handle_invalid_data(data_str)
                if numeric_value is not None:
                    data.append(numeric_value)
    return data

Parte 9: Leer y Procesar Cada Archivo

In [99]:
file_names = ['TC1.txt', 'TC2.txt', 'TC3.txt', 'TC4.txt', 'TC5.txt', 'TC6.txt', 'TC7.txt']

for file_name in file_names:
    file_path = f"{base_path}/{file_name}"
    print(file_path)
    print(f"Procesando {file_name}...")
    data = read_data_from_file(file_path)
    # Aquí puedes llamar a tus funciones de estadísticas como calculate_mean, calculate_median, etc.
    # Por ejemplo:
    mean = calculate_mean(data)
    median = calculate_median(data)
    mode = calculate_mode(data)
    std_dev = calculate_standard_deviation(data, mean)

    # Mostrar resultados
    print(f"Media: {mean}, Mediana: {median}, Moda: {mode}, Desviación Estándar: {std_dev}")


/content/CalidadSoftware/TC1.txt
Procesando TC1.txt...
Media: 242.32, Mediana: 239.5, Moda: 393.0, Desviación Estándar: 145.25810683056557
/content/CalidadSoftware/TC2.txt
Procesando TC2.txt...
Media: 250.7840161861406, Mediana: 247.0, Moda: 230.0, Desviación Estándar: 144.17131868884059
/content/CalidadSoftware/TC3.txt
Procesando TC3.txt...
Media: 249.77621989860583, Mediana: 249.0, Moda: 94.0, Desviación Estándar: 145.31784980917962
/content/CalidadSoftware/TC4.txt
Procesando TC4.txt...
Media: 149.00267347908746, Mediana: 147.75, Moda: 123.75, Desviación Estándar: 130.41441961308894
/content/CalidadSoftware/TC5.txt
Procesando TC5.txt...
Ignoring invalid data: ABA
Converted non-numeric data: 23,45 to 2345
Converted non-numeric data: 11;54 to 1154
Ignoring invalid data: ll
Media: 251.25566343042073, Mediana: 246.0, Moda: 393.0, Desviación Estándar: 194.78713634976788
/content/CalidadSoftware/TC6.txt
Procesando TC6.txt...
Media: 1.8790659927977473e+20, Mediana: 1.88008049965543e+20, Mod

In [100]:
import time
import os
from datetime import datetime

def main():
    start_time = time.time()

    # Define la ruta base a tus archivos
    base_path = '/content/CalidadSoftware'
    file_names = ['TC1.txt', 'TC2.txt', 'TC3.txt', 'TC4.txt', 'TC5.txt', 'TC6.txt', 'TC7.txt']

    # Preparar los encabezados para los resultados
    headers = ["TC", "COUNT", "MEAN", "MEDIAN", "MODE", "SD", "VAR", "Elapsed Time", "Timestamp"]
    file_results = []

    # Procesar cada archivo
    for file_name in file_names:
        file_path = os.path.join(base_path, file_name)
        print(f"Procesando {file_name}...")

        # Llama aquí a tus funciones de procesamiento de datos
        # Por ejemplo: data = read_data_from_file(file_path)
        # mean, median, mode, std_dev = tus funciones de cálculo de estadísticas

        # Simula resultados (reemplaza con tus cálculos reales)
        result = [file_name, len(data), mean, median, mode, std_dev, "variance", time.time() - start_time, datetime.now()]
        file_results.append(result)

    # Mostrar y guardar los resultados
    for row in file_results:
        print('\t'.join(map(str, row)))

    # Al final de tu función main, donde guardas los resultados
    result_file_path = os.path.join(base_path, 'StatisticsResults.txt')

    with open(result_file_path, 'w', encoding='utf-8') as f:
        # Escribir los encabezados
        f.write('\t'.join(headers) + '\n')
        # Escribir los datos
        for row in file_results:
            f.write('\t'.join(map(str, row)) + '\n')
    print(f"Results saved to {result_file_path}")

    # Medir y mostrar el tiempo transcurrido
    elapsed_time = time.time() - start_time
    print(f"Tiempo total transcurrido: {elapsed_time} segundos.")

# Ejecutar la función principal
if __name__ == "__main__":
    main()


Procesando TC1.txt...
Procesando TC2.txt...
Procesando TC3.txt...
Procesando TC4.txt...
Procesando TC5.txt...
Procesando TC6.txt...
Procesando TC7.txt...
TC1.txt	12767	2.474673954997149e+20	2.4664097307429e+20	1.57638329490099e+20	1.4460564700984703e+20	variance	0.00011301040649414062	2024-02-05 01:50:25.940450
TC2.txt	12767	2.474673954997149e+20	2.4664097307429e+20	1.57638329490099e+20	1.4460564700984703e+20	variance	0.00016045570373535156	2024-02-05 01:50:25.940487
TC3.txt	12767	2.474673954997149e+20	2.4664097307429e+20	1.57638329490099e+20	1.4460564700984703e+20	variance	0.00019216537475585938	2024-02-05 01:50:25.940518
TC4.txt	12767	2.474673954997149e+20	2.4664097307429e+20	1.57638329490099e+20	1.4460564700984703e+20	variance	0.00021982192993164062	2024-02-05 01:50:25.940545
TC5.txt	12767	2.474673954997149e+20	2.4664097307429e+20	1.57638329490099e+20	1.4460564700984703e+20	variance	0.0002465248107910156	2024-02-05 01:50:25.940573
TC6.txt	12767	2.474673954997149e+20	2.4664097307429e

Pasos para Analizar y Ajustar tu Código con PEP 8

In [101]:
!pip install pylint




Una vez que se tiene el script en un archivo .py, se puede usar pylint para analizarlo, ejecutando el siguiente comando:

In [102]:
!pylint /content/CalidadSoftware/mi_script.py


************* Module mi_script
CalidadSoftware/mi_script.py:12:0: C0303: Trailing whitespace (trailing-whitespace)
CalidadSoftware/mi_script.py:18:0: C0303: Trailing whitespace (trailing-whitespace)
CalidadSoftware/mi_script.py:29:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:33:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:34:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:35:0: W0311: Bad indentation. Found 5 spaces, expected 8 (bad-indentation)
CalidadSoftware/mi_script.py:36:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:37:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:38:0: W0311: Bad indentation. Found 1 spaces, expected 4 (bad-indentation)
CalidadSoftware/mi_script.py:42:0: W0311: Bad indentation. Found 1 spaces