En este archivo puedes escribir lo que estimes conveniente. Te recomendamos detallar tu solución y todas las suposiciones que estás considerando. Aquí puedes ejecutar las funciones que definiste en los otros archivos de la carpeta src, medir el tiempo, memoria, etc.

In [None]:
## Introducción

Este proyecto tiene como objetivo resolver un conjunto de tres preguntas relacionadas con el procesamiento y análisis de datos a partir de un archivo JSON. Las preguntas están relacionadas con la medición del tiempo de ejecución y el uso de memoria de las funciones, utilizando herramientas de análisis como `time` y `memory_profiler`.

A continuación, se describen las pruebas realizadas para cada pregunta, así como el flujo general de ejecución de las funciones que se desarrollaron para cada una de ellas.



In [None]:
## Suposiciones

1. El archivo JSON es accesible a través de Google Drive mediante un enlace de descarga.
2. La estructura del JSON es apropiada para las operaciones que se van a realizar (por ejemplo, las funciones de 'q3' requieren un campo específico para el análisis de palabras más frecuentes).
3. Las pruebas se ejecutan en un entorno local y los resultados de las métricas de tiempo y memoria son válidos para las condiciones del entorno.


In [None]:
## Flujo de Ejecución

1. **Descarga del JSON**: Al ejecutar el código, el archivo JSON es descargado automáticamente desde Google Drive si no se encuentra en la ubicación esperada ('data.json'). Esto se realiza utilizando la función `download_json()` que se encuentra en el archivo `download_json.py`.

2. **Ejecución de las Pruebas**: Las tres preguntas (Q1, Q2, Q3) se resuelven ejecutando las funciones correspondientes:
    - **Q1 (time)**: Mide el tiempo de ejecución de una función relacionada con el análisis de datos.
    - **Q1 (memory)**: Mide la memoria utilizada por la misma función en la pregunta Q1.
    - **Q2 (time)**: Realiza una prueba similar para otra función de análisis.
    - **Q2 (memory)**: Mide la memoria utilizada por la función correspondiente.
    - **Q3 (time)**: Analiza el procesamiento de palabras más frecuentes en el archivo JSON, midiendo el tiempo.
    - **Q3 (memory)**: Mide la memoria utilizada en la ejecución de la función que analiza las palabras más frecuentes.

3. **Medición del Tiempo y Memoria**: Para cada prueba, se utilizan las herramientas 'time' para medir el tiempo de ejecución y 'memory_profiler' para monitorear el uso de memoria.

4. **Resultados**: Los resultados de tiempo y memoria de cada prueba se almacenan en una tabla que es presentada al final del proceso, utilizando la librería 'tabulate' para una visualización clara.


In [None]:
## Código Principal

El código principal en el archivo 'main.py' sigue el siguiente flujo:

1. **Verificación de la existencia del archivo JSON**: Al principio, se verifica si el archivo 'data.json' ya existe en el directorio de trabajo. Si no es así, se descarga desde Google Drive.
   
2. **Ejecutar las pruebas (Q1, Q2, Q3)**: Para cada una de las preguntas (Q1, Q2, Q3), se ejecutan las funciones correspondientes tanto para medir el tiempo como el uso de memoria.

3. **Almacenamiento de Resultados**: Los resultados de tiempo y memoria se almacenan en una lista 'results', que se convierte en una tabla al final de la ejecución utilizando 'tabulate'.

4. **Mostrar la tabla con los resultados**: La tabla resultante se muestra en formato Markdown, lo que facilita la visualización y comparación de los tiempos de ejecución y la memoria utilizada por cada prueba.

In [None]:
#Configuración del entorno
import os
import time
from memory_profiler import memory_usage
from tabulate import tabulate
from src.q1_time import q1_time
from src.q1_memory import q1_memory
from src.q2_time import q2_time
from src.q2_memory import q2_memory
from src.q3_time import q3_time
from src.q3_memory import q3_memory
import src.download_json 

: 

In [None]:
 # Ruta para el archivo JSON descargado
json_path = os.path.join(os.getcwd(), 'data.json')

# Verificar si el archivo ya existe
if not os.path.exists(json_path):
    print("Descargando archivo JSON...")
    src.download_json  # Esto ejecutará el script `download_json.py`
else:
    print(f"Archivo JSON encontrado en: {json_path}")

In [None]:
# Definir variables y tabla de resultados
# Número de palabras más frecuentes para Q3
top_n = 10  # Puedes ajustar este número según sea necesario

# Tabla de resultados
results = []

In [None]:
# Funciones a evaluar
tests = [
    ("Q1 (time)", q1_time, [json_path]),
    ("Q1 (memory)", q1_memory, [json_path]),
    ("Q2 (time)", q2_time, [json_path]),
    ("Q2 (memory)", q2_memory, [json_path]),
    ("Q3 (time)", q3_time, [json_path, top_n]),
    ("Q3 (memory)", q3_memory, [json_path, top_n])
]


In [None]:
# Ejecución de pruebas
for test_name, func, args in tests:
    print(f"\nEjecutando {test_name}...")

    # Medir tiempo y memoria
    start_time = time.time()
    mem_usage = memory_usage((func, args), interval=0.1, timeout=None)
    end_time = time.time()
    
    exec_time = end_time - start_time
    peak_memory = max(mem_usage)  # Memoria máxima usada

    # Ejecutar la función para obtener el resultado
    result = func(*args)
    print(f"Resultado {test_name}: {result}")

    # Almacenar resultados
    results.append([test_name, f"{exec_time:.2f} s", f"{peak_memory:.2f} MB"])

In [None]:
 # Mostrar la tabla con tabulate
headers = ["Prueba", "Tiempo de Ejecución", "Memoria Máxima"]
print("\nResultados:")
print(tabulate(results, headers=headers, tablefmt="github"))

In [None]:
Ejemplo de Salida

| Prueba       | Tiempo de Ejecución | Memoria Máxima |
|--------------|---------------------|----------------|
| Q1 (time)    | 0.25 s              | 15.56 MB       |
| Q1 (memory)  | 0.26 s              | 16.03 MB       |
| Q2 (time)    | 0.12 s              | 12.04 MB       |
| Q2 (memory)  | 0.13 s              | 12.10 MB       |
| Q3 (time)    | 0.35 s              | 18.40 MB       |
| Q3 (memory)  | 0.36 s              | 18.55 MB       |


: 

In [None]:
Conclusión:
    
Este proyecto proporciona una forma eficiente de medir tanto el tiempo como el uso de memoria de las funciones que trabajan con un archivo JSON. Las funciones fueron evaluadas de forma independiente y sus métricas fueron comparadas para identificar posibles mejoras. Además, la automatización del proceso de descarga del archivo JSON facilita la repetibilidad de las pruebas en diferentes entornos.

Mejoras Posibles:
 - Optimización del uso de memoria: Se podrían investigar maneras de reducir la memoria utilizada en las funciones más pesadas.
 - Pruebas adicionales: Se pueden agregar más preguntas para analizar otras métricas del archivo JSON.
 - Mejoras en la visualización: La tabla de resultados podría mejorarse con más detalles, como una comparación entre diferentes versiones de las funciones.

In [None]:
Referencias
 - time: Librería estándar de Python para medir el tiempo de ejecución de código.
 - memory_profiler: Librería para monitorear el uso de memoria de los procesos de Python.
 - tabulate: Librería para presentar tablas en formato Markdown y otros formatos.