### Descripción General: q1_memory(file_path)
- **Objetivo:**
  El script q1_memory.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para analizar la actividad diaria y determinar el usuario más activo por fecha, optimizando el uso de memoria.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `SMALL_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplean tres componentes principales:
  - **JsonChunkReader:** Se encarga de leer el archivo JSON por partes, facilitando el manejo de grandes volúmenes de datos.
  - **TweetAggregator:** Realiza la agregación de datos, como el conteo de tweets por fecha y por usuario.
  - **TweetAnalyzer:** Utiliza el lector y el agregador para analizar la información y determinar, entre otros resultados, cuál es el usuario más activo en las fechas de mayor actividad.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene la fecha y el nombre del usuario más activo en esa fecha. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q1_memory(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q1_memory(file_path)
1. **Inicialización de Componentes:**
   - Se crea una instancia de `JsonChunkReader` pasando la ruta del archivo (file_path) y el tamaño de fragmento (`SMALL_CHUNK_SIZE`).
   - Se instancia un objeto `TweetAggregator` que se encargará de agrupar y contar los datos.
   - Se crea un objeto `TweetAnalyzer` al que se le suministran el lector y el agregador, estableciendo así la conexión entre la lectura y el análisis de los datos.

2. **Análisis y Agregación de Datos:**
   - Se llama al método `analyze()` del objeto `TweetAnalyzer`. Este método procesa los datos del archivo en fragmentos, contando los tweets por fecha y determinando el usuario más activo de cada una de las 10 fechas con mayor actividad utilizando métodos de la clase `TweetAggregator`.

3. **Visualización y Retorno de Resultados:**
   - Los resultados, que consisten en una lista de tuplas `(fecha, usuario)`, se imprimen utilizando `pprint` para facilitar su visualización.
   - Finalmente, la función retorna estos resultados.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Facilitar el mantenimiento:** Separando la lógica en componentes específicos (lector, agregador y analizador).
- **Obtener resultados claros:** Retornando una lista donde cada tupla contiene la fecha y el nombre del usuario más activo en esa fecha.

In [1]:
%run q1_memory.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q1_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    17     96.1 MiB     96.1 MiB           1   @profile
    18                                         def q1_memory(file_path: str) -> List[Tuple[date, str]]:
    19                                             """
    20                                             CALL: q1_memory(file_path: str)
    21                                             DESCRIPTION: Processes a 

### Descripción General: q1_time(file_path)
- **Objetivo:**
  El script q1_time.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para analizar la actividad diaria y determinar el usuario más activo por fecha, optimizando el tiempo.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `MEDIUM_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplea el componente **TweetThreadAnalyzer** que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE` en fomra concurrente utilizando la librería `concurrent.futures`.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene la fecha y el nombre del usuario más activo en esa fecha. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q1_time(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q1_time(file_path)
1. **Determinación del número de workers:**
   - `num_workers = multiprocessing.cpu_count()`
   - Se obtiene el número de núcleos de CPU disponibles en el sistema, lo que permite definir cuántos hilos se utilizarán para el procesamiento en paralelo.

2. **Instanciación del Analizador:**
   - `analyzer = TweetThreadAnalyzer(file_path, MEDIUM_CHUNK_SIZE, num_workers)`
   - Se crea una instancia de la clase `TweetThreadAnalyzer`, que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE`.
   - El parámetro `file_path` indica la ruta del archivo a procesar.
   - `num_workers` se utiliza para configurar el número de hilos que se ejecutarán en paralelo, optimizando así el procesamiento.

3. **Análisis y Agregación de Datos:**
   - `results = analyzer.analyze()`
   - Se invoca el método `analyze()` del objeto `analyzer`, el cual procesa los datos en paralelo y agrega los resultados. Estos resultados incluyen la identificación de las fechas con mayor actividad y el usuario más activo en cada una de ellas.

4. **Visualización y Retorno de Resultados:**
   - `pprint(results, sort_dicts=False)`
   - Se utiliza `pprint` para imprimir los resultados de manera clara y ordenada.
   - Finalmente, la función retorna los resultados obtenidos.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Acelerar el procesamiento:** utiliza concurrencia para acelerar el procesamiento de grandes volúmenes de datos en un archivo JSON.
- **Obtener resultados claros:** Retornando una lista donde cada tupla contiene la fecha y el nombre del usuario más activo en esa fecha.

In [2]:
%run q1_time.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q1_time.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    15    117.6 MiB    117.6 MiB           1   @profile    
    16                                         def q1_time(file_path: str) -> List[Tuple[date, str]]:
    17                                             """
    18                                             CALL: q1_time(file_path: str)
    19                                             DESCRIPTION: Processes a JS

### Descripción General: q2_memory(file_path)
- **Objetivo:**
  El script q2_memory.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para procesar un archivo JSON y extraer los 10 emojis más utilizados, optimizando el uso de memoria.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `SMALL_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplean tres componentes principales:
  - **JsonChunkReader:** Se encarga de leer el archivo JSON por partes, facilitando el manejo de grandes volúmenes de datos.
  - **EmojiAggregator:** Realiza la agregación de datos, como el conteo emojis más utilizados.
  - **EmojiAnalyzer:** Utiliza el lector y el agregador para analizar la información y determinar los 10 emojis más utilizados con su respectivo conteo.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene el emoji y su respectivo conteo. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q2_memory(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q2_memory(file_path)
1. **Inicialización de Componentes:**
   - **`JsonChunkReader(file_path, SMALL_CHUNK_SIZE)`**  
     Se crea una instancia de `JsonChunkReader` que se encarga de leer el archivo JSON en fragmentos (chunks) pequeños, definidos por `SMALL_CHUNK_SIZE`. Esto permite manejar archivos de gran tamaño sin sobrecargar la memoria. 
   - **`EmojiAggregator()`**  
     Se instancia un objeto encargado de agrupar y contar los emojis extraídos del archivo. El agregador recopila las ocurrencias de cada emoji a medida que se procesan los fragmentos.
   - **`EmojiAnalyzer(reader, aggregator)`**  
     Se crea el analizador que utiliza el lector y el agregador para procesar el archivo. El analizador coordina la lectura y el conteo de emojis para finalmente identificar los 10 emojis más utilizados.

2. **Análisis y Agregación de Datos:**
   - **`results = analyzer.analyze()`**  
     Se llama al método `analyze()` del analizador. Este método procesa cada fragmento del archivo, utiliza el agregador para contar las ocurrencias de los emojis y finalmente devuelve una lista de tuplas. Cada tupla contiene un emoji (tipo `str`) y el número de veces que aparece (tipo `int`) utilizando métodos de la clase EmojiAggregator.

3. **Visualización y Retorno de Resultados:**
   - `pprint(results, sort_dicts=False)`
   - Se utiliza `pprint` para imprimir los resultados de manera clara y ordenada.
   - Finalmente, la función retorna los resultados obtenidos, una lista de tuplas `(emoji, conteo)`.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Facilitar el mantenimiento:** Separando la lógica en componentes específicos (lector, agregador y analizador).
- **Obtener resultados claros:** Retornando una lista de los emojis más populares y sus respectivas cantidades.

In [3]:
%run q2_memory.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[('🙏', 7286),
 ('😂', 3072),
 ('🚜', 2972),
 ('✊', 2411),
 ('🌾', 2363),
 ('🏻', 2080),
 ('❤', 1779),
 ('🤣', 1668),
 ('🏽', 1218),
 ('👇', 1108)]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q2_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    15    132.3 MiB    132.3 MiB           1   @profile
    16                                         def q2_memory(file_path: str) -> List[Tuple[str, int]]:
    17                                             """
    18                                             CALL: q2_memory(file_path: str)
    19                                             DESCRIPTION: Processes a JSON file to extract the top 10 most used emojis (Focus on optimizing memory).
    20                                             RESULT: List[Tuple[str, int]
    21                                             """
    22    132.3 MiB      0.0 MiB           1       reader = JsonChunkReader(file_path, SMALL_CHUNK_SIZE)
    23   

### Descripción General: q2_time(file_path)
- **Objetivo:**
  El script q2_time.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para procesar un archivo JSON y extraer los 10 emojis más utilizados, optimizando el tiempo.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `MEDIUM_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplea el componente **EmojiThreadAnalyzer** que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE` en fomra concurrente utilizando la librería `concurrent.futures`.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene el emoji y su respectivo conteo. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q2_time(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q2_time(file_path)
1. **Determinación del número de workers:**
   - `num_workers = multiprocessing.cpu_count()`
   - Se obtiene el número de núcleos de CPU disponibles en el sistema, lo que permite definir cuántos hilos se utilizarán para el procesamiento en paralelo.

2. **Instanciación del Analizador:**
   - `analyzer = EmojiThreadAnalyzer(file_path, MEDIUM_CHUNK_SIZE, num_workers)`
   - Se crea una instancia de la clase `EmojiThreadAnalyzer`, que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE`.
   - El parámetro `file_path` indica la ruta del archivo a procesar.
   - `num_workers` se utiliza para configurar el número de hilos que se ejecutarán en paralelo, optimizando así el procesamiento.

3. **Análisis y Agregación de Datos:**
   - `results = analyzer.analyze()`
   - Se invoca el método `analyze()` del objeto `analyzer`, el cual procesa los datos en paralelo y agrega los resultados. Estos resultados incluyen la identificación de los 10 emojis más utilizados con su respectivo conteo.

4. **Visualización y Retorno de Resultados:**
   - `pprint(results, sort_dicts=False)`
   - Se utiliza `pprint` para imprimir los resultados de manera clara y ordenada.
   - Finalmente, la función retorna los resultados obtenidos.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Acelerar el procesamiento:** utiliza concurrencia para acelerar el procesamiento de grandes volúmenes de datos en un archivo JSON.
- **Obtener resultados claros:** Retornando una lista donde cada tupla ccontiene el emoji y su respectivo conteo.

In [4]:
%run q2_time.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[('🙏', 7286),
 ('😂', 3072),
 ('🚜', 2972),
 ('✊', 2411),
 ('🌾', 2363),
 ('🏻', 2080),
 ('❤', 1779),
 ('🤣', 1668),
 ('🏽', 1218),
 ('👇', 1108)]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q2_time.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    15    228.8 MiB    228.8 MiB           1   @profile
    16                                         def q2_time(file_path: str) -> List[Tuple[str, int]]:
    17                                             """
    18                                             CALL: q2_time(file_path: str)
    19                                             DESCRIPTION: Processes a JSON file concurrently to extract the top 10 most used emojis (Focus on optimizing time).
    20                                             RESULT: List[Tuple[str, int]]
    21                                             """
    22    228.8 MiB      0.0 MiB           1       num_workers = multiprocessing.cpu_count()
    23    228.8

### Descripción General: q3_memory(file_path)
- **Objetivo:**
  El script q3_memory.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para procesar un archivo JSON con el fin de extraer los 10 usuarios más mencionados, optimizando el uso de memoria.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `SMALL_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplean tres componentes principales:
  - **JsonChunkReader:** Se encarga de leer el archivo JSON por partes, facilitando el manejo de grandes volúmenes de datos.
  - **UserAggregator:** Realiza la agregación de datos, como el conteo usuarios de los usuarios más mencionados.
  - **UserAnalyzer:** Utiliza el lector y el agregador para analizar la información y determinar los 10 usuarios más mencionados.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene el nombre del usuario y el conteo de las menciones. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q3_memory(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q3_memory(file_path)
1. **Inicialización de Componentes:**
   - **`JsonChunkReader(file_path, SMALL_CHUNK_SIZE)`**  
     Se crea una instancia de `JsonChunkReader` que se encarga de leer el archivo JSON en fragmentos (chunks) pequeños, definidos por `SMALL_CHUNK_SIZE`. Esto permite manejar archivos de gran tamaño sin sobrecargar la memoria.
     
   - **`UserAggregator()`**  
     Se instancia un objeto encargado de agrupar y contar las menciones de cada usuario a medida que se procesan los fragmentos. El agregador recopila los datos relevantes para luego identificar los usuarios más mencionados.
     
   - **`UserAnalyzer(reader, aggregator)`**  
     Se crea el analizador que utiliza el lector y el agregador para procesar el archivo. El analizador coordina la lectura y el conteo de usuarios para finalmente identificar los 10 usuarios con más menciones.
  
2. **Análisis y Agregación de Datos:**
   - **`results = analyzer.analyze()`**  
     Se llama al método `analyze()` del analizador. Este método procesa cada fragmento del archivo, utiliza el agregador para contar las ocurrencias de los usuarios y finalmente devuelve una lista de tuplas. Cada tupla contiene un usuario (tipo `str`) y el número de veces que aparece (tipo `int`) utilizando métodos de la clase UserAggregator.

3. **Visualización y Retorno de Resultados:**
   - `pprint(results, sort_dicts=False)`
   - Se utiliza `pprint` para imprimir los resultados de manera clara y ordenada.
   - Finalmente, la función retorna los resultados obtenidos, una lista de tuplas `(usuario, conteo)`.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Facilitar el mantenimiento:** Separando la lógica en componentes específicos (lector, agregador y analizador).
- **Obtener resultados claros:** Retornando una lista los 10 usuarios más mencionados y sus respectivos conteos.

In [5]:
%run q3_memory.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[('narendramodi', 2261),
 ('Kisanektamorcha', 1836),
 ('RakeshTikaitBKU', 1639),
 ('PMOIndia', 1422),
 ('RahulGandhi', 1125),
 ('GretaThunberg', 1046),
 ('RaviSinghKA', 1015),
 ('rihanna', 972),
 ('UNHumanRights', 962),
 ('meenaharris', 925)]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q3_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    16    151.6 MiB    151.6 MiB           1   @profile
    17                                         def q3_memory(file_path: str) -> List[Tuple[str, int]]:
    18                                             """
    19                                             CALL: q3_memory(file_path: str)
    20                                             DESCRIPTION: Processes a JSON file to extract the top 10 mentioned users (Focus on optimizing memory).
    21                                             RESULT: List[Tuple[str, int]
    22                                             """
    23    15

### Descripción General: q3_time(file_path)
- **Objetivo:**
  El script q3_time.py procesa un archivo JSON de tweets en "chunks" (fragmentos) para procesar un archivo JSON con el fin de extraer los 10 usuarios más mencionados, optimizando el tiempo.
  
- **Entrada:**  
  La función recibe la ruta al archivo JSON (`file_path`) y utiliza la constante `MEDIUM_CHUNK_SIZE` para definir el tamaño de los fragmentos (chunks) en los que se lee el archivo. Esto permite procesar archivos de gran tamaño sin sobrecargar la memoria.

- **Proceso:**  
  Se emplea el componente **UserThreadAnalyzer** que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE` en fomra concurrente utilizando la librería `concurrent.futures`.

- **Salida:**  
  El resultado es una lista de tuplas, donde cada tupla contiene el nombre del usuario y el conteo de las menciones. Además, el resultado se imprime en un formato legible mediante `pprint`.

### Detalle del Proceso
1. **Obtención de Argumentos y Configuración Inicial:**
   - Se obtienen los argumentos de la aplicación mediante `get_app_args()`, y se extrae la ruta del archivo (`file_path`).
   - Se llama a `gc.collect()` para forzar la recolección de basura y liberar memoria antes de iniciar el procesamiento.

2. **Inicio del Perfilado del Rendimiento:**
   - Se crea una instancia de `cProfile.Profile()` para medir el rendimiento.
   - Con `profiler.enable()` se activa el perfilador para comenzar a recopilar datos de ejecución del código.

3. **Procesamiento del Archivo:**
   - Se llama a la función `q3_time(file_path)`, la cual procesa el archivo JSON para obtener, por ejemplo, el usuario más activo en las 10 fechas con mayor actividad, optimizando el uso de la memoria mediante el procesamiento por fragmentos.

4. **Finalización del Perfilado y Visualización de Estadísticas:**
   - Una vez finalizado el procesamiento, se desactiva el perfilador con `profiler.disable()`.
   - Se llama a `get_stats_in_memory(profiler)` para mostrar o procesar las estadísticas obtenidas durante la ejecución.

5. **Manejo de Errores y Limpieza Final:**
   - Si ocurre alguna excepción, se captura en el bloque `except` y se registra un mensaje de error detallado mediante `logging.error()`, incluyendo información completa de la excepción.
   - Finalmente, en el bloque `finally`, se vuelve a llamar a `gc.collect()` para asegurar que la memoria se libere de manera adecuada.

### Detalle en la función q3_time(file_path)
1. **Determinación del número de workers:**
   - `num_workers = multiprocessing.cpu_count()`
   - Se obtiene el número de núcleos de CPU disponibles en el sistema, lo que permite definir cuántos hilos se utilizarán para el procesamiento en paralelo.

2. **Instanciación del Analizador:**
   - `analyzer = UserThreadAnalyzer(file_path, MEDIUM_CHUNK_SIZE, num_workers)`
   - Se crea una instancia de la clase `UserThreadAnalyzer`, que se encarga de leer y procesar el archivo JSON en fragmentos de tamaño definido por `MEDIUM_CHUNK_SIZE`.
   - El parámetro `file_path` indica la ruta del archivo a procesar.
   - `num_workers` se utiliza para configurar el número de hilos que se ejecutarán en paralelo, optimizando así el procesamiento.

3. **Análisis y Agregación de Datos:**
   - `results = analyzer.analyze()`
   - Se invoca el método `analyze()` del objeto `analyzer`, el cual procesa los datos en paralelo y agrega los resultados. Estos resultados incluyen la identificación de los 10 usuarios más mencionados con su respectivo conteo.

4. **Visualización y Retorno de Resultados:**
   - `pprint(results, sort_dicts=False)`
   - Se utiliza `pprint` para imprimir los resultados de manera clara y ordenada.
   - Finalmente, la función retorna los resultados obtenidos.

## Resumen
Este código sigue un enfoque modular para:
- **Optimizar el uso de memoria:** Al procesar el archivo JSON en pequeños fragmentos.
- **Acelerar el procesamiento:** utiliza concurrencia para acelerar el procesamiento de grandes volúmenes de datos en un archivo JSON.
- **Obtener resultados claros:** Retornando una lista donde cada tupla contiene el nombre del usuario y el conteo de las menciones.

In [6]:
%run q3_time.py -file_path="large_files/farmers-protest-tweets-2021-2-4.json"

[('narendramodi', 2261),
 ('Kisanektamorcha', 1836),
 ('RakeshTikaitBKU', 1639),
 ('PMOIndia', 1422),
 ('RahulGandhi', 1125),
 ('GretaThunberg', 1046),
 ('RaviSinghKA', 1015),
 ('rihanna', 972),
 ('UNHumanRights', 962),
 ('meenaharris', 925)]
Filename: C:\Users\Monica Zorrilla\Documents\AdaInformaticsLab\latam-challenge\src\q3_time.py

Line #    Mem usage    Increment  Occurrences   Line Contents
    15    267.6 MiB    267.6 MiB           1   @profile
    16                                         def q3_time(file_path: str) -> List[Tuple[str, int]]:
    17                                             """
    18                                             CALL: q3_time(file_path: str)
    19                                             DESCRIPTION: Processes a JSON file to extract the top 10 mentioned users (Focus on optimizing time).
    20                                             RESULT: List[Tuple[str, int]
    21                                             """
    22    267.6 MiB 