Instrucciones para ejecutar el código
Clona el repositorio:

bash
Copiar código
git clone https://github.com/tu_usuario/LATAM-CHALLENGE.git
cd LATAM-CHALLENGE
Descarga el archivo JSON desde este enlace.

Descomprime el archivo ZIP descargado y coloca el archivo JSON en la carpeta LATAM-CHALLENGE.

# Proyecto: Análisis de Tweets

## Descripción del Proyecto
En este proyecto, realizaremos un análisis de datos a partir de un conjunto de tweets almacenados en un archivo JSON. Las tareas incluirán la optimización del procesamiento de datos y la generación de informes sobre la actividad de los usuarios en Twitter.

## Workflow
Utilizaremos **Gitflow** como nuestro flujo de trabajo para la gestión de versiones y el desarrollo del proyecto. Las principales ramas que se han creado son:

- **main**: Esta es la rama principal que contiene la versión estable del proyecto.
- **develop**: Esta rama es la base para el desarrollo de nuevas características. Todos los cambios se integrarán aquí antes de ser enviados a la rama principal.
  
Para cada nueva característica o función, se creará una rama de desarrollo específica (`feature/<nombre-de-la-funcion>`). Esto permitirá un desarrollo organizado y la posibilidad de trabajar en múltiples funciones simultáneamente sin interferencias.

## Estructura del Proyecto
- **main**: Contiene la versión estable del proyecto.
- **develop**: Rama para integrar nuevas características.
- **feature/**: Ramas individuales para el desarrollo de funciones específicas.

## Tecnologías Utilizadas
- Python: Lenguaje de programación principal.
- Pandas: Librería para la manipulación y análisis de datos.
- Git: Sistema de control de versiones.
- Gitflow: Modelo de ramificación para gestionar el flujo de trabajo.


# Optimización de Tiempo: Función `count_dates_and_users`

## Descripción
La función `count_dates_and_users` se encarga de procesar un archivo JSON que contiene registros de tweets y extraer información sobre la actividad de los usuarios en función de las fechas. El objetivo principal de esta función es optimizar el tiempo de ejecución al utilizar estructuras de datos eficientes y un enfoque de procesamiento línea por línea.

## Detalles de Implementación

### Importaciones
La función utiliza las siguientes librerías:
- `os`: Para manejar rutas de archivos.
- `json`: Para cargar los registros de tweets en formato JSON.
- `time`: Para medir el tiempo de ejecución.
- `Counter` de `collections`: Para contar la cantidad de tweets por usuario en cada fecha.
- `datetime`: Para manejar las fechas de manera adecuada.

### Proceso
1. **Inicialización**: Se inicializa un diccionario `date_user_counter` para contar la cantidad de tweets por usuario en cada fecha.
  
2. **Lectura del Archivo**: Se lee el archivo línea por línea. Cada línea se procesa como un objeto JSON:
   - Se extraen la fecha y el nombre de usuario.
   - La fecha se simplifica a solo la parte de la fecha (sin la hora).
   - Se utiliza `Counter` para llevar un registro de la cantidad de tweets por usuario en cada fecha.

3. **Manejo de Errores**: Se implementa un manejo de errores para ignorar líneas que no se puedan decodificar como JSON.

4. **Cálculo de Resultados**:
   - Se obtienen las 10 fechas más comunes y la suma de tweets por usuario en cada fecha.
   - Para cada una de estas fechas, se determina el usuario más activo.

5. **Tiempo de Ejecución**: Se mide el tiempo total que toma ejecutar la función.

### Salida
La función retorna dos valores:
- Una lista de tuplas que contiene las 10 fechas más comunes junto con el usuario más activo en esas fechas.
- El tiempo de ejecución de la función.

### Ejecución
Finalmente, se llama a la función pasando la ruta del archivo JSON como argumento y se imprimen los resultados.

## Conclusión
Esta implementación permite optimizar el procesamiento de grandes volúmenes de datos de tweets, reduciendo significativamente el tiempo de ejecución en comparación con enfoques más ineficientes.


In [19]:


import subprocess
# Ruta del script que deseas ejecutar
script_path = './q1_time.py'

# Ejecuta el script
result = subprocess.run(['python', script_path], capture_output=True, text=True)

# Imprime la salida del script
print('Salida estándar:')
print(result.stdout)

# Imprime errores si los hay
print('Errores:')
print(result.stderr)






Salida estándar:
Top 10 fechas mas comunes con el usuario mas activo:
[(datetime.date(2021, 2, 12), 'RanbirS00614606'), (datetime.date(2021, 2, 13), 'MaanDee08215437'), (datetime.date(2021, 2, 17), 'RaaJVinderkaur'), (datetime.date(2021, 2, 16), 'jot__b'), (datetime.date(2021, 2, 14), 'rebelpacifist'), (datetime.date(2021, 2, 18), 'neetuanjle_nitu'), (datetime.date(2021, 2, 15), 'jot__b'), (datetime.date(2021, 2, 20), 'MangalJ23056160'), (datetime.date(2021, 2, 23), 'Surrypuria'), (datetime.date(2021, 2, 19), 'Preetm91')]
Tiempo de ejecucion : 3.7000 segundos

Errores:

