# Challenge para LATAM - Juan Jos√© Valenzuela A

## Primera Funci√≥n q1_memory.py

### Estrategia

Para darle un enfoque de optimizaci√≥n de uso de memoria utilic√© la siguiente estrategia:

- **Carga progresiva de datos:** Leo el archivo JSON l√≠nea por l√≠nea y cargo cada l√≠nea como un objeto JSON individual. Esto significa que solo una peque√±a parte del archivo se mantiene en memoria a la vez, en lugar de cargar el archivo completo.

- **Uso eficiente de la memoria:** A medida que proceso cada tweet, guardo los datos en listas temporales. Estos objetos usan memoria, pero al procesar l√≠nea por l√≠nea e ir actualizando la cuenta a medida que se procesa cada tweet, se evita guardar muchos datos redundantes en memoria.

- **No se guardan en memoria todos los tweets a la vez:** Al procesar los tweets uno por uno no es necesario almacenarlos todos en memoria.

In [3]:
from q1_memory import q1_memory

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q1_memory(file_path)

# Muestro los resultados
print('Top 10 fechas con m√°s tweets y usuarios con m√°s publicaciones en dichas fechas')
for fecha, usuario in resultados:
    print(f'Fecha: {fecha}, Usuario con m√°s publicaciones: {usuario}')

Top 10 fechas con m√°s tweets y usuarios con m√°s publicaciones en dichas fechas
Fecha: 2021-02-12, Usuario con m√°s publicaciones: RanbirS00614606
Fecha: 2021-02-13, Usuario con m√°s publicaciones: MaanDee08215437
Fecha: 2021-02-17, Usuario con m√°s publicaciones: RaaJVinderkaur
Fecha: 2021-02-16, Usuario con m√°s publicaciones: jot__b
Fecha: 2021-02-14, Usuario con m√°s publicaciones: rebelpacifist
Fecha: 2021-02-18, Usuario con m√°s publicaciones: neetuanjle_nitu
Fecha: 2021-02-15, Usuario con m√°s publicaciones: jot__b
Fecha: 2021-02-20, Usuario con m√°s publicaciones: MangalJ23056160
Fecha: 2021-02-23, Usuario con m√°s publicaciones: Surrypuria
Fecha: 2021-02-19, Usuario con m√°s publicaciones: Preetm91


## Segunda Funci√≥n q1_time.py

### Estrategia

Para darle un enfoque de optimizaci√≥n de tiempo de ejecuci√≥n utilic√© la librer√≠a Pandas, que no se preocupa por memoria ya que carga todo el archivo dentro de un dataframe, pero termin√≥ siendo 10 veces m√°s lenta que la versi√≥n que optimiza la memoria. Voy a dejar este ejercicio hasta ac√° para poder terminar los siguientes. Si me queda tiempo al final probar√© alguna otra librer√≠a que no cuida la memoria y que pudiera dar un resultado m√°s r√°pido.


In [2]:
from q1_time import q1_time

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q1_time(file_path)

# Muestro los resultados
print('Top 10 fechas con m√°s tweets y usuarios con m√°s publicaciones en dichas fechas')
for fecha, usuario in resultados:
    print(f'Fecha: {fecha}, Usuario con m√°s publicaciones: {usuario}')

Top 10 fechas con m√°s tweets y usuarios con m√°s publicaciones en dichas fechas
Fecha: 2021-02-12, Usuario con m√°s publicaciones: RanbirS00614606
Fecha: 2021-02-13, Usuario con m√°s publicaciones: MaanDee08215437
Fecha: 2021-02-17, Usuario con m√°s publicaciones: RaaJVinderkaur
Fecha: 2021-02-16, Usuario con m√°s publicaciones: jot__b
Fecha: 2021-02-14, Usuario con m√°s publicaciones: rebelpacifist
Fecha: 2021-02-18, Usuario con m√°s publicaciones: neetuanjle_nitu
Fecha: 2021-02-15, Usuario con m√°s publicaciones: jot__b
Fecha: 2021-02-20, Usuario con m√°s publicaciones: MangalJ23056160
Fecha: 2021-02-23, Usuario con m√°s publicaciones: Surrypuria
Fecha: 2021-02-19, Usuario con m√°s publicaciones: Preetm91


## Tercera Funci√≥n q2_memory.py

### Estrategia

Para darle un enfoque de optimizaci√≥n de uso de memoria utilic√© la siguiente estrategia:

Leo el archivo JSON l√≠nea por l√≠nea y cargo cada l√≠nea como un objeto JSON individual. Esto significa que solo una peque√±a parte del archivo se mantiene en memoria a la vez, en lugar de cargar el archivo completo. A medida que proceso cada tweet, voy actualizando la cuenta. El contenido de los tweets se libera. Utilizo una librer√≠a que permite obtener de cada tweet el listado de los emojis utilizados

In [3]:
from q2_memory import q2_memory

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q2_memory(file_path)
print("Top 10 emojis m√°s usados (versi√≥n memoria):", resultados)


Top 10 emojis m√°s usados (versi√≥n memoria): [('üôè', 5049), ('üòÇ', 3072), ('üöú', 2972), ('üåæ', 2182), ('üáÆüá≥', 2086), ('ü§£', 1668), ('‚úä', 1651), ('‚ù§Ô∏è', 1382), ('üôèüèª', 1317), ('üíö', 1040)]


## Cuarta Funci√≥n q2_time.py

### Estrategia
Cargo el JSON de manera laxa de forma que los emojis siguen estando en formato de texto regular \uxxxx y los proceso como texto. Esto le dio una velocidad extra mayor.

In [1]:
from q2_time import q2_time

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q2_time(file_path)
print("Top 10 emojis m√°s usados (versi√≥n tiempo):", resultados)


Top 10 emojis m√°s usados (versi√≥n tiempo): [('\\u093e', 136407), ('\\u0915', 103251), ('\\u0930', 82951), ('\\u0947', 82298), ('\\u0928', 71288), ('\\u0a3e', 66686), ('\\u0940', 60947), ('\\u0939', 59961), ('\\u0938', 54650), ('\\u093f', 53414)]


## Quinta Funci√≥n q3_memory.py

### Estrategia
Recorro el archivo l√≠nea por l√≠nea y cuento las menciones por cada usuario

In [2]:
from q3_memory import q3_memory

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q3_memory(file_path)
print(resultados)

[('narendramodi', 2265), ('Kisanektamorcha', 1840), ('RakeshTikaitBKU', 1644), ('PMOIndia', 1427), ('RahulGandhi', 1146), ('GretaThunberg', 1048), ('RaviSinghKA', 1019), ('rihanna', 986), ('UNHumanRights', 962), ('meenaharris', 926)]


## Sexta Funci√≥n q3_time.py

### Estrategia
Recorro el archivo l√≠nea por l√≠nea y cuento las menciones por cada usuario

In [3]:
from q3_time import q3_time

# Ejemplo de como llamo la funci√≥n para probar su funcionamiento

#Defino la ruta del archivo en una variable
file_path = r'c:\Software\latam_challenge\farmers-protest-tweets-2021-2-4.json'

# Llamo a la funci√≥n con la ruta del archivo JSON
resultados = q3_time(file_path)
print(resultados)

[('narendramodi', 2265), ('Kisanektamorcha', 1840), ('RakeshTikaitBKU', 1644), ('PMOIndia', 1427), ('RahulGandhi', 1146), ('GretaThunberg', 1048), ('RaviSinghKA', 1019), ('rihanna', 986), ('UNHumanRights', 962), ('meenaharris', 926)]
