# Challenge: Análisis de reseñas de Amazon

Planteamiento del problema:
Imagina que trabajas en Amazon. Te han asignado a la división de análisis de datos de producto.

El trabajo de esta división es crucial, una de sus labores principales es recopilar los datos necesarios para implementar un sistema de recomendación de productos.

El equipo que implementará el modelo necesita que generemos el código para realizar 5 tareas de consulta. Prepara el código para que puedan realizar esas tareas:

1. Obtener el año en el que tuvimos más reseñas (tip: las fechas están como tipo texto, puedes utilizar `regex`).
2. Obtener únicamente las reseñas del año obtenido en el punto 1.
3. Filtrar las reseñas para quedarnos únicamente con las calificaciones más altas (overall: 5) y las más bajas (overall: 1).
4. Mediante un aggregation, obtener las reseñas "neutrales" (overall: 3) y añadir un campo extra al resultado con el formato: `label: "neutral"`. **NO ESCRIBAS EL VALOR EN LA BASE DE DATOS, SOLO DEBE APARECER EN EL RESULTADO DE LA CONSULTA**
5. Obtener el título (summary) y el nombre del autor (reviewerName), de las reseñas con mejores calificaciones (overall: 5).

## Instrucciones:

- Escribe el código para las tareas antes mencionadas.
- Utiliza la base de datos `master-data` presente en nuestro cluster y la colección `amazon`.
- Realiza cada tarea en un bloque diferente de código, es decir, no es necesario obtener un solo resultado, más bien, obtendrás un resultado distinto en cada tarea.

# Paquetes a utilizar

In [None]:
"""Mongo & Utilities"""
!pip install dnspython
!pip install pymongo[srv]
import dns
from pymongo import MongoClient
import pandas as pd
import json

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting dnspython
  Downloading dnspython-2.2.1-py3-none-any.whl (269 kB)
[K     |████████████████████████████████| 269 kB 4.1 MB/s 
[?25hInstalling collected packages: dnspython
Successfully installed dnspython-2.2.1
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


# Obtener el año en el que tuvimos más reseñas.



In [None]:
# Tu código aquí
client = MongoClient('')

db = client['master-data']
coll=db['amazon']

#Get the year w most reviews
list(coll.find({}).limit(1))

results = coll.aggregate(
    [
     {
      '$addFields': 
      {
       'year': 
        {
         '$arrayElemAt': [ { '$split': ["$reviewTime", " "] }, 2 ]
        }
      }
     },
     {
      '$group':
      {
       '_id': '$year',
       'n_reviews': {'$sum': 1}
      }
     },
     {
      '$sort':
      {
       'n_reviews': -1
      }
     }
    ]
)
list(results)

[{'_id': '2013', 'n_reviews': 4055},
 {'_id': '2014', 'n_reviews': 2679},
 {'_id': '2012', 'n_reviews': 1936},
 {'_id': '2011', 'n_reviews': 1007},
 {'_id': '2010', 'n_reviews': 350},
 {'_id': '2009', 'n_reviews': 128},
 {'_id': '2008', 'n_reviews': 63},
 {'_id': '2007', 'n_reviews': 22},
 {'_id': '2006', 'n_reviews': 10},
 {'_id': '2004', 'n_reviews': 7},
 {'_id': '2005', 'n_reviews': 4}]

# Obtener únicamente las reseñas del año con más reseñas.



In [None]:
# Tu código aquí

list(coll.find({"reviewTime": {"$regex": "2013"}}).limit(3))

[{'_id': ObjectId('60ac3be5a0f981616012e9dc'),
  'reviewerID': 'AKSFZ4G1AXYFC',
  'asin': 'B000068NSX',
  'reviewerName': 'C.E. "Frank"',
  'helpful': [0, 0],
  'reviewText': "This Fender cable is the perfect length for me! Sometimes I find it a bit too long but I don't mind. The build quality is great and I know that it will last. The only gripe I have with this cable is that the metal sleeve gets unscrewed way too easily, requiring me to tighten it often.Sound quality is not affected, and the color is cool, definitely try this cable out.",
  'overall': 4,
  'summary': 'Durable Instrument Cable',
  'unixReviewTime': 1376352000,
  'reviewTime': '08 13, 2013'},
 {'_id': ObjectId('60ac3be5a0f981616012e9de'),
  'reviewerID': 'A2EZWZ8MBEDOLN',
  'asin': 'B000068NSX',
  'reviewerName': 'Charlo',
  'helpful': [3, 3],
  'reviewText': "I've been using these cables for more than 4 months and they are holding up pretty well.  For years I used seemingly indestructable guitar cables that were made

# Filtrar las reseñas para quedarnos únicamente con las calificaciones más altas y las más bajas.

In [None]:
# Tu código aquí

# Mediante un aggregation, obtener las reseñas "neutrales" y etiquetarlas como "neutral" en el resultado de la consulta.

In [None]:
# Tu código aquí

# Obtener el título y el nombre del autor, de las reseñas con mejores calificaciones.

In [None]:
# Tu código aquí