# Challenge: Análisis de reseñas de Amazon

¡Hola científica/científico de datos! Aquí tienes el challenge de esta clase.

Planteamiento del problema:
Imagina que trabajas en Amazon. Te han asignado a la división de análisis de datos de producto.

El trabajo de esta división es crucial, una de sus labores principales es recopilar los datos necesarios para implementar un sistema de recomendación de productos.

El equipo que implementará el modelo necesita que generemos el código para realizar 5 tareas de consulta. Prepara el código para que puedan realizar esas tareas:

1. Obtener el año en el que tuvimos más reseñas (tip: las fechas están como tipo texto, puedes utilizar `regex`).
2. Obtener únicamente las reseñas del año obtenido en el punto 1.
3. Filtrar las reseñas para quedarnos únicamente con las calificaciones más altas (overall: 5) y las más bajas (overall: 1).
4. Mediante un aggregation, obtener las reseñas "neutrales" (overall: 3) y añadir un campo extra al resultado con el formato: `label: "neutral"`. **NO ESCRIBAS EL VALOR EN LA BASE DE DATOS, SOLO DEBE APARECER EN EL RESULTADO DE LA CONSULTA**
5. Obtener el título (summary) y el nombre del autor (reviewerName), de las reseñas con mejores calificaciones (overall: 5).

## Instrucciones:

- Escribe el código para las tareas antes mencionadas.
- Utiliza la base de datos `master-data` presente en nuestro cluster y la colección `amazon`.
- Realiza cada tarea en un bloque diferente de código, es decir, no es necesario obtener un solo resultado, más bien, obtendrás un resultado distinto en cada tarea.

# Paquetes a utilizar

In [None]:
"""Mongo & Utilities"""
# Si quieres ejecutar este notebook localmente o te lanza error colab,
# puedes instalar las dependencias manualmente con los siguientes comandos
!pip install dnspython
!pip install pymongo[srv]
import dns
from pymongo import MongoClient
import pandas as pd
import json

Collecting dnspython
  Downloading dnspython-2.1.0-py3-none-any.whl (241 kB)
[?25l[K     |█▍                              | 10 kB 22.5 MB/s eta 0:00:01[K     |██▊                             | 20 kB 27.2 MB/s eta 0:00:01[K     |████                            | 30 kB 30.7 MB/s eta 0:00:01[K     |█████▍                          | 40 kB 32.2 MB/s eta 0:00:01[K     |██████▊                         | 51 kB 33.1 MB/s eta 0:00:01[K     |████████▏                       | 61 kB 34.3 MB/s eta 0:00:01[K     |█████████▌                      | 71 kB 25.2 MB/s eta 0:00:01[K     |██████████▉                     | 81 kB 25.2 MB/s eta 0:00:01[K     |████████████▏                   | 92 kB 25.6 MB/s eta 0:00:01[K     |█████████████▌                  | 102 kB 27.0 MB/s eta 0:00:01[K     |███████████████                 | 112 kB 27.0 MB/s eta 0:00:01[K     |████████████████▎               | 122 kB 27.0 MB/s eta 0:00:01[K     |█████████████████▋              | 133 kB 27.0 MB/s e

In [None]:
client = MongoClient('mongodb+srv://omar:5dam6bAH4qW5dB3m@cluster0.ivgnl.mongodb.net/test')

In [None]:
db = client['master-data']
coll = db['amazon']

# Obtener el año en el que tuvimos más reseñas.



In [None]:
list(coll.find({}).limit(1))

[{'_id': ObjectId('60ac3be5a0f981616012e9d4'),
  'asin': 'B00004Y2UT',
  'helpful': [0, 0],
  'overall': 5,
  'reviewText': 'Perfect for my Epiphone Sheraton II.  Monster cables are well constructed.  I have several and never had any problems with any of them over the years.  Got this one because I wanted the 90 degree plug.',
  'reviewTime': '07 6, 2008',
  'reviewerID': 'A3M1PLEYNDEYO8',
  'reviewerName': 'G. Thomas "Tom"',
  'summary': 'Great cable',
  'unixReviewTime': 1215302400}]

In [None]:
results = coll.aggregate(
    [
     {
      '$addFields': 
      {
       'year': 
        {
         '$arrayElemAt': [ { '$split': ["$reviewTime", " "] }, 2 ]
        }
      }
     },
     {
      '$group':
      {
       '_id': '$year',
       'n_reviews': {'$sum': 1}
      }
     },
     {
      '$sort':
      {
       'n_reviews': -1
      }
     }
    ]
)
list(results)

[{'_id': '2013', 'n_reviews': 4055},
 {'_id': '2014', 'n_reviews': 2679},
 {'_id': '2012', 'n_reviews': 1936},
 {'_id': '2011', 'n_reviews': 1007},
 {'_id': '2010', 'n_reviews': 350},
 {'_id': '2009', 'n_reviews': 128},
 {'_id': '2008', 'n_reviews': 63},
 {'_id': '2007', 'n_reviews': 22},
 {'_id': '2006', 'n_reviews': 10},
 {'_id': '2004', 'n_reviews': 7},
 {'_id': '2005', 'n_reviews': 4}]

# Obtener únicamente las reseñas del año con más reseñas.



In [None]:
list(coll.find({"reviewTime": {"$regex": "2013"}}).limit(3))

[{'_id': ObjectId('60ac3be5a0f981616012e9ed'),
  'asin': 'B000068NVI',
  'helpful': [0, 0],
  'overall': 5,
  'reviewText': 'This was exactly what I was after. I have a voice touch and needed a small cord to connect the mic to the voice touch and this was perfect. Before I used a 20 foot cord to go about 12 inches. I highly recommend this for those who keep the mic on a stand and have a voice touch or other stand connected device for vocals.',
  'reviewTime': '09 16, 2013',
  'reviewerID': 'A2074KEJGRYJV4',
  'reviewerName': 'hcross',
  'summary': 'Great little cord',
  'unixReviewTime': 1379289600},
 {'_id': ObjectId('60ac3be5a0f981616012e9f4'),
  'asin': 'B000068NVI',
  'helpful': [0, 0],
  'overall': 5,
  'reviewText': 'Nice solid cables, with excellent support at the ends.  Should last a lifetime of usage no problem and just what I needed to connect my tube preamp.',
  'reviewTime': '06 29, 2013',
  'reviewerID': 'AQQ91U1U4YKDF',
  'reviewerName': 'Vince Lewis "Vince"',
  'summary'

# Filtrar las reseñas para quedarnos únicamente con las calificaciones más altas y las más bajas.

In [None]:
list(coll.find({"overall": {'$in':[1,5]}}).limit(3))

[{'_id': ObjectId('60ac3be5a0f981616012e9d4'),
  'asin': 'B00004Y2UT',
  'helpful': [0, 0],
  'overall': 5,
  'reviewText': 'Perfect for my Epiphone Sheraton II.  Monster cables are well constructed.  I have several and never had any problems with any of them over the years.  Got this one because I wanted the 90 degree plug.',
  'reviewTime': '07 6, 2008',
  'reviewerID': 'A3M1PLEYNDEYO8',
  'reviewerName': 'G. Thomas "Tom"',
  'summary': 'Great cable',
  'unixReviewTime': 1215302400},
 {'_id': ObjectId('60ac3be5a0f981616012e9ed'),
  'asin': 'B000068NVI',
  'helpful': [0, 0],
  'overall': 5,
  'reviewText': 'This was exactly what I was after. I have a voice touch and needed a small cord to connect the mic to the voice touch and this was perfect. Before I used a 20 foot cord to go about 12 inches. I highly recommend this for those who keep the mic on a stand and have a voice touch or other stand connected device for vocals.',
  'reviewTime': '09 16, 2013',
  'reviewerID': 'A2074KEJGRYJV

# Mediante un aggregation, obtener las reseñas "neutrales" y etiquetarlas como "neutral" en el resultado de la consulta.

In [None]:
results = coll.aggregate(
    [
     {
      '$match':
       {'overall': 3}
     },
     {
      '$addFields':
      {
       'neutral': 1
      }
     }
    ]
)
list(results)[3]

{'_id': ObjectId('60ac3be5a0f981616012ea13'),
 'asin': 'B000068NW5',
 'helpful': [0, 0],
 'neutral': 1,
 'overall': 3,
 'reviewText': '...unbalanced guitar cable is notoriously noisy especially around florescent lights. These are no different. I would prefer to use cables with better shielding but cannot justify the expense considering how rarely these things get used.',
 'reviewTime': '02 12, 2012',
 'reviewerID': 'A319B090A2POEB',
 'reviewerName': 'Lee',
 'summary': 'Standard guitar cable',
 'unixReviewTime': 1329004800}

# Obtener el título y el nombre del autor, de las reseñas con mejores calificaciones.

In [None]:
results = coll.find({'overall': 5}, {'_id': 0, 'reviewerName': 1, 'summary': 1}).limit(3)
list(results)

[{'reviewerName': 'G. Thomas "Tom"', 'summary': 'Great cable'},
 {'reviewerName': 'hcross', 'summary': 'Great little cord'},
 {'reviewerName': 'Vince Lewis "Vince"', 'summary': 'great value'}]