# Guía MongoDB

## 1. Instalación y conexión

Primero, necesitamos instalar el driver de MongoDB para python y realizar la conexión. Considerar además que la uri 'estándar' es `mongodb://user:password@ip/database`. En el siguiente código, descomenta la línea 4 y reemplaza XX por tu número de alumno. 

In [2]:
from pymongo import MongoClient
import pprint # For pretty printing

uri = "mongodb://alumnoXX:XX@gray.ing.puc.cl/educativo?authSource=perm"       
        
client = MongoClient(uri)
db = client.get_database('example_user')

## 2. Los datos

Tenemos dos colecciones de datos: `users` y `messages`. A continuación te mostramos un ejemplo de cada uno para que veas su estructura:

Ejemplo de mensaje:

```
{
    "mid": 1,
    "message": "Qué tal? Me gustó el hotel que reservé. 10 - 4.",
    "sender": 86,
    "receptant": 261,
    "lat": -51.729782,
    "long": -72.515097,
    "date": "2020-08-02"
}
```

Ejemplo de usuario: 
```
{
    "uid": 208
    "name": "Harry Hood",
    "age": 50,
    "description": "Soy jefe de una instalacion en el puerto Quintero",
}
```

**Importante:** los datos solo tienen text index en el campo `description` en el caso de Usuarios y en el campo `message` para el caso de mensajes. 


Ahora te mostraremos algunos ejemplos de uso de estas colecciones:

1. Todos los usuarios:

In [3]:
collection = db.users

for user in collection.find({}):
    pprint.pprint(user)

{'_id': ObjectId('60bfd90e002ce228636e506b'),
 'age': 43,
 'description': 'Soy jefe de una instalacion en el puerto Quintero',
 'name': 'Bronwyn Orozco',
 'uid': 4}
{'_id': ObjectId('60bfd90e002ce228636e506c'),
 'age': 42,
 'description': 'Soy jefe de una instalacion en el puerto Punta Patache',
 'name': 'Xavier Stuart',
 'uid': 2}
{'_id': ObjectId('60bfd90e002ce228636e506d'),
 'age': 21,
 'description': 'Soy jefe de una instalacion en el puerto La Serena',
 'name': 'Thierry Shaw',
 'uid': 3}
{'_id': ObjectId('60bfd90e002ce228636e506e'),
 'age': 54,
 'description': 'Soy jefe de una instalacion en el puerto Chacabuco',
 'name': 'Jasper Harvey',
 'uid': 7}
{'_id': ObjectId('60bfd90e002ce228636e506f'),
 'age': 49,
 'description': 'Soy jefe de una instalacion en el puerto Caleta Patillos',
 'name': 'Tatiana Williams',
 'uid': 5}
{'_id': ObjectId('60bfd90e002ce228636e5070'),
 'age': 44,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Frederic Brooks',
 'ui

2. Usuarios con edad >= 30:

In [None]:
for user in collection.find({"age":{"$gte":30}}):
    pprint.pprint(user)

3. Usuarios cuya descripción contenga la palabra "instalaciones"

In [None]:
for user in collection.find({"$text": {"$search": "instalaciones"}}):
    pprint.pprint(user)

4. Número de usuarios con edad >= 30

In [None]:
res = collection.count_documents({"age":{"$gte":30}})
print(res)

## 3. Ejercicios

1. Encuentra el texto de todos los mensajes enviados entre el usuario de uid=96 al usuario de uid=214.

In [4]:
collection = db.messages

mensajesAB = collection.find({"receptant":214, "sender":96},{"message":1})
mensajesBA = collection.find({"receptant":96, "sender":214},{"message":1})

for m in mensajesAB:
	print(m['message'])
for m in mensajesBA:
	print(m['message'])

Hiciste la tarea de BD?
Te cuento que: Alcancé el equilibrio espiritual. Espero que nos juntemos pronto.


2. Encuentra el nombre de todos los usuarios que han enviado un mensaje al usuario con uid=214. **Hint:** para responder esta consulta tendrás que acceder a 2 colecciones, usa python para esto. 

In [5]:
collection1 = db.messages

data = collection1.find({"receptant":214})

collection2 = db.users

for u in data:
	for user in collection2.find({"uid":u['sender']}):
		pprint.pprint(user['name'])

'Emillie Frye'


3. Encuentra el nombre de todos los usuarios que han enviado un mensaje con mid>=270. **Hint:** para responder esta consulta tendrás que acceder a 2 colecciones, usa python para esto. NO necesitas verificar si un nombre está repetido.

In [6]:
collection1 = db.messages

data = collection1.find({"mid":{"$gte":270}})

collection2 = db.users

for u in data:
	for user in collection2.find({"uid":u['sender']}):
		pprint.pprint(user['name'])

'Jonny Newton'
'Eduardo Pulido'
'Quinn Novak'
'Daniela Trinidad Alvarez Menchaca'
'Haidar Moreno'
'Nevaeh Gill'
'Camron Chaney'
'Dainton Pratt'
'Skyla Ferrell'
'Sanaya Sheppard'
'Shoaib Ford'
'Cooper Potts'
'Ace Stephenson'
'Leanne Weeks'
'Sanaya Sheppard'
'Elleanor Michael'
'Che Partridge'
'Ammaar Carty'
'Ace Stephenson'
'Linzi Wong'
'Jonathan Calderon'


4. Usando text search, encuentra todos los usuarios cuya descripción contenga literalmente "Puerto Montt" (si solo tiene la palabra "Puerto" no se considera).

In [7]:
collection1 = db.users

data =  collection1.find({"$text": {"$search": "\"Puerto Montt\""}})

for m in data:
	pprint.pprint(m)

{'_id': ObjectId('60bfd90e002ce228636e50e2'),
 'age': 58,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Tudor Proctor',
 'uid': 120}
{'_id': ObjectId('60bfd90e002ce228636e50dd'),
 'age': 29,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Huw Lewis',
 'uid': 118}
{'_id': ObjectId('60bfd90e002ce228636e50d1'),
 'age': 30,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Lori Forrest',
 'uid': 100}
{'_id': ObjectId('60bfd90e002ce228636e50ac'),
 'age': 52,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Matias Strickland',
 'uid': 50}
{'_id': ObjectId('60bfd90e002ce228636e507e'),
 'age': 22,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Rhydian Keeling',
 'uid': 23}
{'_id': ObjectId('60bfd90e002ce228636e5070'),
 'age': 44,
 'description': 'Soy jefe de una instalacion en el puerto Puerto Montt',
 'name': 'Frederic B

5. Usando text search, encuentra los mensajes que contengan tanto "grande" como "magikarp", y que no contengan "origami", "espina" y "shrek".

In [8]:
collection2 = db.messages

for m in collection2.find({"$text": {"$search": "\"grande\" \"magikarp\" -espina -shrek -origami"}}):
	pprint.pprint(m)

{'_id': ObjectId('60c26e8ee02f756cca774101'),
 'date': '2020-06-10',
 'lat': -27.286801,
 'long': -128.20167,
 'message': 'Jajajaja parece que conseguimos unos magikarp bien grandes',
 'mid': 281,
 'receptant': 171,
 'sender': 289}


6. Usando text search, encuentra los mensajes que contengan "hola" o "magikarp".

In [9]:
collection2 = db.messages

for m in collection2.find({"$text": {"$search": "hola magikarp"}}):
	pprint.pprint(m)

{'_id': ObjectId('60c26e8ee02f756cca7740ce'),
 'date': '2019-09-15',
 'lat': -27.374641,
 'long': -90.276865,
 'message': 'Hola! Vas a venir?',
 'mid': 227,
 'receptant': 437,
 'sender': 441}
{'_id': ObjectId('60c26e8ee02f756cca7740c0'),
 'date': '2020-04-02',
 'lat': -23.079884,
 'long': -70.385076,
 'message': 'Hola! Cómo estás?',
 'mid': 215,
 'receptant': 190,
 'sender': 251}
{'_id': ObjectId('60c26e8ee02f756cca774019'),
 'date': '2020-10-30',
 'lat': -37.026453,
 'long': -73.149839,
 'message': 'Hola! Cómo estás?',
 'mid': 49,
 'receptant': 113,
 'sender': 43}
{'_id': ObjectId('60c26e8ee02f756cca774018'),
 'date': '2020-09-23',
 'lat': -50.291406,
 'long': -90.97999,
 'message': 'Hola, cómo has estado?',
 'mid': 46,
 'receptant': 172,
 'sender': 161}
{'_id': ObjectId('60c26e8ee02f756cca77408f'),
 'date': '2020-10-05',
 'lat': -50.291406,
 'long': -90.97999,
 'message': 'Hola! Viste las noticias?',
 'mid': 165,
 'receptant': 338,
 'sender': 283}
{'_id': ObjectId('60c26e8ee02f756cca

7. Usando text search, encuentra los mensajes que contengan "todo" y "magikarp".

In [10]:
collection2 = db.messages

for m in collection2.find({"$text": {"$search": "\"todo\" \"magikarp\""}}):
	pprint.pprint(m)

{'_id': ObjectId('60c26e8ee02f756cca7740bc'),
 'date': '2020-07-13',
 'lat': -20.736956,
 'long': -70.182595,
 'message': 'A todo esto, por qué magikarps y shrek? no habían códigos '
            'mejores?',
 'mid': 210,
 'receptant': 212,
 'sender': 171}
{'_id': ObjectId('60c26e8ee02f756cca77410a'),
 'date': '2020-07-13',
 'lat': -20.736956,
 'long': -70.182595,
 'message': 'La verdad es que todo esto de los magikarp me ha dado una mala '
            'espina',
 'mid': 288,
 'receptant': 171,
 'sender': 212}


8. Usando text search, encuentra los mensajes que contengan "bien" o "magikarp", pero que no contenga "tiene".

In [11]:
collection2 = db.messages

for m in collection2.find({"$text": {"$search": "bien magikarp -tiene"}}):
	pprint.pprint(m)

{'_id': ObjectId('60c26e8ee02f756cca774101'),
 'date': '2020-06-10',
 'lat': -27.286801,
 'long': -128.20167,
 'message': 'Jajajaja parece que conseguimos unos magikarp bien grandes',
 'mid': 281,
 'receptant': 171,
 'sender': 289}
{'_id': ObjectId('60c26e8ee02f756cca7740b9'),
 'date': '2019-11-01',
 'lat': -27.055978,
 'long': -70.833427,
 'message': 'Oye, fuiste a ver shrek? escuché que venía bien cargado',
 'mid': 207,
 'receptant': 176,
 'sender': 351}
{'_id': ObjectId('60c26e8ee02f756cca7740e0'),
 'date': '2020-07-11',
 'lat': -20.736956,
 'long': -70.182595,
 'message': 'Y... cómo va el negocio de los magikarp?',
 'mid': 246,
 'receptant': 289,
 'sender': 130}
{'_id': ObjectId('60c26e8ee02f756cca774109'),
 'date': '2020-07-13',
 'lat': -20.736956,
 'long': -70.182595,
 'message': 'Igual me da miedo que descubran lo de los magikarp, a ti no?',
 'mid': 287,
 'receptant': 212,
 'sender': 171}
{'_id': ObjectId('60c26e8ee02f756cca7740cb'),
 'date': '2020-09-16',
 'lat': -29.913745,
 '

9. Usando text search, encuentra todos los usuarios cuya descripción contenga la palabra "Puerto", pero no la palabra "Montt", además los usuarios deben tener edad >= 58.

In [12]:
collection1 = db.users

data =  collection1.find({"$text": {"$search": "Puerto -Montt"}, "age":{"$gte":58}})

for m in data:
	pprint.pprint(m)

{'_id': ObjectId('60bfd90e002ce228636e5117'),
 'age': 58,
 'description': 'Soy jefe de una instalacion en el puerto Balmaceda',
 'name': 'Karis Downes',
 'uid': 174}
{'_id': ObjectId('60bfd90e002ce228636e50fc'),
 'age': 58,
 'description': 'Soy jefe de una instalacion en el puerto Iquique',
 'name': 'Lola-Mae Whittaker',
 'uid': 147}
{'_id': ObjectId('60bfd90e002ce228636e50fa'),
 'age': 58,
 'description': 'Soy jefe de una instalacion en el puerto Huasco',
 'name': 'Sonnie Pugh',
 'uid': 146}
{'_id': ObjectId('60bfd90e002ce228636e50e6'),
 'age': 60,
 'description': 'Soy jefe de una instalacion en el puerto Caldera',
 'name': 'Ajwa Daly',
 'uid': 127}
{'_id': ObjectId('60bfd90e002ce228636e50d6'),
 'age': 60,
 'description': 'Soy jefe de una instalacion en el puerto Caldera',
 'name': 'Korban Robbins',
 'uid': 109}
{'_id': ObjectId('60bfd90e002ce228636e50b7'),
 'age': 58,
 'description': 'Soy jefe de una instalacion en el puerto Valparaiso',
 'name': "Lily-Mae O'Quinn",
 'uid': 76}
{'_id

10. Usando text search, encuentra todos los usuarios que hayan enviado un mensaje que contiene "bien" o "magikarp", pero no "tiene".

In [13]:
collection2 = db.messages

mess = collection2.find({"$text": {"$search": "bien magikarp -tiene"}})

collection1 = db.users

for m in mess:
	for u in collection1.find({"uid":m['sender']}):
		print(u['name'])

Sanaya Sheppard
Justine Dejesus
Che Partridge
Ammaar Carty
Itzel Madrid Tello
Ammaar Carty
Ace Stephenson


11. Encuentra todos los mensajes enviados por un usuario llamado "Jose" (podría ser "María José" por ejemplo). Notar que no hay text index para `name` en la colección de usuarios. 

In [14]:
collection1 = db.users

joses =  collection1.find({"name": {"$regex": "Jose"}})

collection2 = db.messages

for u in joses:
	for m in collection2.find({"sender":u['uid']}):
		pprint.pprint(m)

{'_id': ObjectId('60c26e8ee02f756cca7740a2'),
 'date': '2020-08-24',
 'lat': -32.77554,
 'long': -71.526049,
 'message': 'Tanto tiempo! Estoy intentando aprobar el test de turing. Eso me '
            'tiene mal.',
 'mid': 183,
 'receptant': 181,
 'sender': 55}
{'_id': ObjectId('60c26e8ee02f756cca7740a7'),
 'date': '2020-09-19',
 'lat': -27.374641,
 'long': -90.276865,
 'message': 'Cómo estás? Me encanta el grunge. Espero que nos juntemos pronto.',
 'mid': 190,
 'receptant': 138,
 'sender': 280}


12. Encuentra los mensajes que contengan la palabra "Estoy". Luego, encuentra todos los mensajes que no contengan esa palabra. ¿Cuántos mensajes no contienen esta palabra?

In [15]:
collection2 = db.messages

print("With Estoy:")
for m in collection2.find({"$text": {"$search": "Estoy"}}):
	pprint.pprint(m)


#Try 1
print("Without Estoy:")
for m in collection2.find({"$text": {"$search": "-Estoy"}}):
	pprint.pprint(m)
# Does not work in MongoDB


#Try 2. Hacking it with brutality:
notThis = []

for m in collection2.find({"$text": {"$search": "Estoy"}}):
	notThis.append(m['mid'])  

nr = 0

for m in collection2.find({}):
	if not(m['mid'] in notThis):
		nr = nr + 1 
		
print(nr)

With Estoy:
{'_id': ObjectId('60c26e8ee02f756cca774086'),
 'date': '2020-08-28',
 'lat': -37.026453,
 'long': -73.149839,
 'message': 'Hey! Estoy borracho. Cambio y fuera.',
 'mid': 155,
 'receptant': 113,
 'sender': 118}
{'_id': ObjectId('60c26e8ee02f756cca7740a2'),
 'date': '2020-08-24',
 'lat': -32.77554,
 'long': -71.526049,
 'message': 'Tanto tiempo! Estoy intentando aprobar el test de turing. Eso me '
            'tiene mal.',
 'mid': 183,
 'receptant': 181,
 'sender': 55}
{'_id': ObjectId('60c26e8ee02f756cca77404f'),
 'date': '2020-10-27',
 'lat': -50.291406,
 'long': -90.97999,
 'message': 'Te cuento que: Estoy intentando aprobar el test de turing. Me '
            'despido, salu3.',
 'mid': 100,
 'receptant': 365,
 'sender': 320}
{'_id': ObjectId('60c26e8ee02f756cca774035'),
 'date': '2020-08-02',
 'lat': -27.374641,
 'long': -90.97999,
 'message': 'Qué tal? Estoy intentando aprobar el test de turing. Eso me tiene '
            'bien.',
 'mid': 76,
 'receptant': 113,
 'sender'