# Framework de Agregación

En este notebook vamos ha profundizar en las operaciones del framework de agregación de MongoDB.

Antes de nada vamos ha preparar el entorno importando las librerías que vamos a utilizar, crear la conexión a MongoDB y borrar la colección del notebook para limpiar el entorno de anteriores ejecuciones.

A continución crearmos de nuevo la base de datos para los ejercicios del notebook.

In [1]:
import pymongo
from pymongo import MongoClient

In [2]:
client = MongoClient('mongodb://nosql:nosql@mongo:27017/')

client.drop_database("notebook_tres")

In [3]:
db = client["notebook_tres"]

# 0. Preparar los datos para el notebook

Antes de empezar a ver el framework de agregación, vamos a preparar las colecciones para poder trabajar.

En la carptea data/mongoDB hay tres ficheros con datos para este notebook: 

* zips.json Datos con los códigos postalse (zip codes) de todas las ciudades de Estados Unidos
* grades.json Datos con las notas de los alumnos de un instituto.
* post.json Datos con los post de un blog.

Para insertar los datos utilizamos los mismos métodos que utilizamos en el notebook de ejercicios find.

In [4]:
def insert_document(collection, document):
    try:
        collection.insert_one(document)
    except:
        pass

In [5]:
import sys
import json
from bson.json_util import loads

def import_file(file_path, collection):
    document_file = open(file_path, "r")

    for line in document_file:
        document = loads(line)
        insert_document(collection, document)

In [6]:
zips_path = '../data/mongoDB/zips.json'
grades_path = '../data/mongoDB/grades.json'
posts_path = '../data/mongoDB/posts.json'

import_file(zips_path, db.zips)
import_file(grades_path, db.grades)
import_file(posts_path, db.posts)


In [7]:
all_zips = db.zips.find({}).limit(10)

for zip in all_zips:
    print(zip)

{'_id': '35004', 'city': 'ACMAR', 'loc': [-86.51557, 33.584132], 'pop': 6055, 'state': 'AL'}
{'_id': '35005', 'city': 'ADAMSVILLE', 'loc': [-86.959727, 33.588437], 'pop': 10616, 'state': 'AL'}
{'_id': '35006', 'city': 'ADGER', 'loc': [-87.167455, 33.434277], 'pop': 3205, 'state': 'AL'}
{'_id': '35007', 'city': 'KEYSTONE', 'loc': [-86.812861, 33.236868], 'pop': 14218, 'state': 'AL'}
{'_id': '35010', 'city': 'NEW SITE', 'loc': [-85.951086, 32.941445], 'pop': 19942, 'state': 'AL'}
{'_id': '35014', 'city': 'ALPINE', 'loc': [-86.208934, 33.331165], 'pop': 3062, 'state': 'AL'}
{'_id': '35016', 'city': 'ARAB', 'loc': [-86.489638, 34.328339], 'pop': 13650, 'state': 'AL'}
{'_id': '35019', 'city': 'BAILEYTON', 'loc': [-86.621299, 34.268298], 'pop': 1781, 'state': 'AL'}
{'_id': '35020', 'city': 'BESSEMER', 'loc': [-86.947547, 33.409002], 'pop': 40549, 'state': 'AL'}
{'_id': '35023', 'city': 'HUEYTOWN', 'loc': [-86.999607, 33.414625], 'pop': 39677, 'state': 'AL'}


In [8]:
all_grades = db.grades.find({}).limit(10)

for grade in all_grades:
    print(grade)

{'_id': ObjectId('50b59cd75bed76f46522c34e'), 'student_id': 0, 'class_id': 2, 'scores': [{'type': 'exam', 'score': 57.92947112575566}, {'type': 'quiz', 'score': 21.24542588206755}, {'type': 'homework', 'score': 68.1956781058743}, {'type': 'homework', 'score': 67.95019716560351}, {'type': 'homework', 'score': 18.81037253352722}]}
{'_id': ObjectId('50b59cd75bed76f46522c34f'), 'student_id': 0, 'class_id': 28, 'scores': [{'type': 'exam', 'score': 39.17749400402234}, {'type': 'quiz', 'score': 78.44172815491468}, {'type': 'homework', 'score': 20.81782269075502}, {'type': 'homework', 'score': 70.44520452408949}, {'type': 'homework', 'score': 50.66616327819226}, {'type': 'homework', 'score': 53.84983118363991}]}
{'_id': ObjectId('50b59cd75bed76f46522c350'), 'student_id': 0, 'class_id': 5, 'scores': [{'type': 'exam', 'score': 88.22950674232497}, {'type': 'quiz', 'score': 79.28962650427184}, {'type': 'homework', 'score': 18.66254946562674}, {'type': 'homework', 'score': 40.28154176513361}, {'typ

In [9]:
all_posts = db.posts.find({}).limit(10)

for post in all_posts:
    print(post)

{'_id': ObjectId('5143ddf3bcf1bf4ab37d9c6d'), 'body': 'We the People of the United States, in Order to form a more perfect Union, establish Justice, insure domestic Tranquility, provide for the common defence, promote the general Welfare, and secure the Blessings of Liberty to ourselves and our Posterity, do ordain and establish this Constitution for the United States of America.\n<p>Article. I.<p><p>Section. 1.<p><p>All legislative Powers herein granted shall be vested in a Congress of the United States, which shall consist of a Senate and House of Representatives.<p><p>Section. 2.<p><p>The House of Representatives shall be composed of Members chosen every second Year by the People of the several States, and the Electors in each State shall have the Qualifications requisite for Electors of the most numerous Branch of the State Legislature.<p><p>No Person shall be a Representative who shall not have attained to the Age of twenty five Years, and been seven Years a Citizen of the United 

In [10]:
# Insertar productos en 'products'
db.products.insert_one({'name':'iPad 16GB Wifi', 'manufacturer':"Apple", 'category':'Tablets', 'price':499.00})
db.products.insert_one({'name':'iPad 32GB Wifi', 'category':'Tablets', 'manufacturer':"Apple", 'price':599.00})
db.products.insert_one({'name':'iPad 64GB Wifi', 'category':'Tablets', 'manufacturer':"Apple", 'price':699.00})
db.products.insert_one({'name':'Galaxy S3', 'category':'Cell Phones', 'manufacturer':'Samsung', 'price':563.99})
db.products.insert_one({'name':'Galaxy Tab 10', 'category':'Tablets', 'manufacturer':'Samsung', 'price':450.99})
db.products.insert_one({'name':'Vaio', 'category':'Laptops', 'manufacturer':"Sony", 'price':499.00})
db.products.insert_one({'name':'Macbook Air 13inch', 'category':'Laptops', 'manufacturer':"Apple", 'price':499.00})
db.products.insert_one({'name':'Nexus 7', 'category':'Tablets', 'manufacturer':"Google", 'price':199.00})
db.products.insert_one({'name':'Kindle Paper White', 'category':'Tablets', 'manufacturer':"Amazon", 'price':129.00})
db.products.insert_one({'name':'Kindle Fire', 'category':'Tablets', 'manufacturer':"Amazon", 'price':199.00})

<pymongo.results.InsertOneResult at 0x7f27c47540c8>

In [11]:
all_products = db.products.find({}).limit(10)

for product in all_products:
    print(product)

{'_id': ObjectId('65e04826989f89c2656dfd68'), 'name': 'iPad 16GB Wifi', 'manufacturer': 'Apple', 'category': 'Tablets', 'price': 499.0}
{'_id': ObjectId('65e04826989f89c2656dfd69'), 'name': 'iPad 32GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 599.0}
{'_id': ObjectId('65e04826989f89c2656dfd6a'), 'name': 'iPad 64GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 699.0}
{'_id': ObjectId('65e04826989f89c2656dfd6b'), 'name': 'Galaxy S3', 'category': 'Cell Phones', 'manufacturer': 'Samsung', 'price': 563.99}
{'_id': ObjectId('65e04826989f89c2656dfd6c'), 'name': 'Galaxy Tab 10', 'category': 'Tablets', 'manufacturer': 'Samsung', 'price': 450.99}
{'_id': ObjectId('65e04826989f89c2656dfd6d'), 'name': 'Vaio', 'category': 'Laptops', 'manufacturer': 'Sony', 'price': 499.0}
{'_id': ObjectId('65e04826989f89c2656dfd6e'), 'name': 'Macbook Air 13inch', 'category': 'Laptops', 'manufacturer': 'Apple', 'price': 499.0}
{'_id': ObjectId('65e04826989f89c2656dfd6f'), 'name

In [12]:
# Mostrar colecciones existentes
collections = db.list_collection_names()

for collection in collections:
    print(collection)

posts
products
grades
zips


In [13]:
# Mostrar nº de items de una colección
def mostrar_numero_items(coleccion):
    num_items = db[coleccion].count_documents({})
    print(f"Número de items en {coleccion}: {num_items}")
mostrar_numero_items("zips")
mostrar_numero_items("products")
mostrar_numero_items("grades")
mostrar_numero_items("posts")

Número de items en zips: 29467
Número de items en products: 10
Número de items en grades: 280
Número de items en posts: 1000


# 1. $match

Permite filtrar datos como si de una operación find() se tratara.

In [14]:
# Match
ny_zips = db.zips.aggregate([ { "$match": { "state": "NY" } } ])

for zip in ny_zips:
    print(zip)

{'_id': '06390', 'city': 'FISHERS ISLAND', 'loc': [-72.017834, 41.263934], 'pop': 329, 'state': 'NY'}
{'_id': '10001', 'city': 'NEW YORK', 'loc': [-73.996705, 40.74838], 'pop': 18913, 'state': 'NY'}
{'_id': '10002', 'city': 'NEW YORK', 'loc': [-73.987681, 40.715231], 'pop': 84143, 'state': 'NY'}
{'_id': '10003', 'city': 'NEW YORK', 'loc': [-73.989223, 40.731253], 'pop': 51224, 'state': 'NY'}
{'_id': '10004', 'city': 'GOVERNORS ISLAND', 'loc': [-74.019025, 40.693604], 'pop': 3593, 'state': 'NY'}
{'_id': '10005', 'city': 'NEW YORK', 'loc': [-74.008344, 40.705649], 'pop': 202, 'state': 'NY'}
{'_id': '10006', 'city': 'NEW YORK', 'loc': [-74.013474, 40.708451], 'pop': 119, 'state': 'NY'}
{'_id': '10007', 'city': 'NEW YORK', 'loc': [-74.007022, 40.713905], 'pop': 3374, 'state': 'NY'}
{'_id': '10009', 'city': 'NEW YORK', 'loc': [-73.979591, 40.726188], 'pop': 57426, 'state': 'NY'}
{'_id': '10010', 'city': 'NEW YORK', 'loc': [-73.981328, 40.737476], 'pop': 24907, 'state': 'NY'}
{'_id': '10011'

## Ejercicio 1:

* Encuentra todos los códigos zip del estado de Massachusetts (MA).
* Encuentra todos los códigos zip que tengan una población menor a 1000.


In [15]:
# Encuentra todos los códigos zip del estado de Massachusetts (MA) usando 'Match'
ny_zips = db.zips.aggregate([ { "$match": { "state": "MA" } } ])

for zip in ny_zips:
    print(zip)

{'_id': '01001', 'city': 'AGAWAM', 'loc': [-72.622739, 42.070206], 'pop': 15338, 'state': 'MA'}
{'_id': '01002', 'city': 'CUSHMAN', 'loc': [-72.51565, 42.377017], 'pop': 36963, 'state': 'MA'}
{'_id': '01005', 'city': 'BARRE', 'loc': [-72.108354, 42.409698], 'pop': 4546, 'state': 'MA'}
{'_id': '01007', 'city': 'BELCHERTOWN', 'loc': [-72.410953, 42.275103], 'pop': 10579, 'state': 'MA'}
{'_id': '01008', 'city': 'BLANDFORD', 'loc': [-72.936114, 42.182949], 'pop': 1240, 'state': 'MA'}
{'_id': '01010', 'city': 'BRIMFIELD', 'loc': [-72.188455, 42.116543], 'pop': 3706, 'state': 'MA'}
{'_id': '01011', 'city': 'CHESTER', 'loc': [-72.988761, 42.279421], 'pop': 1688, 'state': 'MA'}
{'_id': '01012', 'city': 'CHESTERFIELD', 'loc': [-72.833309, 42.38167], 'pop': 177, 'state': 'MA'}
{'_id': '01013', 'city': 'CHICOPEE', 'loc': [-72.607962, 42.162046], 'pop': 23396, 'state': 'MA'}
{'_id': '01020', 'city': 'CHICOPEE', 'loc': [-72.576142, 42.176443], 'pop': 31495, 'state': 'MA'}
{'_id': '01022', 'city': '

In [18]:
# Encuentra todos los códigos zip que tengan una población menor a 1000.
ny_zips = db.zips.aggregate([ { "$match": {"pop": {"$lt": 1000}} } ])

for zip in ny_zips:
    print(zip)


{'_id': '35087', 'city': 'JOPPA', 'loc': [-86.551939, 34.283739], 'pop': 987, 'state': 'AL'}
{'_id': '35147', 'city': 'STERRETT', 'loc': [-86.491732, 33.446103], 'pop': 617, 'state': 'AL'}
{'_id': '35172', 'city': 'TRAFFORD', 'loc': [-86.743414, 33.819038], 'pop': 909, 'state': 'AL'}
{'_id': '35178', 'city': 'VINCENT', 'loc': [-86.399425, 33.401049], 'pop': 295, 'state': 'AL'}
{'_id': '35180', 'city': 'WARRIOR', 'loc': [-86.819849, 33.852862], 'pop': 530, 'state': 'AL'}
{'_id': '35188', 'city': 'WOODSTOCK', 'loc': [-87.163469, 33.169808], 'pop': 691, 'state': 'AL'}
{'_id': '35233', 'city': 'BIRMINGHAM', 'loc': [-86.800257, 33.506161], 'pop': 842, 'state': 'AL'}
{'_id': '35457', 'city': 'ECHOLA', 'loc': [-87.807202, 33.316559], 'pop': 223, 'state': 'AL'}
{'_id': '35458', 'city': 'ELROD', 'loc': [-87.801429, 33.343678], 'pop': 809, 'state': 'AL'}
{'_id': '35459', 'city': 'EMELLE', 'loc': [-88.305747, 32.754963], 'pop': 491, 'state': 'AL'}
{'_id': '35461', 'city': 'ETHELSVILLE', 'loc': [-

{'_id': '50264', 'city': 'WELDON', 'loc': [-93.738743, 40.873906], 'pop': 388, 'state': 'IA'}
{'_id': '50272', 'city': 'WILLIAMSON', 'loc': [-93.26593, 41.102026], 'pop': 505, 'state': 'IA'}
{'_id': '50274', 'city': 'WIOTA', 'loc': [-94.840515, 41.384552], 'pop': 596, 'state': 'IA'}
{'_id': '50275', 'city': 'WOODBURN', 'loc': [-93.608282, 41.00001], 'pop': 677, 'state': 'IA'}
{'_id': '50277', 'city': 'YALE', 'loc': [-94.35026, 41.775309], 'pop': 414, 'state': 'IA'}
{'_id': '50420', 'city': 'ALEXANDER', 'loc': [-93.445, 42.811395], 'pop': 664, 'state': 'IA'}
{'_id': '50430', 'city': 'CORWITH', 'loc': [-93.932303, 42.992736], 'pop': 737, 'state': 'IA'}
{'_id': '50432', 'city': 'CRYSTAL LAKE', 'loc': [-93.794166, 43.218692], 'pop': 543, 'state': 'IA'}
{'_id': '50433', 'city': 'DOUGHERTY', 'loc': [-93.068586, 42.941633], 'pop': 308, 'state': 'IA'}
{'_id': '50434', 'city': 'FERTILE', 'loc': [-93.434485, 43.279514], 'pop': 766, 'state': 'IA'}
{'_id': '50439', 'city': 'GOODELL', 'loc': [-93.5

{'_id': '49303', 'city': 'BAILEY', 'loc': [-85.831318, 43.276768], 'pop': 670, 'state': 'MI'}
{'_id': '49322', 'city': 'CORAL', 'loc': [-85.379245, 43.364458], 'pop': 895, 'state': 'MI'}
{'_id': '49344', 'city': 'SHELBYVILLE', 'loc': [-85.628239, 42.593581], 'pop': 259, 'state': 'MI'}
{'_id': '49411', 'city': 'FREE SOIL', 'loc': [-86.265158, 44.112036], 'pop': 903, 'state': 'MI'}
{'_id': '49447', 'city': 'NEW RICHMOND', 'loc': [-86.037985, 42.662383], 'pop': 438, 'state': 'MI'}
{'_id': '49459', 'city': 'WALKERVILLE', 'loc': [-86.082991, 43.762559], 'pop': 309, 'state': 'MI'}
{'_id': '49613', 'city': 'ARCADIA', 'loc': [-86.206057, 44.523157], 'pop': 937, 'state': 'MI'}
{'_id': '49618', 'city': 'BOON', 'loc': [-85.614383, 44.291555], 'pop': 388, 'state': 'MI'}
{'_id': '49619', 'city': 'BRETHREN', 'loc': [-85.996396, 44.296596], 'pop': 966, 'state': 'MI'}
{'_id': '49625', 'city': 'COPEMISH', 'loc': [-85.887859, 44.450276], 'pop': 927, 'state': 'MI'}
{'_id': '49630', 'city': 'EMPIRE', 'loc

{'_id': '12823', 'city': 'COSSAYUNA', 'loc': [-73.41237, 43.175059], 'pop': 241, 'state': 'NY'}
{'_id': '12824', 'city': 'DIAMOND POINT', 'loc': [-73.700123, 43.515553], 'pop': 770, 'state': 'NY'}
{'_id': '12826', 'city': 'EAST GREENWICH', 'loc': [-73.392425, 43.157918], 'pop': 116, 'state': 'NY'}
{'_id': '12836', 'city': 'HAGUE', 'loc': [-73.528172, 43.74631], 'pop': 692, 'state': 'NY'}
{'_id': '12837', 'city': 'HAMPTON', 'loc': [-73.273072, 43.462135], 'pop': 419, 'state': 'NY'}
{'_id': '12838', 'city': 'HARTFORD', 'loc': [-73.404946, 43.349281], 'pop': 679, 'state': 'NY'}
{'_id': '12844', 'city': 'PILOT KNOB', 'loc': [-73.629883, 43.515561], 'pop': 23, 'state': 'NY'}
{'_id': '12847', 'city': 'LONG LAKE', 'loc': [-74.466243, 43.947653], 'pop': 930, 'state': 'NY'}
{'_id': '12849', 'city': 'MIDDLE GRANVILLE', 'loc': [-73.303077, 43.450773], 'pop': 249, 'state': 'NY'}
{'_id': '12851', 'city': 'MINERVA', 'loc': [-73.983542, 43.781058], 'pop': 308, 'state': 'NY'}
{'_id': '12852', 'city': 

{'_id': '75477', 'city': 'ROXTON', 'loc': [-95.741605, 33.542934], 'pop': 975, 'state': 'TX'}
{'_id': '75478', 'city': 'SALTILLO', 'loc': [-95.343324, 33.176678], 'pop': 500, 'state': 'TX'}
{'_id': '75481', 'city': 'SULPHUR BLUFF', 'loc': [-95.37396, 33.333379], 'pop': 228, 'state': 'TX'}
{'_id': '75488', 'city': 'TELEPHONE', 'loc': [-96.044945, 33.797854], 'pop': 709, 'state': 'TX'}
{'_id': '75492', 'city': 'WINDOM', 'loc': [-96.002002, 33.563295], 'pop': 363, 'state': 'TX'}
{'_id': '75550', 'city': 'ANNONA', 'loc': [-94.899226, 33.553519], 'pop': 949, 'state': 'TX'}
{'_id': '75556', 'city': 'BLOOMBURG', 'loc': [-94.064688, 33.133859], 'pop': 855, 'state': 'TX'}
{'_id': '75567', 'city': 'MAUD', 'loc': [-94.482267, 33.35504], 'pop': 888, 'state': 'TX'}
{'_id': '75687', 'city': 'PRICE', 'loc': [-94.941494, 32.100842], 'pop': 945, 'state': 'TX'}
{'_id': '75689', 'city': 'TURNERTOWN', 'loc': [-94.950805, 32.18734], 'pop': 923, 'state': 'TX'}
{'_id': '75784', 'city': 'REKLAW', 'loc': [-95.

# 2. $project

Permite transformar los documentos de salida un stage del pipeline quitando, añadiendo o renombrando campos. También permite operar sobre los valoes de los campos para transformalos.

Los operadores que podemos usar sobre los campos son:

* Aritméticos: https://docs.mongodb.com/manual/reference/operator/aggregation/#arithmetic-expression-operators
* Fechas: https://docs.mongodb.com/manual/reference/operator/aggregation/#date-expression-operators
* Cadenas: https://docs.mongodb.com/manual/reference/operator/aggregation/#string-expression-operators

Podemos eliminar el campo _id

In [19]:
products_projected = db.products.aggregate([
    {"$project": { 
        "_id": 0
    }}
])

for product in products_projected:
    print(product)

{'name': 'iPad 16GB Wifi', 'manufacturer': 'Apple', 'category': 'Tablets', 'price': 499.0}
{'name': 'iPad 32GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 599.0}
{'name': 'iPad 64GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 699.0}
{'name': 'Galaxy S3', 'category': 'Cell Phones', 'manufacturer': 'Samsung', 'price': 563.99}
{'name': 'Galaxy Tab 10', 'category': 'Tablets', 'manufacturer': 'Samsung', 'price': 450.99}
{'name': 'Vaio', 'category': 'Laptops', 'manufacturer': 'Sony', 'price': 499.0}
{'name': 'Macbook Air 13inch', 'category': 'Laptops', 'manufacturer': 'Apple', 'price': 499.0}
{'name': 'Nexus 7', 'category': 'Tablets', 'manufacturer': 'Google', 'price': 199.0}
{'name': 'Kindle Paper White', 'category': 'Tablets', 'manufacturer': 'Amazon', 'price': 129.0}
{'name': 'Kindle Fire', 'category': 'Tablets', 'manufacturer': 'Amazon', 'price': 199.0}


O renombrar campos. La siguiente sentencia transforma el documento de entrada en otro que sólo contiene el campo make que contiene el valor del campo manufacturer del documento original. Además 'elimina' el campo '_id'

In [25]:
products_projected = db.products.aggregate([
    {"$project": { 
        "make": "$manufacturer","_id":0
    }}
])

for product in products_projected:
    print(product)

{'make': 'Apple'}
{'make': 'Apple'}
{'make': 'Apple'}
{'make': 'Samsung'}
{'make': 'Samsung'}
{'make': 'Sony'}
{'make': 'Apple'}
{'make': 'Google'}
{'make': 'Amazon'}
{'make': 'Amazon'}


Otra opción es operar sobre los campos de los documentos de entrada.

La siguiente sentencia transforma el documento en otro que sólo contiene el campo name_maker que contiene el valor del campo manufacturer concatenado con el campo name del original. Además 'elimina' el campo '_id'

In [32]:
products_projected = db.products.aggregate([
    {"$project": { 
        "name_maker": { "$concat": ["$name", " ", "$manufacturer"] }, "_id":0
    }}
])

for product in products_projected:
    print(product)

{'name_maker': 'iPad 16GB Wifi Apple'}
{'name_maker': 'iPad 32GB Wifi Apple'}
{'name_maker': 'iPad 64GB Wifi Apple'}
{'name_maker': 'Galaxy S3 Samsung'}
{'name_maker': 'Galaxy Tab 10 Samsung'}
{'name_maker': 'Vaio Sony'}
{'name_maker': 'Macbook Air 13inch Apple'}
{'name_maker': 'Nexus 7 Google'}
{'name_maker': 'Kindle Paper White Amazon'}
{'name_maker': 'Kindle Fire Amazon'}


Podemos combinar todas estas técnicas para transformar los documentos de entrada.

In [33]:
products_projected = db.products.aggregate([
    {"$project": { 
        "_id": 0, # Elimina el identificador del resultado
        'maker': {"$toLower": "$manufacturer"}, # Convierte a minúsculas el campo manufacturer del documento original y renombra el campo a maker
        'details': {'category': "$category", 'price' : {"$multiply":["$price",10]} }, # Crea un nuevo documento embebido bajo el campo details y al crearlo multipicla por 10 el precio del producto
        'item':'$name' # Renombra el campo name por item
    }}
])

for product in products_projected:
    print(product)

{'maker': 'apple', 'details': {'category': 'Tablets', 'price': 4990.0}, 'item': 'iPad 16GB Wifi'}
{'maker': 'apple', 'details': {'category': 'Tablets', 'price': 5990.0}, 'item': 'iPad 32GB Wifi'}
{'maker': 'apple', 'details': {'category': 'Tablets', 'price': 6990.0}, 'item': 'iPad 64GB Wifi'}
{'maker': 'samsung', 'details': {'category': 'Cell Phones', 'price': 5639.9}, 'item': 'Galaxy S3'}
{'maker': 'samsung', 'details': {'category': 'Tablets', 'price': 4509.9}, 'item': 'Galaxy Tab 10'}
{'maker': 'sony', 'details': {'category': 'Laptops', 'price': 4990.0}, 'item': 'Vaio'}
{'maker': 'apple', 'details': {'category': 'Laptops', 'price': 4990.0}, 'item': 'Macbook Air 13inch'}
{'maker': 'google', 'details': {'category': 'Tablets', 'price': 1990.0}, 'item': 'Nexus 7'}
{'maker': 'amazon', 'details': {'category': 'Tablets', 'price': 1290.0}, 'item': 'Kindle Paper White'}
{'maker': 'amazon', 'details': {'category': 'Tablets', 'price': 1990.0}, 'item': 'Kindle Fire'}


### Ejercicio 2: 

Sobre la colección de codigos zip:

* Crea una proyección que transforme los documentos de entrada a otro documento de salida con los siguientes campos:
    * Eliminar el campo _id.
    * Añadir un campo zip que contenga el valor del campo _id del original.
    * Mantener el campo pop del original.
    * Mantener el campo state del original.
    * Tranformar el campo city a mayúsculas.

#### SOLUCIÓN:

In [34]:
pipeline = [
    {
        "$project": {
            "_id": 0,
            "zip": "$_id",
            "pop": 1,
            "state": 1,
            "city": {"$toUpper": "$city"}
        }
    }
]

consulta = db.zips.aggregate(pipeline)

for documento in consulta:
    print(documento)


{'pop': 6055, 'state': 'AL', 'zip': '35004', 'city': 'ACMAR'}
{'pop': 10616, 'state': 'AL', 'zip': '35005', 'city': 'ADAMSVILLE'}
{'pop': 3205, 'state': 'AL', 'zip': '35006', 'city': 'ADGER'}
{'pop': 14218, 'state': 'AL', 'zip': '35007', 'city': 'KEYSTONE'}
{'pop': 19942, 'state': 'AL', 'zip': '35010', 'city': 'NEW SITE'}
{'pop': 3062, 'state': 'AL', 'zip': '35014', 'city': 'ALPINE'}
{'pop': 13650, 'state': 'AL', 'zip': '35016', 'city': 'ARAB'}
{'pop': 1781, 'state': 'AL', 'zip': '35019', 'city': 'BAILEYTON'}
{'pop': 40549, 'state': 'AL', 'zip': '35020', 'city': 'BESSEMER'}
{'pop': 39677, 'state': 'AL', 'zip': '35023', 'city': 'HUEYTOWN'}
{'pop': 9058, 'state': 'AL', 'zip': '35031', 'city': 'BLOUNTSVILLE'}
{'pop': 3448, 'state': 'AL', 'zip': '35033', 'city': 'BREMEN'}
{'pop': 3791, 'state': 'AL', 'zip': '35034', 'city': 'BRENT'}
{'pop': 1282, 'state': 'AL', 'zip': '35035', 'city': 'BRIERFIELD'}
{'pop': 4675, 'state': 'AL', 'zip': '35040', 'city': 'CALERA'}
{'pop': 4902, 'state': 'AL', 

{'pop': 1272, 'state': 'AR', 'zip': '71766', 'city': 'THORNTON'}
{'pop': 203, 'state': 'AR', 'zip': '71767', 'city': 'TINSMAN'}
{'pop': 882, 'state': 'AR', 'zip': '71769', 'city': 'VILLAGE'}
{'pop': 2862, 'state': 'AR', 'zip': '71770', 'city': 'WALDO'}
{'pop': 15955, 'state': 'AR', 'zip': '71801', 'city': 'PERRYTOWN'}
{'pop': 8514, 'state': 'AR', 'zip': '71822', 'city': 'ASHDOWN'}
{'pop': 831, 'state': 'AR', 'zip': '71825', 'city': 'BLEVINS'}
{'pop': 2623, 'state': 'AR', 'zip': '71826', 'city': 'BRADLEY'}
{'pop': 1364, 'state': 'AR', 'zip': '71827', 'city': 'BUCKNER'}
{'pop': 230, 'state': 'AR', 'zip': '71828', 'city': 'CALE'}
{'pop': 739, 'state': 'AR', 'zip': '71831', 'city': 'COLUMBUS'}
{'pop': 7593, 'state': 'AR', 'zip': '71832', 'city': 'DE QUEEN'}
{'pop': 2284, 'state': 'AR', 'zip': '71833', 'city': 'DIERKS'}
{'pop': 1435, 'state': 'AR', 'zip': '71834', 'city': 'DODDRIDGE'}
{'pop': 1141, 'state': 'AR', 'zip': '71835', 'city': 'EMMET'}
{'pop': 2740, 'state': 'AR', 'zip': '71836', 

{'pop': 20795, 'state': 'CA', 'zip': '94024', 'city': 'LOS ALTOS'}
{'pop': 38383, 'state': 'CA', 'zip': '94025', 'city': 'WEST MENLO PARK'}
{'pop': 7312, 'state': 'CA', 'zip': '94027', 'city': 'ATHERTON'}
{'pop': 6379, 'state': 'CA', 'zip': '94028', 'city': 'LADERA'}
{'pop': 20508, 'state': 'CA', 'zip': '94030', 'city': 'MILLBRAE'}
{'pop': 790, 'state': 'CA', 'zip': '94035', 'city': 'MOFFETT FIELD'}
{'pop': 5415, 'state': 'CA', 'zip': '94038', 'city': 'MOSS BEACH'}
{'pop': 26969, 'state': 'CA', 'zip': '94040', 'city': 'MOUNTAIN VIEW'}
{'pop': 13438, 'state': 'CA', 'zip': '94041', 'city': 'MOUNTAIN VIEW'}
{'pop': 28592, 'state': 'CA', 'zip': '94043', 'city': 'MOUNTAIN VIEW'}
{'pop': 37596, 'state': 'CA', 'zip': '94044', 'city': 'PACIFICA'}
{'pop': 670, 'state': 'CA', 'zip': '94060', 'city': 'PESCADERO'}
{'pop': 33316, 'state': 'CA', 'zip': '94061', 'city': 'REDWOOD CITY'}
{'pop': 24947, 'state': 'CA', 'zip': '94062', 'city': 'WOODSIDE'}
{'pop': 28251, 'state': 'CA', 'zip': '94063', 'cit

{'pop': 7116, 'state': 'FL', 'zip': '33496', 'city': 'BOCA RATON'}
{'pop': 5871, 'state': 'FL', 'zip': '33498', 'city': 'BOCA RATON'}
{'pop': 20184, 'state': 'FL', 'zip': '33510', 'city': 'BRANDON'}
{'pop': 29861, 'state': 'FL', 'zip': '33511', 'city': 'BRANDON'}
{'pop': 8728, 'state': 'FL', 'zip': '33513', 'city': 'BUSHNELL'}
{'pop': 1202, 'state': 'FL', 'zip': '33514', 'city': 'CENTER HILL'}
{'pop': 29328, 'state': 'FL', 'zip': '33525', 'city': 'RIDGE MANOR'}
{'pop': 13171, 'state': 'FL', 'zip': '33527', 'city': 'DOVER'}
{'pop': 7010, 'state': 'FL', 'zip': '33534', 'city': 'GIBSONTON'}
{'pop': 3617, 'state': 'FL', 'zip': '33538', 'city': 'LAKE PANASOFFKEE'}
{'pop': 15608, 'state': 'FL', 'zip': '33540', 'city': 'ZEPHYRHILLS'}
{'pop': 17575, 'state': 'FL', 'zip': '33541', 'city': 'ZEPHYRHILLS'}
{'pop': 4073, 'state': 'FL', 'zip': '33543', 'city': 'WESLEY CHAPEL'}
{'pop': 5989, 'state': 'FL', 'zip': '33544', 'city': 'ZEPHYRHILLS'}
{'pop': 6780, 'state': 'FL', 'zip': '33547', 'city': 'LI

{'pop': 2559, 'state': 'IL', 'zip': '61760', 'city': 'MINONK'}
{'pop': 40851, 'state': 'IL', 'zip': '61761', 'city': 'NORMAL'}
{'pop': 14036, 'state': 'IL', 'zip': '61764', 'city': 'PONTIAC'}
{'pop': 683, 'state': 'IL', 'zip': '61769', 'city': 'SAUNEMIN'}
{'pop': 1051, 'state': 'IL', 'zip': '61770', 'city': 'SAYBROOK'}
{'pop': 952, 'state': 'IL', 'zip': '61771', 'city': 'SECOR'}
{'pop': 332, 'state': 'IL', 'zip': '61772', 'city': 'SHIRLEY'}
{'pop': 608, 'state': 'IL', 'zip': '61773', 'city': 'SIBLEY'}
{'pop': 996, 'state': 'IL', 'zip': '61774', 'city': 'STANFORD'}
{'pop': 322, 'state': 'IL', 'zip': '61775', 'city': 'STRAWN'}
{'pop': 1191, 'state': 'IL', 'zip': '61776', 'city': 'TOWANDA'}
{'pop': 1031, 'state': 'IL', 'zip': '61777', 'city': 'WAPELLA'}
{'pop': 768, 'state': 'IL', 'zip': '61778', 'city': 'WAYNESVILLE'}
{'pop': 46110, 'state': 'IL', 'zip': '61801', 'city': 'URBANA'}
{'pop': 405, 'state': 'IL', 'zip': '61810', 'city': 'ALLERTON'}
{'pop': 817, 'state': 'IL', 'zip': '61811', 

{'pop': 1137, 'state': 'IA', 'zip': '50173', 'city': 'MONTOUR'}
{'pop': 1357, 'state': 'IA', 'zip': '50174', 'city': 'MURRAY'}
{'pop': 7381, 'state': 'IA', 'zip': '50201', 'city': 'NEVADA'}
{'pop': 445, 'state': 'IA', 'zip': '50206', 'city': 'NEW PROVIDENCE'}
{'pop': 2426, 'state': 'IA', 'zip': '50207', 'city': 'NEW SHARON'}
{'pop': 19721, 'state': 'IA', 'zip': '50208', 'city': 'NEWTON'}
{'pop': 1593, 'state': 'IA', 'zip': '50210', 'city': 'NEW VIRGINIA'}
{'pop': 9512, 'state': 'IA', 'zip': '50211', 'city': 'NORWALK'}
{'pop': 3115, 'state': 'IA', 'zip': '50212', 'city': 'OGDEN'}
{'pop': 5528, 'state': 'IA', 'zip': '50213', 'city': 'OSCEOLA'}
{'pop': 676, 'state': 'IA', 'zip': '50214', 'city': 'OTLEY'}
{'pop': 1847, 'state': 'IA', 'zip': '50216', 'city': 'PANORA'}
{'pop': 621, 'state': 'IA', 'zip': '50217', 'city': 'PATON'}
{'pop': 258, 'state': 'IA', 'zip': '50218', 'city': 'PATTERSON'}
{'pop': 10771, 'state': 'IA', 'zip': '50219', 'city': 'PELLA'}
{'pop': 7918, 'state': 'IA', 'zip': '

{'pop': 2245, 'state': 'KY', 'zip': '40078', 'city': 'WILLISBURG'}
{'pop': 5, 'state': 'KY', 'zip': '40103', 'city': '40103'}
{'pop': 2532, 'state': 'KY', 'zip': '40104', 'city': 'BATTLETOWN'}
{'pop': 315, 'state': 'KY', 'zip': '40106', 'city': 'BIG SPRING'}
{'pop': 2589, 'state': 'KY', 'zip': '40107', 'city': 'BOSTON'}
{'pop': 6480, 'state': 'KY', 'zip': '40108', 'city': 'BRANDENBURG'}
{'pop': 4447, 'state': 'KY', 'zip': '40109', 'city': 'BROOKS'}
{'pop': 2852, 'state': 'KY', 'zip': '40111', 'city': 'CLOVERPORT'}
{'pop': 67, 'state': 'KY', 'zip': '40114', 'city': 'CONSTANTINE'}
{'pop': 47, 'state': 'KY', 'zip': '40115', 'city': 'CUSTER'}
{'pop': 2565, 'state': 'KY', 'zip': '40117', 'city': 'EKRON'}
{'pop': 8297, 'state': 'KY', 'zip': '40118', 'city': 'FAIRDALE'}
{'pop': 770, 'state': 'KY', 'zip': '40119', 'city': 'GLEN DEAN'}
{'pop': 15407, 'state': 'KY', 'zip': '40121', 'city': 'FORT KNOX'}
{'pop': 613, 'state': 'KY', 'zip': '40140', 'city': 'GARFIELD'}
{'pop': 1294, 'state': 'KY', '

{'pop': 338, 'state': 'ME', 'zip': '04571', 'city': 'TREVETT'}
{'pop': 4702, 'state': 'ME', 'zip': '04572', 'city': 'WALDOBORO'}
{'pop': 349, 'state': 'ME', 'zip': '04573', 'city': 'WALPOLE'}
{'pop': 1261, 'state': 'ME', 'zip': '04574', 'city': 'WASHINGTON'}
{'pop': 642, 'state': 'ME', 'zip': '04576', 'city': 'WEST SOUTHPORT'}
{'pop': 5928, 'state': 'ME', 'zip': '04578', 'city': 'WISCASSET'}
{'pop': 1781, 'state': 'ME', 'zip': '04579', 'city': 'WOOLWICH'}
{'pop': 10671, 'state': 'ME', 'zip': '04605', 'city': 'ELLSWORTH'}
{'pop': 1114, 'state': 'ME', 'zip': '04606', 'city': 'ADDISON'}
{'pop': 1064, 'state': 'ME', 'zip': '04607', 'city': 'GOULDSBORO'}
{'pop': 5513, 'state': 'ME', 'zip': '04609', 'city': 'BAR HARBOR'}
{'pop': 667, 'state': 'ME', 'zip': '04611', 'city': 'BEALS'}
{'pop': 186, 'state': 'ME', 'zip': '04612', 'city': 'BERNARD'}
{'pop': 229, 'state': 'ME', 'zip': '04613', 'city': 'BIRCH HARBOR'}
{'pop': 1417, 'state': 'ME', 'zip': '04614', 'city': 'BLUE HILL'}
{'pop': 375, 'sta

{'pop': 59, 'state': 'MI', 'zip': '49775', 'city': 'POINTE AUX PINS'}
{'pop': 3830, 'state': 'MI', 'zip': '49776', 'city': 'POSEN'}
{'pop': 5463, 'state': 'MI', 'zip': '49779', 'city': 'ROGERS CITY'}
{'pop': 3242, 'state': 'MI', 'zip': '49780', 'city': 'FIBRE'}
{'pop': 5411, 'state': 'MI', 'zip': '49781', 'city': 'SAINT IGNACE'}
{'pop': 404, 'state': 'MI', 'zip': '49782', 'city': 'SAINT JAMES'}
{'pop': 17974, 'state': 'MI', 'zip': '49783', 'city': 'SAULT SAINTE MAR'}
{'pop': 6046, 'state': 'MI', 'zip': '49788', 'city': 'KINCHELOE'}
{'pop': 214, 'state': 'MI', 'zip': '49789', 'city': 'STALWART'}
{'pop': 929, 'state': 'MI', 'zip': '49792', 'city': 'TOWER'}
{'pop': 1541, 'state': 'MI', 'zip': '49795', 'city': 'VANDERBILT'}
{'pop': 1857, 'state': 'MI', 'zip': '49799', 'city': 'WOLVERINE'}
{'pop': 18423, 'state': 'MI', 'zip': '49801', 'city': 'IRON MOUNTAIN'}
{'pop': 796, 'state': 'MI', 'zip': '49806', 'city': 'AU TRAIN'}
{'pop': 4037, 'state': 'MI', 'zip': '49807', 'city': 'HARDWOOD'}
{'po

{'pop': 1621, 'state': 'MS', 'zip': '39641', 'city': 'JAYESS'}
{'pop': 888, 'state': 'MS', 'zip': '39643', 'city': 'KOKOMO'}
{'pop': 2950, 'state': 'MS', 'zip': '39645', 'city': 'LIBERTY'}
{'pop': 3017, 'state': 'MS', 'zip': '39647', 'city': 'MC CALL CREEK'}
{'pop': 23551, 'state': 'MS', 'zip': '39648', 'city': 'MC COMB'}
{'pop': 7831, 'state': 'MS', 'zip': '39652', 'city': 'MAGNOLIA'}
{'pop': 1673, 'state': 'MS', 'zip': '39653', 'city': 'MEADVILLE'}
{'pop': 4517, 'state': 'MS', 'zip': '39654', 'city': 'MONTICELLO'}
{'pop': 321, 'state': 'MS', 'zip': '39656', 'city': 'OAK VALE'}
{'pop': 1143, 'state': 'MS', 'zip': '39657', 'city': 'OSYKA'}
{'pop': 3526, 'state': 'MS', 'zip': '39661', 'city': 'ROXIE'}
{'pop': 415, 'state': 'MS', 'zip': '39662', 'city': 'RUTH'}
{'pop': 2862, 'state': 'MS', 'zip': '39663', 'city': 'SILVER CREEK'}
{'pop': 1247, 'state': 'MS', 'zip': '39664', 'city': 'SMITHDALE'}
{'pop': 1953, 'state': 'MS', 'zip': '39665', 'city': 'SONTAG'}
{'pop': 6696, 'state': 'MS', 'zi

{'pop': 1615, 'state': 'NE', 'zip': '68371', 'city': 'HENDERSON'}
{'pop': 1495, 'state': 'NE', 'zip': '68372', 'city': 'HOLLAND'}
{'pop': 353, 'state': 'NE', 'zip': '68374', 'city': 'HOLMESVILLE'}
{'pop': 200, 'state': 'NE', 'zip': '68375', 'city': 'HUBBELL'}
{'pop': 1806, 'state': 'NE', 'zip': '68376', 'city': 'HUMBOLDT'}
{'pop': 579, 'state': 'NE', 'zip': '68377', 'city': 'JANSEN'}
{'pop': 747, 'state': 'NE', 'zip': '68378', 'city': 'JOHNSON'}
{'pop': 313, 'state': 'NE', 'zip': '68379', 'city': 'JULIAN'}
{'pop': 189, 'state': 'NE', 'zip': '68380', 'city': 'LEWISTON'}
{'pop': 422, 'state': 'NE', 'zip': '68381', 'city': 'LIBERTY'}
{'pop': 820, 'state': 'NE', 'zip': '68401', 'city': 'MC COOL JUNCTION'}
{'pop': 954, 'state': 'NE', 'zip': '68402', 'city': 'MALCOLM'}
{'pop': 864, 'state': 'NE', 'zip': '68404', 'city': 'MARTELL'}
{'pop': 3258, 'state': 'NE', 'zip': '68405', 'city': 'MILFORD'}
{'pop': 477, 'state': 'NE', 'zip': '68406', 'city': 'MILLIGAN'}
{'pop': 622, 'state': 'NE', 'zip': 

{'pop': 10272, 'state': 'NJ', 'zip': '08824', 'city': 'KENDALL PARK'}
{'pop': 4383, 'state': 'NJ', 'zip': '08825', 'city': 'FRENCHTOWN'}
{'pop': 5525, 'state': 'NJ', 'zip': '08826', 'city': 'GLEN GARDNER'}
{'pop': 4441, 'state': 'NJ', 'zip': '08827', 'city': 'HAMPTON'}
{'pop': 1211, 'state': 'NJ', 'zip': '08828', 'city': 'HELMETTA'}
{'pop': 3886, 'state': 'NJ', 'zip': '08829', 'city': 'HIGH BRIDGE'}
{'pop': 16313, 'state': 'NJ', 'zip': '08830', 'city': 'ISELIN'}
{'pop': 15743, 'state': 'NJ', 'zip': '08831', 'city': 'JAMESBURG'}
{'pop': 2746, 'state': 'NJ', 'zip': '08832', 'city': 'KEASBEY'}
{'pop': 7270, 'state': 'NJ', 'zip': '08833', 'city': 'LEBANON'}
{'pop': 10419, 'state': 'NJ', 'zip': '08835', 'city': 'MANVILLE'}
{'pop': 3024, 'state': 'NJ', 'zip': '08836', 'city': 'MARTINSVILLE'}
{'pop': 9447, 'state': 'NJ', 'zip': '08837', 'city': 'EDISON'}
{'pop': 20017, 'state': 'NJ', 'zip': '08840', 'city': 'METUCHEN'}
{'pop': 13055, 'state': 'NJ', 'zip': '08846', 'city': 'MIDDLESEX'}
{'pop':

{'pop': 3760, 'state': 'NY', 'zip': '14125', 'city': 'OAKFIELD'}
{'pop': 26554, 'state': 'NY', 'zip': '14127', 'city': 'ORCHARD PARK'}
{'pop': 2198, 'state': 'NY', 'zip': '14129', 'city': 'PERRYSBURG'}
{'pop': 5836, 'state': 'NY', 'zip': '14131', 'city': 'RANSOMVILLE'}
{'pop': 5167, 'state': 'NY', 'zip': '14132', 'city': 'SANBORN'}
{'pop': 133, 'state': 'NY', 'zip': '14134', 'city': 'SARDINIA'}
{'pop': 5768, 'state': 'NY', 'zip': '14136', 'city': 'SILVER CREEK'}
{'pop': 1600, 'state': 'NY', 'zip': '14138', 'city': 'SOUTH DAYTON'}
{'pop': 2269, 'state': 'NY', 'zip': '14139', 'city': 'SOUTH WALES'}
{'pop': 7146, 'state': 'NY', 'zip': '14141', 'city': 'SPRINGVILLE'}
{'pop': 2076, 'state': 'NY', 'zip': '14143', 'city': 'STAFFORD'}
{'pop': 1374, 'state': 'NY', 'zip': '14145', 'city': 'STRYKERSVILLE'}
{'pop': 53410, 'state': 'NY', 'zip': '14150', 'city': 'TONAWANDA'}
{'pop': 1782, 'state': 'NY', 'zip': '14167', 'city': 'VARYSBURG'}
{'pop': 2217, 'state': 'NY', 'zip': '14170', 'city': 'WEST F

{'pop': 8471, 'state': 'OH', 'zip': '43620', 'city': 'TOLEDO'}
{'pop': 21315, 'state': 'OH', 'zip': '43623', 'city': 'TOLEDO'}
{'pop': 1596, 'state': 'OH', 'zip': '43624', 'city': 'TOLEDO'}
{'pop': 56655, 'state': 'OH', 'zip': '43701', 'city': 'SONORA'}
{'pop': 7140, 'state': 'OH', 'zip': '43713', 'city': 'SOMERTON'}
{'pop': 716, 'state': 'OH', 'zip': '43716', 'city': 'BEALLSVILLE'}
{'pop': 3229, 'state': 'OH', 'zip': '43718', 'city': 'BELMONT'}
{'pop': 2464, 'state': 'OH', 'zip': '43719', 'city': 'BETHESDA'}
{'pop': 1001, 'state': 'OH', 'zip': '43720', 'city': 'BLUE ROCK'}
{'pop': 5164, 'state': 'OH', 'zip': '43723', 'city': 'BYESVILLE'}
{'pop': 7043, 'state': 'OH', 'zip': '43724', 'city': 'CALDWELL'}
{'pop': 21261, 'state': 'OH', 'zip': '43725', 'city': 'CLAYSVILLE'}
{'pop': 1368, 'state': 'OH', 'zip': '43727', 'city': 'CHANDLERSVILLE'}
{'pop': 1323, 'state': 'OH', 'zip': '43728', 'city': 'CHESTERHILL'}
{'pop': 3374, 'state': 'OH', 'zip': '43730', 'city': 'HEMLOCK'}
{'pop': 4609, 'st

{'pop': 2905, 'state': 'OR', 'zip': '97443', 'city': 'GLIDE'}
{'pop': 4760, 'state': 'OR', 'zip': '97444', 'city': 'PISTOL RIVER'}
{'pop': 3272, 'state': 'OR', 'zip': '97446', 'city': 'HARRISBURG'}
{'pop': 222, 'state': 'OR', 'zip': '97447', 'city': 'IDLEYLD PARK'}
{'pop': 10456, 'state': 'OR', 'zip': '97448', 'city': 'JUNCTION CITY'}
{'pop': 994, 'state': 'OR', 'zip': '97449', 'city': 'LAKESIDE'}
{'pop': 557, 'state': 'OR', 'zip': '97450', 'city': 'LANGLOIS'}
{'pop': 499, 'state': 'OR', 'zip': '97451', 'city': 'LORANE'}
{'pop': 792, 'state': 'OR', 'zip': '97452', 'city': 'LOWELL'}
{'pop': 1104, 'state': 'OR', 'zip': '97453', 'city': 'MAPLETON'}
{'pop': 1442, 'state': 'OR', 'zip': '97454', 'city': 'MARCOLA'}
{'pop': 2218, 'state': 'OR', 'zip': '97455', 'city': 'PLEASANT HILL'}
{'pop': 2478, 'state': 'OR', 'zip': '97456', 'city': 'MONROE'}
{'pop': 9453, 'state': 'OR', 'zip': '97457', 'city': 'MYRTLE CREEK'}
{'pop': 5246, 'state': 'OR', 'zip': '97458', 'city': 'MYRTLE POINT'}
{'pop': 152

{'pop': 9959, 'state': 'PA', 'zip': '19526', 'city': 'HAMBURG'}
{'pop': 2387, 'state': 'PA', 'zip': '19529', 'city': 'KEMPTON'}
{'pop': 13345, 'state': 'PA', 'zip': '19530', 'city': 'KUTZTOWN'}
{'pop': 6199, 'state': 'PA', 'zip': '19533', 'city': 'LEESPORT'}
{'pop': 1840, 'state': 'PA', 'zip': '19534', 'city': 'LENHARTSVILLE'}
{'pop': 4058, 'state': 'PA', 'zip': '19539', 'city': 'MERTZTOWN'}
{'pop': 8402, 'state': 'PA', 'zip': '19540', 'city': 'MOHNTON'}
{'pop': 3473, 'state': 'PA', 'zip': '19541', 'city': 'MOHRSVILLE'}
{'pop': 2121, 'state': 'PA', 'zip': '19543', 'city': 'MORGANTOWN'}
{'pop': 3949, 'state': 'PA', 'zip': '19547', 'city': 'OLEY'}
{'pop': 328, 'state': 'PA', 'zip': '19549', 'city': 'PORT CLINTON'}
{'pop': 5310, 'state': 'PA', 'zip': '19551', 'city': 'ROBESONIA'}
{'pop': 3947, 'state': 'PA', 'zip': '19555', 'city': 'SHOEMAKERSVILLE'}
{'pop': 7503, 'state': 'PA', 'zip': '19560', 'city': 'TEMPLE'}
{'pop': 1987, 'state': 'PA', 'zip': '19562', 'city': 'TOPTON'}
{'pop': 5056, 

{'pop': 52779, 'state': 'TX', 'zip': '75051', 'city': 'GRAND PRAIRIE'}
{'pop': 15850, 'state': 'TX', 'zip': '75052', 'city': 'GRAND PRAIRIE'}
{'pop': 22549, 'state': 'TX', 'zip': '75056', 'city': 'THE COLONY'}
{'pop': 8052, 'state': 'TX', 'zip': '75057', 'city': 'LEWISVILLE'}
{'pop': 1410, 'state': 'TX', 'zip': '75058', 'city': 'GUNTER'}
{'pop': 41001, 'state': 'TX', 'zip': '75060', 'city': 'IRVING'}
{'pop': 42947, 'state': 'TX', 'zip': '75061', 'city': 'IRVING'}
{'pop': 40234, 'state': 'TX', 'zip': '75062', 'city': 'IRVING'}
{'pop': 9527, 'state': 'TX', 'zip': '75063', 'city': 'IRVING'}
{'pop': 5452, 'state': 'TX', 'zip': '75065', 'city': 'LAKE DALLAS'}
{'pop': 46151, 'state': 'TX', 'zip': '75067', 'city': 'HIGHLAND VILLAGE'}
{'pop': 3952, 'state': 'TX', 'zip': '75068', 'city': 'LAKEWOOD VILLAGE'}
{'pop': 20865, 'state': 'TX', 'zip': '75069', 'city': 'MC KINNEY'}
{'pop': 5573, 'state': 'TX', 'zip': '75070', 'city': 'MC KINNEY'}
{'pop': 29591, 'state': 'TX', 'zip': '75074', 'city': 'PL

{'pop': 2480, 'state': 'VT', 'zip': '05033', 'city': 'BRADFORD'}
{'pop': 130, 'state': 'VT', 'zip': '05034', 'city': 'BRIDGEWATER'}
{'pop': 662, 'state': 'VT', 'zip': '05035', 'city': 'BRIDGEWATER CORN'}
{'pop': 453, 'state': 'VT', 'zip': '05036', 'city': 'BROOKFIELD'}
{'pop': 415, 'state': 'VT', 'zip': '05037', 'city': 'BROWNSVILLE'}
{'pop': 1022, 'state': 'VT', 'zip': '05038', 'city': 'CHELSEA'}
{'pop': 1035, 'state': 'VT', 'zip': '05039', 'city': 'CORINTH'}
{'pop': 279, 'state': 'VT', 'zip': '05040', 'city': 'EAST CORINTH'}
{'pop': 322, 'state': 'VT', 'zip': '05041', 'city': 'EAST RANDOLPH'}
{'pop': 328, 'state': 'VT', 'zip': '05042', 'city': 'RYEGATE'}
{'pop': 657, 'state': 'VT', 'zip': '05043', 'city': 'EAST THETFORD'}
{'pop': 1631, 'state': 'VT', 'zip': '05045', 'city': 'FAIRLEE'}
{'pop': 862, 'state': 'VT', 'zip': '05046', 'city': 'GROTON'}
{'pop': 1730, 'state': 'VT', 'zip': '05048', 'city': 'HARTLAND'}
{'pop': 1488, 'state': 'VT', 'zip': '05051', 'city': 'NEWBURY'}
{'pop': 429

{'pop': 7127, 'state': 'VA', 'zip': '24558', 'city': 'HALIFAX'}
{'pop': 21, 'state': 'VA', 'zip': '24562', 'city': 'HOWARDSVILLE'}
{'pop': 5283, 'state': 'VA', 'zip': '24563', 'city': 'HURT'}
{'pop': 1111, 'state': 'VA', 'zip': '24565', 'city': 'JAVA'}
{'pop': 2651, 'state': 'VA', 'zip': '24566', 'city': 'KEELING'}
{'pop': 1308, 'state': 'VA', 'zip': '24569', 'city': 'LONG ISLAND'}
{'pop': 1342, 'state': 'VA', 'zip': '24570', 'city': 'LOWRY'}
{'pop': 2819, 'state': 'VA', 'zip': '24571', 'city': 'LYNCH STATION'}
{'pop': 15389, 'state': 'VA', 'zip': '24572', 'city': 'MADISON HEIGHTS'}
{'pop': 5050, 'state': 'VA', 'zip': '24574', 'city': 'MONROE'}
{'pop': 5018, 'state': 'VA', 'zip': '24577', 'city': 'LENNIG'}
{'pop': 1236, 'state': 'VA', 'zip': '24578', 'city': 'NATURAL BRIDGE'}
{'pop': 1419, 'state': 'VA', 'zip': '24579', 'city': 'NATURAL BRIDGE S'}
{'pop': 131, 'state': 'VA', 'zip': '24580', 'city': 'NELSON'}
{'pop': 4728, 'state': 'VA', 'zip': '24586', 'city': 'RINGGOLD'}
{'pop': 4723,

{'pop': 652, 'state': 'WI', 'zip': '54756', 'city': 'NELSON'}
{'pop': 2101, 'state': 'WI', 'zip': '54757', 'city': 'NEW AUBURN'}
{'pop': 4347, 'state': 'WI', 'zip': '54758', 'city': 'OSSEO'}
{'pop': 1504, 'state': 'WI', 'zip': '54759', 'city': 'PEPIN'}
{'pop': 1050, 'state': 'WI', 'zip': '54761', 'city': 'PLUM CITY'}
{'pop': 1061, 'state': 'WI', 'zip': '54762', 'city': 'PRAIRIE FARM'}
{'pop': 863, 'state': 'WI', 'zip': '54763', 'city': 'RIDGELAND'}
{'pop': 501, 'state': 'WI', 'zip': '54765', 'city': 'SAND CREEK'}
{'pop': 1711, 'state': 'WI', 'zip': '54766', 'city': 'SHELDON'}
{'pop': 2746, 'state': 'WI', 'zip': '54767', 'city': 'SPRING VALLEY'}
{'pop': 3157, 'state': 'WI', 'zip': '54768', 'city': 'STANLEY'}
{'pop': 434, 'state': 'WI', 'zip': '54769', 'city': 'STOCKHOLM'}
{'pop': 1560, 'state': 'WI', 'zip': '54770', 'city': 'STRUM'}
{'pop': 4803, 'state': 'WI', 'zip': '54771', 'city': 'THORP'}
{'pop': 1094, 'state': 'WI', 'zip': '54772', 'city': 'WHEELER'}
{'pop': 3330, 'state': 'WI', '

# 3. $group

Permite agrupar y agregar posteriormente los datos agrupados. Recibe varios parámetros:

* El primero indica los parámetros por los que agrupar y genera el accumulator object que siempre se representa con el campo _id
* Los siguientes, las operaciones que se quieren hacer sobre los datos agrupados y el campo del nuevo documento donde se va ha dejar el valor calculado.

Vamos a ver un ejemplo. La siguiente sentencia agrupa los productos por el campo manufacturer y para cada fabricante suma los precios de sus productos. 

Como todo stage de un pipeline genera una nueva colección de salida con los resultados de la agregación. Para cada fabricante genera un documento nuevo con un campo __id que es el conjunto de campos por el que se ha agregado, en este caso maker que contiene el nombre del fabricante y un campo sum_prices con el resultado de la agregación.


In [35]:
total_price_by_maker = db.products.aggregate([
    {"$group": { 
        "_id": { "maker":"$manufacturer" },
        "sum_prices": { "$sum":"$price" }
    }}
])

for maker in total_price_by_maker:
    print(maker)

{'_id': {'maker': 'Samsung'}, 'sum_prices': 1014.98}
{'_id': {'maker': 'Amazon'}, 'sum_prices': 328.0}
{'_id': {'maker': 'Sony'}, 'sum_prices': 499.0}
{'_id': {'maker': 'Google'}, 'sum_prices': 199.0}
{'_id': {'maker': 'Apple'}, 'sum_prices': 2296.0}


La variable $$ROOT contiene el documento original del stage anterior y lo podemos utilizar para pasarlo tal cual al siguiente stage.

In [43]:
total_price_by_maker = db.products.aggregate([
    {"$group": { 
        "_id": { "maker":"$manufacturer" },
        "sum_prices": { "$sum":"$price" },
        "entries": { "$push": "$$ROOT" }
    }}
])

for maker in total_price_by_maker:
    print(maker)

{'_id': {'maker': 'Sony'}, 'sum_prices': 499.0, 'entries': [{'_id': ObjectId('65e04826989f89c2656dfd6d'), 'name': 'Vaio', 'category': 'Laptops', 'manufacturer': 'Sony', 'price': 499.0}]}
{'_id': {'maker': 'Google'}, 'sum_prices': 199.0, 'entries': [{'_id': ObjectId('65e04826989f89c2656dfd6f'), 'name': 'Nexus 7', 'category': 'Tablets', 'manufacturer': 'Google', 'price': 199.0}]}
{'_id': {'maker': 'Apple'}, 'sum_prices': 2296.0, 'entries': [{'_id': ObjectId('65e04826989f89c2656dfd68'), 'name': 'iPad 16GB Wifi', 'manufacturer': 'Apple', 'category': 'Tablets', 'price': 499.0}, {'_id': ObjectId('65e04826989f89c2656dfd69'), 'name': 'iPad 32GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 599.0}, {'_id': ObjectId('65e04826989f89c2656dfd6a'), 'name': 'iPad 64GB Wifi', 'category': 'Tablets', 'manufacturer': 'Apple', 'price': 699.0}, {'_id': ObjectId('65e04826989f89c2656dfd6e'), 'name': 'Macbook Air 13inch', 'category': 'Laptops', 'manufacturer': 'Apple', 'price': 499.0}]}
{'_i

Si queremos contar el número de documentos que hay por grupo podemos utilizar el operador sum. Por ejemplo si queremos contar cuantos productos tiene cada fabricante haríamos la siguiente consulta:

In [44]:
products_by_maker = db.products.aggregate([
    { "$group": {
        "_id": {"manufacturer":"$manufacturer" },
        "num_products": { "$sum": 1 }
     }}
])

for maker in products_by_maker:
    print(maker)

{'_id': {'manufacturer': 'Google'}, 'num_products': 1}
{'_id': {'manufacturer': 'Apple'}, 'num_products': 4}
{'_id': {'manufacturer': 'Amazon'}, 'num_products': 2}
{'_id': {'manufacturer': 'Samsung'}, 'num_products': 2}
{'_id': {'manufacturer': 'Sony'}, 'num_products': 1}


El operador group lo podemos combinar con el operador match. El siguiente ejemplo la agregación tiene dos stages, el primero filtra los códigos zip del la colección original y el segundo stage toma como colección de entrada estos valores filtrados y los agrupa por ciudad para realizar la suma de la población de los habitantes que hay por cada código zip de cada ciudad y además añade los codigos zip de esa ciudad a una colección en el campo zip_codes.

In [45]:
ny_zips = db.zips.aggregate([
    { "$match": { "state": "NY" }},
    { "$group": { 
        "_id": "$city", 
        "population": {"$sum": "$pop"}, 
        "zip_codes": {"$addToSet": "$_id"} } 
    }
])

for zip in ny_zips:
    print(zip)

{'_id': 'KEESEVILLE', 'population': 4506, 'zip_codes': ['12944', '12924']}
{'_id': 'JAMESVILLE', 'population': 8230, 'zip_codes': ['13078']}
{'_id': 'AVA', 'population': 1708, 'zip_codes': ['13303']}
{'_id': 'JAMESTOWN', 'population': 45344, 'zip_codes': ['14701']}
{'_id': 'INDIAN LAKE', 'population': 1247, 'zip_codes': ['12842']}
{'_id': 'LAKE PEEKSKILL', 'population': 1604, 'zip_codes': ['10537']}
{'_id': 'ANCRAMDALE', 'population': 918, 'zip_codes': ['12503']}
{'_id': 'LA FAYETTE', 'population': 4450, 'zip_codes': ['13084']}
{'_id': 'TILLSON', 'population': 377, 'zip_codes': ['12486']}
{'_id': 'SACKETS HARBOR', 'population': 1943, 'zip_codes': ['13685']}
{'_id': 'EAST ISLIP', 'population': 15777, 'zip_codes': ['11730']}
{'_id': 'JAY', 'population': 1245, 'zip_codes': ['12941']}
{'_id': 'ESSEX', 'population': 406, 'zip_codes': ['12936']}
{'_id': 'MILTON', 'population': 2834, 'zip_codes': ['12547']}
{'_id': 'LYONS', 'population': 8168, 'zip_codes': ['14489']}
{'_id': 'BALLSTON SPA', '

A la sentecia anterior podemos ademas añadirle un nuevo stage que tome los documentos resultantes del stage de agregación para cambiar su proyección, eliminando el camo _id y añadiendo el campo city con el valor del campo _id.  

In [46]:
ny_zips =  db.zips.aggregate([
    { "$match": { "state": "NY" } },
    { "$group": { "_id": "$city", "population": {"$sum":"$pop"}, "zip_codes": {"$addToSet": "$_id"} } },
    { "$project": { "_id": 0, "city": "$_id", "population": 1, "zip_codes": 1 } }
])

for zip in ny_zips:
    print(zip)

{'population': 8486, 'zip_codes': ['14502'], 'city': 'MACEDON'}
{'population': 3763, 'zip_codes': ['12449'], 'city': 'LAKE KATRINE'}
{'population': 4850, 'zip_codes': ['13743'], 'city': 'CANDOR'}
{'population': 3102, 'zip_codes': ['14561'], 'city': 'STANLEY'}
{'population': 11027, 'zip_codes': ['11518'], 'city': 'EAST ROCKAWAY'}
{'population': 106, 'zip_codes': ['13353'], 'city': 'HOFFMEISTER'}
{'population': 5976, 'zip_codes': ['12143'], 'city': 'RAVENA'}
{'population': 224162, 'zip_codes': ['11371', '11358', '11355', '11354', '11364', '11367'], 'city': 'FLUSHING'}
{'population': 308, 'zip_codes': ['12851'], 'city': 'MINERVA'}
{'population': 996, 'zip_codes': ['10964'], 'city': 'PALISADES'}
{'population': 7113, 'zip_codes': ['11516'], 'city': 'CEDARHURST'}
{'population': 161, 'zip_codes': ['13483'], 'city': 'WESTDALE'}
{'population': 4013, 'zip_codes': ['13460'], 'city': 'SHERBURNE'}
{'population': 483, 'zip_codes': ['14462'], 'city': 'GROVELAND'}
{'population': 95, 'zip_codes': ['136

In [50]:
# Reorganizar la salida con el campo 'city' el primero y ordenar por ciudades
ny_zips =  db.zips.aggregate([
    { "$match": { "state": "NY" } },
    { "$group": { "_id": "$city", "population": {"$sum":"$pop"}, "zip_codes": {"$addToSet": "$_id"} } },
    { "$project": { "_id": 0, "city": "$_id", "population": 1, "zip_codes": 1 } },
    { "$sort": { "city": 1 } }
])

for zip in ny_zips:
    # Debemos reorganizar en la salida ya que mongo no garanciza el orden de salida
    reorganizado = {'city': zip['city'], 'population': zip['population'], 'zip_codes': zip['zip_codes']}
    print(reorganizado)


{'city': '12462', 'population': 53, 'zip_codes': ['12462']}
{'city': 'ACCORD', 'population': 2695, 'zip_codes': ['12404']}
{'city': 'ACRA', 'population': 525, 'zip_codes': ['12405']}
{'city': 'ADAMS BASIN', 'population': 989, 'zip_codes': ['14410']}
{'city': 'ADAMS CENTER', 'population': 2649, 'zip_codes': ['13606']}
{'city': 'ADDISON', 'population': 4967, 'zip_codes': ['14801']}
{'city': 'ADIRONDACK', 'population': 105, 'zip_codes': ['12808']}
{'city': 'AFTON', 'population': 2801, 'zip_codes': ['13730']}
{'city': 'AKRON', 'population': 7924, 'zip_codes': ['14001']}
{'city': 'ALABAMA', 'population': 68, 'zip_codes': ['14003']}
{'city': 'ALBANY', 'population': 79386, 'zip_codes': ['12202', '12207', '12208', '12204', '12206', '12209', '12210']}
{'city': 'ALBERTSON', 'population': 7091, 'zip_codes': ['11507']}
{'city': 'ALBION', 'population': 12743, 'zip_codes': ['14411']}
{'city': 'ALCOVE', 'population': 233, 'zip_codes': ['12007']}
{'city': 'ALDEN', 'population': 12711, 'zip_codes': ['1

Vamos a ver más opearadores de agregación.

In [51]:
max_products = db.products.aggregate([
    {"$group":{
        "_id": { "maker":"$manufacturer"},
         "maxprice": {"$max":"$price"}
    }}
])

for product in max_products:
    print(product)

{'_id': {'maker': 'Sony'}, 'maxprice': 499.0}
{'_id': {'maker': 'Samsung'}, 'maxprice': 563.99}
{'_id': {'maker': 'Apple'}, 'maxprice': 699.0}
{'_id': {'maker': 'Amazon'}, 'maxprice': 199.0}
{'_id': {'maker': 'Google'}, 'maxprice': 199.0}


1. ¿Qué crees que hace la sentencia anterior?

In [52]:
avg_products = db.products.aggregate([
    {"$group": {
        "_id": { "category":"$category" },
        "avg_price": {"$avg":"$price"}
     }}
])

for product in avg_products:
    print(product)

{'_id': {'category': 'Cell Phones'}, 'avg_price': 563.99}
{'_id': {'category': 'Laptops'}, 'avg_price': 499.0}
{'_id': {'category': 'Tablets'}, 'avg_price': 396.4271428571428}


1. ¿Qué crees que hace la sentencia anterior?

In [53]:
set_products = db.products.aggregate([
    {"$group": { 
        "_id": { "maker":"$manufacturer" },
        "categories": { "$addToSet":"$category" }
     }}
])

for product in set_products:
    print(product)

{'_id': {'maker': 'Sony'}, 'categories': ['Laptops']}
{'_id': {'maker': 'Google'}, 'categories': ['Tablets']}
{'_id': {'maker': 'Apple'}, 'categories': ['Laptops', 'Tablets']}
{'_id': {'maker': 'Amazon'}, 'categories': ['Tablets']}
{'_id': {'maker': 'Samsung'}, 'categories': ['Cell Phones', 'Tablets']}


1. ¿Qué crees que hace la sentencia anterior?

Agrupar por el fabricante (manufacturer) y para cada grupo, se crea un conjunto de categorías (category) únicas asociadas con ese fabricante.

In [54]:
list_products = db.products.aggregate([
    {"$group": {
        "_id": { "maker": "$manufacturer" },
        "categories": { "$push": "$category"}
    }}
])

for product in list_products:
    print(product)

{'_id': {'maker': 'Sony'}, 'categories': ['Laptops']}
{'_id': {'maker': 'Google'}, 'categories': ['Tablets']}
{'_id': {'maker': 'Apple'}, 'categories': ['Tablets', 'Tablets', 'Tablets', 'Laptops']}
{'_id': {'maker': 'Amazon'}, 'categories': ['Tablets', 'Tablets']}
{'_id': {'maker': 'Samsung'}, 'categories': ['Cell Phones', 'Tablets']}


1. ¿Qué crees que hace la sentencia anterior?

Agrupar por el fabricante (manufacturer) y para cada grupo, se crea un arreglo (categories) que contiene todas las categorías asociadas con ese fabricante. Si hay duplicados en las categorías, esos duplicados se conservarán en el arreglo.

2. ¿Qué diferencia hay entre addToSet y push?

La expresión 'push' agrega todos los valores, incluidos los duplicados. 'addToSet' aggrega valores únicos, no habrá doplicados.

Puedes entrar en esta página de la documentación de mongo para ver que más operadores puedes utilizar:
https://docs.mongodb.com/manual/reference/operator/aggregation/

## Ejercicio 3: 

Sobre la colección de códigos zip.

* Obten el total de población por estado.
* Obten el total de población por estado y por ciudad.
* Cuenta el número de ciudades que hay por estado.
* Obten por estado una lista con sus ciudades y su media de población.

#### SOLUCIÓN:

In [55]:
# total de población por estado
pipeline_estado = [
    {
        "$group": {
            "_id": "$state",
            "total_population": {"$sum": "$pop"}
        }
    }
]

resultado_estado = db.zips.aggregate(pipeline_estado)

for estado in resultado_estado:
    print(estado)

{'_id': 'MO', 'total_population': 5114343}
{'_id': 'UT', 'total_population': 1722850}
{'_id': 'WV', 'total_population': 1793477}
{'_id': 'SD', 'total_population': 696004}
{'_id': 'TX', 'total_population': 16986510}
{'_id': 'WY', 'total_population': 453588}
{'_id': 'OK', 'total_population': 3145585}
{'_id': 'CO', 'total_population': 3294394}
{'_id': 'NV', 'total_population': 1201833}
{'_id': 'AZ', 'total_population': 3665228}
{'_id': 'KY', 'total_population': 3685296}
{'_id': 'MN', 'total_population': 4375099}
{'_id': 'VT', 'total_population': 562758}
{'_id': 'CA', 'total_population': 29760021}
{'_id': 'NH', 'total_population': 1109252}
{'_id': 'PA', 'total_population': 11881643}
{'_id': 'NJ', 'total_population': 7730188}
{'_id': 'KS', 'total_population': 2477574}
{'_id': 'IN', 'total_population': 5544159}
{'_id': 'CT', 'total_population': 3287116}
{'_id': 'ME', 'total_population': 1227928}
{'_id': 'MT', 'total_population': 799065}
{'_id': 'NE', 'total_population': 1578385}
{'_id': 'MS'

In [73]:
# Total de población por estado y por ciudad (ordenados por total poplación asc):
total_poblacion_por_estado_ciudad = db.zips.aggregate([
    {"$group": {
        "_id": {"state": "$state", "city": "$city"},
        "total_population": {"$sum": "$pop"}
    }},
    {"$project": {
        "_id": 0,
        "state": "$_id.state",
        "city": "$_id.city",
        "total_population": 1
    }},
    {"$sort":{"total_population":1}}
])

for result in total_poblacion_por_estado_ciudad:
    print(result)


{'total_population': 0, 'state': 'NC', 'city': 'GLOUCESTER'}
{'total_population': 0, 'state': 'AK', 'city': 'SHUNGNAK'}
{'total_population': 0, 'state': 'MI', 'city': 'LELAND'}
{'total_population': 0, 'state': 'CA', 'city': 'ALLEGHANY'}
{'total_population': 0, 'state': 'LA', 'city': 'LAFITTE'}
{'total_population': 0, 'state': 'WV', 'city': 'MOUNT CARBON'}
{'total_population': 0, 'state': 'NM', 'city': 'KIRTLAND A F B E'}
{'total_population': 0, 'state': 'SC', 'city': 'QUINBY'}
{'total_population': 0, 'state': 'CA', 'city': 'VINTON'}
{'total_population': 0, 'state': 'AK', 'city': 'SLEETMUTE'}
{'total_population': 0, 'state': 'AK', 'city': 'GRAYLING'}
{'total_population': 0, 'state': 'TX', 'city': 'ECLETO'}
{'total_population': 0, 'state': 'AK', 'city': 'RUSSIAN MISSION'}
{'total_population': 0, 'state': 'KY', 'city': 'BROWDER'}
{'total_population': 0, 'state': 'LA', 'city': 'FORDOCHE'}
{'total_population': 0, 'state': 'PA', 'city': 'HAMILTON'}
{'total_population': 0, 'state': 'NY', 'cit

{'total_population': 224, 'state': 'MT', 'city': 'WISDOM'}
{'total_population': 224, 'state': 'PA', 'city': 'PRESTON PARK'}
{'total_population': 224, 'state': 'NM', 'city': 'YESO'}
{'total_population': 224, 'state': 'MT', 'city': 'BABB'}
{'total_population': 225, 'state': 'NM', 'city': 'POLVADERA'}
{'total_population': 225, 'state': 'CO', 'city': 'PINECLIFFE'}
{'total_population': 225, 'state': 'OR', 'city': 'DORENA'}
{'total_population': 225, 'state': 'SD', 'city': 'ERWIN'}
{'total_population': 225, 'state': 'AR', 'city': 'SNOW LAKE'}
{'total_population': 225, 'state': 'OK', 'city': 'LAMAR'}
{'total_population': 225, 'state': 'NE', 'city': 'DUNNING'}
{'total_population': 225, 'state': 'ME', 'city': 'SAINT GEORGE'}
{'total_population': 226, 'state': 'NE', 'city': 'DIXON'}
{'total_population': 226, 'state': 'WV', 'city': 'NORTH SPRING'}
{'total_population': 226, 'state': 'PA', 'city': 'JONES MILLS'}
{'total_population': 226, 'state': 'NE', 'city': 'VIRGINIA'}
{'total_population': 226, '

{'total_population': 378, 'state': 'NM', 'city': 'WATERFLOW'}
{'total_population': 378, 'state': 'WV', 'city': 'SWEETLAND'}
{'total_population': 378, 'state': 'OH', 'city': 'BRINKHAVEN'}
{'total_population': 378, 'state': 'OH', 'city': 'WHARTON'}
{'total_population': 378, 'state': 'IA', 'city': 'IRA'}
{'total_population': 378, 'state': 'ND', 'city': 'WINDSOR'}
{'total_population': 378, 'state': 'NJ', 'city': 'THREE BRIDGES'}
{'total_population': 378, 'state': 'OR', 'city': 'CAMP SHERMAN'}
{'total_population': 378, 'state': 'SD', 'city': 'LONGLAKE'}
{'total_population': 379, 'state': 'ND', 'city': 'MEDORA'}
{'total_population': 379, 'state': 'CA', 'city': 'HORSE CREEK'}
{'total_population': 379, 'state': 'AR', 'city': 'SAFFELL'}
{'total_population': 379, 'state': 'MO', 'city': 'GOODSON'}
{'total_population': 379, 'state': 'WA', 'city': 'EDWALL'}
{'total_population': 379, 'state': 'NE', 'city': 'ODESSA'}
{'total_population': 379, 'state': 'KS', 'city': 'WHITE CLOUD'}
{'total_population':

{'total_population': 615, 'state': 'VT', 'city': 'LEICESTER JUNCTI'}
{'total_population': 615, 'state': 'NY', 'city': 'DOWNSVILLE'}
{'total_population': 615, 'state': 'NY', 'city': 'CHEMUNG'}
{'total_population': 615, 'state': 'NH', 'city': 'CENTER SANDWICH'}
{'total_population': 615, 'state': 'IA', 'city': 'LOHRVILLE'}
{'total_population': 615, 'state': 'NY', 'city': 'GODEFFROY'}
{'total_population': 615, 'state': 'AR', 'city': 'MORROW'}
{'total_population': 616, 'state': 'WI', 'city': 'SUMMIT LAKE'}
{'total_population': 616, 'state': 'NE', 'city': 'AYR'}
{'total_population': 616, 'state': 'VA', 'city': 'RED HOUSE'}
{'total_population': 616, 'state': 'PA', 'city': 'DUDLEY'}
{'total_population': 616, 'state': 'ME', 'city': 'MONROE'}
{'total_population': 616, 'state': 'TX', 'city': 'WASHINGTON'}
{'total_population': 616, 'state': 'ME', 'city': 'NORTH MONMOUTH'}
{'total_population': 616, 'state': 'NY', 'city': 'HUNTER'}
{'total_population': 616, 'state': 'AR', 'city': 'THIDA'}
{'total_po

{'total_population': 879, 'state': 'KY', 'city': 'BUCKINGHAM'}
{'total_population': 879, 'state': 'OR', 'city': 'JORDAN VALLEY'}
{'total_population': 879, 'state': 'WI', 'city': 'BAGLEY'}
{'total_population': 879, 'state': 'IA', 'city': 'ELLIOTT'}
{'total_population': 879, 'state': 'IN', 'city': 'FOREST'}
{'total_population': 879, 'state': 'MN', 'city': 'SHEVLIN'}
{'total_population': 880, 'state': 'NC', 'city': 'STUMPY POINT'}
{'total_population': 880, 'state': 'WV', 'city': 'HIGHLAND'}
{'total_population': 880, 'state': 'MN', 'city': 'PEMBERTON'}
{'total_population': 881, 'state': 'AK', 'city': 'SAND POINT'}
{'total_population': 881, 'state': 'MT', 'city': 'EKALAKA'}
{'total_population': 881, 'state': 'TN', 'city': 'SAINT JOSEPH'}
{'total_population': 881, 'state': 'NY', 'city': 'MC DONOUGH'}
{'total_population': 881, 'state': 'MO', 'city': 'MOKANE'}
{'total_population': 881, 'state': 'KS', 'city': 'FOWLER'}
{'total_population': 881, 'state': 'GA', 'city': 'COBB'}
{'total_population'

{'total_population': 1164, 'state': 'IA', 'city': 'BATAVIA'}
{'total_population': 1165, 'state': 'IA', 'city': 'MORNING SUN'}
{'total_population': 1165, 'state': 'WA', 'city': 'HOODSPORT'}
{'total_population': 1166, 'state': 'OK', 'city': 'SHARON'}
{'total_population': 1166, 'state': 'IL', 'city': 'TRIVOLI'}
{'total_population': 1166, 'state': 'IL', 'city': 'GLADSTONE'}
{'total_population': 1166, 'state': 'ND', 'city': 'RUTLAND'}
{'total_population': 1167, 'state': 'WI', 'city': 'BAILEYS HARBOR'}
{'total_population': 1167, 'state': 'MI', 'city': 'LINCOLN'}
{'total_population': 1167, 'state': 'MO', 'city': 'WELLINGTON'}
{'total_population': 1167, 'state': 'IN', 'city': 'BRUCEVILLE'}
{'total_population': 1167, 'state': 'OK', 'city': 'GORE'}
{'total_population': 1167, 'state': 'IL', 'city': 'CHANA'}
{'total_population': 1168, 'state': 'AR', 'city': 'CONCORD'}
{'total_population': 1168, 'state': 'PA', 'city': 'WATERFALL'}
{'total_population': 1168, 'state': 'MN', 'city': 'PALISADE'}
{'tota

{'total_population': 1531, 'state': 'PA', 'city': 'COLVER'}
{'total_population': 1531, 'state': 'VA', 'city': 'ROWE'}
{'total_population': 1531, 'state': 'MI', 'city': 'SPRUCE'}
{'total_population': 1531, 'state': 'AL', 'city': 'DAWSON'}
{'total_population': 1532, 'state': 'VA', 'city': 'MEADOWS OF DAN'}
{'total_population': 1533, 'state': 'MA', 'city': 'SHUTESBURY'}
{'total_population': 1533, 'state': 'MO', 'city': 'FAIR PLAY'}
{'total_population': 1533, 'state': 'GA', 'city': 'MIDVILLE'}
{'total_population': 1533, 'state': 'MI', 'city': 'KALEVA'}
{'total_population': 1533, 'state': 'WI', 'city': 'CAVOUR'}
{'total_population': 1534, 'state': 'GA', 'city': 'DAMASCUS'}
{'total_population': 1534, 'state': 'KY', 'city': 'SPOTTSVILLE'}
{'total_population': 1534, 'state': 'IA', 'city': 'FONTANELLE'}
{'total_population': 1535, 'state': 'IA', 'city': 'DE SOTO'}
{'total_population': 1535, 'state': 'PA', 'city': 'TWIN ROCKS'}
{'total_population': 1535, 'state': 'IN', 'city': 'WINDFALL'}
{'total

{'total_population': 1977, 'state': 'AZ', 'city': 'WINKELMAN'}
{'total_population': 1977, 'state': 'IA', 'city': 'HOLSTEIN'}
{'total_population': 1977, 'state': 'TX', 'city': 'NEW WAVERLY'}
{'total_population': 1977, 'state': 'NY', 'city': 'CASSADAGA'}
{'total_population': 1978, 'state': 'PA', 'city': 'MILLHEIM'}
{'total_population': 1978, 'state': 'IL', 'city': 'ATLANTA'}
{'total_population': 1978, 'state': 'NE', 'city': 'PLAINVIEW'}
{'total_population': 1979, 'state': 'OK', 'city': 'SPERRY'}
{'total_population': 1979, 'state': 'KS', 'city': 'WASHINGTON'}
{'total_population': 1979, 'state': 'CO', 'city': 'KEENESBURG'}
{'total_population': 1979, 'state': 'KS', 'city': 'JOHNSON'}
{'total_population': 1980, 'state': 'AL', 'city': 'TOXEY'}
{'total_population': 1981, 'state': 'KY', 'city': 'HILLSBORO'}
{'total_population': 1981, 'state': 'NY', 'city': 'LIMESTONE'}
{'total_population': 1982, 'state': 'ME', 'city': 'MAPLETON'}
{'total_population': 1982, 'state': 'CO', 'city': 'BELLVUE'}
{'to

{'total_population': 2515, 'state': 'AL', 'city': 'BRILLIANT'}
{'total_population': 2515, 'state': 'PA', 'city': 'THOMPSONTOWN'}
{'total_population': 2516, 'state': 'MO', 'city': 'TIPTON'}
{'total_population': 2516, 'state': 'TX', 'city': 'SPURGER'}
{'total_population': 2516, 'state': 'VA', 'city': 'GOODE'}
{'total_population': 2517, 'state': 'OR', 'city': 'CULVER'}
{'total_population': 2517, 'state': 'VT', 'city': 'NORTH CLARENDON'}
{'total_population': 2517, 'state': 'FL', 'city': 'CARYVILLE'}
{'total_population': 2517, 'state': 'LA', 'city': 'PLAUCHEVILLE'}
{'total_population': 2517, 'state': 'FL', 'city': 'JACKSONVILLE N A'}
{'total_population': 2518, 'state': 'MO', 'city': 'FOLEY'}
{'total_population': 2519, 'state': 'OH', 'city': 'NEW MADISON'}
{'total_population': 2520, 'state': 'OK', 'city': 'ELMORE CITY'}
{'total_population': 2520, 'state': 'ID', 'city': 'ATHOL'}
{'total_population': 2520, 'state': 'WI', 'city': 'BOYCEVILLE'}
{'total_population': 2521, 'state': 'WV', 'city': '

{'total_population': 3491, 'state': 'VT', 'city': 'CAMBRIDGE'}
{'total_population': 3492, 'state': 'UT', 'city': 'EPHRAIM'}
{'total_population': 3493, 'state': 'LA', 'city': 'MANGHAM'}
{'total_population': 3493, 'state': 'NC', 'city': 'CLARKTON'}
{'total_population': 3494, 'state': 'IL', 'city': 'NEOGA'}
{'total_population': 3494, 'state': 'CO', 'city': 'IGNACIO'}
{'total_population': 3494, 'state': 'MD', 'city': 'LONACONING'}
{'total_population': 3494, 'state': 'VA', 'city': 'TIMBERVILLE'}
{'total_population': 3495, 'state': 'AR', 'city': 'FARMINGTON'}
{'total_population': 3496, 'state': 'MT', 'city': 'MONTANA CITY'}
{'total_population': 3497, 'state': 'KY', 'city': 'HEBRON'}
{'total_population': 3499, 'state': 'WV', 'city': 'FORT GAY'}
{'total_population': 3499, 'state': 'PA', 'city': 'RURAL VALLEY'}
{'total_population': 3499, 'state': 'SC', 'city': 'DUE WEST'}
{'total_population': 3500, 'state': 'NC', 'city': 'WESTFIELD'}
{'total_population': 3500, 'state': 'WI', 'city': 'BELLEVILLE

{'total_population': 4998, 'state': 'OK', 'city': 'COMANCHE'}
{'total_population': 4998, 'state': 'AL', 'city': 'MUNFORD'}
{'total_population': 4999, 'state': 'IL', 'city': 'EAST DUBUQUE'}
{'total_population': 4999, 'state': 'RI', 'city': 'JAMESTOWN'}
{'total_population': 5001, 'state': 'MA', 'city': 'LENOX'}
{'total_population': 5001, 'state': 'FL', 'city': 'SOUTHPORT'}
{'total_population': 5001, 'state': 'NJ', 'city': 'EDGEWATER'}
{'total_population': 5004, 'state': 'AL', 'city': 'NAUVOO'}
{'total_population': 5004, 'state': 'MI', 'city': 'OVID'}
{'total_population': 5006, 'state': 'MI', 'city': 'EAST TAWAS'}
{'total_population': 5007, 'state': 'AL', 'city': 'CARROLLTON'}
{'total_population': 5007, 'state': 'PA', 'city': 'SUGARLOAF'}
{'total_population': 5007, 'state': 'VA', 'city': 'BLAIRS'}
{'total_population': 5009, 'state': 'SC', 'city': 'ROEBUCK'}
{'total_population': 5009, 'state': 'AR', 'city': 'EARLE'}
{'total_population': 5009, 'state': 'NJ', 'city': 'BRANCHVILLE'}
{'total_p

{'total_population': 7012, 'state': 'PA', 'city': 'HOLLSOPPLE'}
{'total_population': 7013, 'state': 'IL', 'city': 'PINCKNEYVILLE'}
{'total_population': 7017, 'state': 'CT', 'city': 'BURLINGTON'}
{'total_population': 7018, 'state': 'OK', 'city': 'SULPHUR'}
{'total_population': 7018, 'state': 'NC', 'city': 'MILLERS CREEK'}
{'total_population': 7021, 'state': 'AR', 'city': 'HUNTSVILLE'}
{'total_population': 7023, 'state': 'VA', 'city': 'TAZEWELL'}
{'total_population': 7024, 'state': 'OR', 'city': 'WHITE CITY'}
{'total_population': 7024, 'state': 'MI', 'city': 'BRONSON'}
{'total_population': 7024, 'state': 'FL', 'city': '32636'}
{'total_population': 7025, 'state': 'MI', 'city': 'OSSEO'}
{'total_population': 7028, 'state': 'GA', 'city': 'LINCOLNTON'}
{'total_population': 7029, 'state': 'NY', 'city': 'CASTLETON ON HUD'}
{'total_population': 7033, 'state': 'AR', 'city': 'JUDSONIA'}
{'total_population': 7033, 'state': 'AR', 'city': 'DUMAS'}
{'total_population': 7034, 'state': 'TN', 'city': 'HU

{'total_population': 9650, 'state': 'OH', 'city': 'CLYDE'}
{'total_population': 9660, 'state': 'NY', 'city': 'MANORVILLE'}
{'total_population': 9660, 'state': 'IL', 'city': 'MENDOTA'}
{'total_population': 9661, 'state': 'GA', 'city': 'ADEL'}
{'total_population': 9663, 'state': 'NM', 'city': 'SOCORRO'}
{'total_population': 9663, 'state': 'PA', 'city': 'CATASAUQUA'}
{'total_population': 9663, 'state': 'FL', 'city': '32676'}
{'total_population': 9668, 'state': 'TN', 'city': 'BRIGHTON'}
{'total_population': 9672, 'state': 'GA', 'city': 'ELLIJAY'}
{'total_population': 9674, 'state': 'PA', 'city': 'NEW OXFORD'}
{'total_population': 9679, 'state': 'AL', 'city': 'JACKSON'}
{'total_population': 9681, 'state': 'NY', 'city': 'NESCONSET'}
{'total_population': 9682, 'state': 'MI', 'city': 'BEAVERTON'}
{'total_population': 9683, 'state': 'KY', 'city': 'GOLDEN POND'}
{'total_population': 9683, 'state': 'OK', 'city': 'CHECOTAH'}
{'total_population': 9685, 'state': 'CT', 'city': 'SOMERS'}
{'total_popul

{'total_population': 15965, 'state': 'TN', 'city': 'DAYTON'}
{'total_population': 15968, 'state': 'MI', 'city': 'PARCHMENT'}
{'total_population': 15969, 'state': 'NJ', 'city': 'SUSSEX'}
{'total_population': 15976, 'state': 'MA', 'city': 'TEATICKET'}
{'total_population': 15978, 'state': 'WA', 'city': 'SILVERDALE'}
{'total_population': 15979, 'state': 'VA', 'city': 'NORTH SPRINGFIEL'}
{'total_population': 15988, 'state': 'CA', 'city': 'MORAGA'}
{'total_population': 16000, 'state': 'MI', 'city': 'GRAND LEDGE'}
{'total_population': 16011, 'state': 'OH', 'city': 'LOGAN'}
{'total_population': 16023, 'state': 'CT', 'city': 'WILLIMANTIC'}
{'total_population': 16027, 'state': 'PA', 'city': 'HARLEYSVILLE'}
{'total_population': 16033, 'state': 'FL', 'city': 'GREEN COVE SPRIN'}
{'total_population': 16037, 'state': 'WI', 'city': 'RIVER FALLS'}
{'total_population': 16037, 'state': 'IN', 'city': 'MOUNT VERNON'}
{'total_population': 16040, 'state': 'CA', 'city': 'PACIFIC GROVE'}
{'total_population': 1

{'total_population': 29133, 'state': 'FL', 'city': 'FOREST CITY'}
{'total_population': 29148, 'state': 'SC', 'city': 'GEORGETOWN'}
{'total_population': 29149, 'state': 'KY', 'city': 'WINCHESTER'}
{'total_population': 29155, 'state': 'NC', 'city': 'MOUNT AIRY'}
{'total_population': 29161, 'state': 'MA', 'city': 'ANDOVER'}
{'total_population': 29166, 'state': 'SC', 'city': 'VALLEY FALLS'}
{'total_population': 29167, 'state': 'WV', 'city': 'ELGOOD'}
{'total_population': 29170, 'state': 'MA', 'city': 'SOUTH BOSTON'}
{'total_population': 29180, 'state': 'NY', 'city': 'CORTLAND'}
{'total_population': 29182, 'state': 'IN', 'city': 'AVON'}
{'total_population': 29184, 'state': 'OH', 'city': 'CHAGRIN FALLS'}
{'total_population': 29192, 'state': 'CT', 'city': 'MAPLE HILL'}
{'total_population': 29195, 'state': 'MO', 'city': 'ARNOLD'}
{'total_population': 29204, 'state': 'TX', 'city': 'ANGLETON'}
{'total_population': 29224, 'state': 'AL', 'city': 'VESTAVIA HILLS'}
{'total_population': 29228, 'state

In [72]:
# nº de ciudades por estado:
num_ciudades_por_estado = db.zips.aggregate([
    {"$group": {
        "_id": "$state",
        "num_ciudades": {"$addToSet": "$city"}
    }},
    # {"$sort": {"_id": 1}},  # Ordenar por estado alfabéticamente (quitar # y línea ordenamiento nº ciudades)
    {"$project": {
        "_id": 0,
        "state": "$_id",
        "num_ciudades": {"$size": "$num_ciudades"}
    }},
    {"$sort": {"num_ciudades": 1}} # Orden ascendente por nº de ciudades
])

for result in num_ciudades_por_estado:
    print(result)

{'state': 'DC', 'num_ciudades': 2}
{'state': 'DE', 'num_ciudades': 46}
{'state': 'RI', 'num_ciudades': 53}
{'state': 'NV', 'num_ciudades': 66}
{'state': 'HI', 'num_ciudades': 70}
{'state': 'WY', 'num_ciudades': 135}
{'state': 'AZ', 'num_ciudades': 178}
{'state': 'UT', 'num_ciudades': 181}
{'state': 'AK', 'num_ciudades': 184}
{'state': 'NH', 'num_ciudades': 212}
{'state': 'CT', 'num_ciudades': 224}
{'state': 'ID', 'num_ciudades': 233}
{'state': 'VT', 'num_ciudades': 243}
{'state': 'NM', 'num_ciudades': 258}
{'state': 'MT', 'num_ciudades': 309}
{'state': 'SC', 'num_ciudades': 313}
{'state': 'CO', 'num_ciudades': 332}
{'state': 'MS', 'num_ciudades': 342}
{'state': 'OR', 'num_ciudades': 344}
{'state': 'MD', 'num_ciudades': 380}
{'state': 'SD', 'num_ciudades': 381}
{'state': 'ND', 'num_ciudades': 392}
{'state': 'WA', 'num_ciudades': 397}
{'state': 'MA', 'num_ciudades': 405}
{'state': 'LA', 'num_ciudades': 408}
{'state': 'ME', 'num_ciudades': 410}
{'state': 'FL', 'num_ciudades': 485}
{'state

In [76]:
# Una lista por estado con sus ciudades y su media de población:
media_poblacion_por_estado = db.zips.aggregate([
    {"$group": {
        "_id": "$state",
        "ciudades": {"$addToSet": "$city"},
        "media_poblacion": {"$avg": "$pop"}
    }},
    {"$project": {
        "_id": 0,
        "state": "$_id",
        "ciudades": 1,
        "media_poblacion": {"$trunc": ["$media_poblacion", 2]}  # Mostrar solo 2 decimales
    }}
])

for result in media_poblacion_por_estado:
    print(result)

{'ciudades': ['LURAY', 'ARDMORE', 'BLAINE', 'NEWPORT', 'OAKFIELD', 'ANTIOCH', 'HORNBEAK', 'CONCORD', 'BELFAST', 'ADAMS', 'GRANVILLE', 'CLINTON', 'PARIS', 'DOVER', 'WHITE HOUSE', 'BRADFORD', 'WHITES CREEK', 'EVENSVILLE', 'EAST RIDGE', 'BYBEE', 'UNIONVILLE', 'MILLINGTON', 'REAGAN', 'SHERWOOD', 'CLIFTON', 'PIGEON FORGE', 'LEOMA', 'DEER LODGE', 'STANTON', 'DRESDEN', 'TRIMBLE', 'COUNCE', 'ESTILL SPRINGS', 'UNION CITY', 'LANCING', 'BRUCETON', 'POSTELLE', 'HUNTLAND', 'JACKSON', 'SOUTH PITTSBURG', 'DARDEN', 'GUYS', 'WHITESIDE', 'DRUMMONDS', 'ROCKFORD', 'ROYAL', 'HUNTSVILLE', 'LYNN GARDEN', 'COLLIERVILLE', 'MOSCOW', 'KELSO', 'MILLEDGEVILLE', 'TIPTONVILLE', 'QUEBECK', 'LAVINIA', 'DENMARK', 'WOODBURY', 'OLIVER SPRINGS', 'ATHENS', 'BLOOMINGDALE', 'ERIN', 'WASHBURN', 'SPEEDWELL', 'MONTEAGLE', 'ROBBINS', 'WHITLEYVILLE', 'MULBERRY', 'MERCER', 'DICKSON', 'VONORE', 'STEWART', 'HENDERSONVILLE', 'OLDFORT', 'JACKSBORO', 'MASON', 'SHARPS CHAPEL', 'ANDERSONVILLE', 'PRIMM SPRINGS', 'PETERSBURG', 'MADISON', '

# 4. sort, first & limit

Sort permite ordenar por cualquier campo igual que con el método sort() del método find()

`{ "$sort": {"price": 1} }` Ordena ascendentemente.

`{ "$sort": {"price": -1} }` Ordena desscendentemente.

La siguietne sentencia ordena los podcutos de la colección products de más caros a mas baratos.

In [None]:
sorted_products = db.products.aggregate([
    { "$sort": { "price": -1 } },
    { "$project": {"_id": 0 } }
])

for product in sorted_products:
    print(product)

Limit permite indicar el número de elemntos que queremos devolver en un stage.

In [None]:
sorted_products = db.products.aggregate([
    { "$sort": { "price": -1 } },
    { "$limit": 2},
    { "$project": {"_id": 0 } }
])

for product in sorted_products:
    print(product)

First obtiene el primer elemento del resultado de un stage. 

La siguiente sentencia obtiene el primer producto de cada fabricante.

In [None]:
first_product = db.products.aggregate([
    { "$group": { 
        "_id": { "maker": "$manufacturer" }, 
        "first": { "$first": "$name" } } 
    }  
])

for product in first_product:
    print(product)

## Ejercicio 4:

Sobre la colección de códigos zip:

* Obten la población de cada ciudad de cada estado y ordena el resultado para obtener primero las ciudades con más población.
* Para el estado de Nuva York (NY), obten las cudades ordenadas por población.
* Obten la ciudad con mas población por cada estado. Ayuda: utiliza varios stages de agrupación.

#### SOLUCiÓN

1. Obtener la población de cada ciudad de cada estado y ordenar el resultado para obtener primero las ciudades con más población:

In [77]:
pipeline_poblacion_ciudad_estado = [
    {
        "$sort": {"pop": -1}
    },
    {
        "$group": {
            "_id": {"state": "$state", "city": "$city"},
            "population": {"$first": "$pop"}
        }
    },
    {
        "$sort": {"_id.state": 1, "population": -1}
    }
]

resultado_poblacion_ciudad_estado = db.zips.aggregate(pipeline_poblacion_ciudad_estado)

for poblacion_ciudad_estado in resultado_poblacion_ciudad_estado:
    print(poblacion_ciudad_estado)


{'_id': {'state': 'AK', 'city': 'ANCHORAGE'}, 'population': 32383}
{'_id': {'state': 'AK', 'city': 'JUNEAU'}, 'population': 24947}
{'_id': {'state': 'AK', 'city': 'FAIRBANKS'}, 'population': 23238}
{'_id': {'state': 'AK', 'city': 'COLDFOOT'}, 'population': 19316}
{'_id': {'state': 'AK', 'city': 'EAGLE RIVER'}, 'population': 18429}
{'_id': {'state': 'AK', 'city': 'NORTH POLE'}, 'population': 14672}
{'_id': {'state': 'AK', 'city': 'WASILLA'}, 'population': 14215}
{'_id': {'state': 'AK', 'city': 'KETCHIKAN'}, 'population': 13886}
{'_id': {'state': 'AK', 'city': 'AKHIOK'}, 'population': 13309}
{'_id': {'state': 'AK', 'city': 'BUTTE'}, 'population': 12358}
{'_id': {'state': 'AK', 'city': 'KENAI'}, 'population': 10508}
{'_id': {'state': 'AK', 'city': 'SOLDOTNA'}, 'population': 9825}
{'_id': {'state': 'AK', 'city': 'SITKA'}, 'population': 8638}
{'_id': {'state': 'AK', 'city': 'PORT GRAHAM'}, 'population': 8186}
{'_id': {'state': 'AK', 'city': 'FORT RICHARDSON'}, 'population': 7979}
{'_id': {'

{'_id': {'state': 'AZ', 'city': 'WITTMANN'}, 'population': 789}
{'_id': {'state': 'AZ', 'city': 'SELIGMAN'}, 'population': 693}
{'_id': {'state': 'AZ', 'city': 'PALO VERDE'}, 'population': 669}
{'_id': {'state': 'AZ', 'city': 'DATELAND'}, 'population': 659}
{'_id': {'state': 'AZ', 'city': 'STANFIELD'}, 'population': 644}
{'_id': {'state': 'AZ', 'city': 'ELGIN'}, 'population': 638}
{'_id': {'state': 'AZ', 'city': 'FORT MCDOWELL'}, 'population': 619}
{'_id': {'state': 'AZ', 'city': 'MARBLE CANYON'}, 'population': 564}
{'_id': {'state': 'AZ', 'city': 'ASH FORK'}, 'population': 563}
{'_id': {'state': 'AZ', 'city': 'EAGAR'}, 'population': 482}
{'_id': {'state': 'AZ', 'city': 'YARNELL'}, 'population': 455}
{'_id': {'state': 'AZ', 'city': 'SUPAI'}, 'population': 423}
{'_id': {'state': 'AZ', 'city': 'CLIFTON'}, 'population': 376}
{'_id': {'state': 'AZ', 'city': 'ARLINGTON'}, 'population': 329}
{'_id': {'state': 'AZ', 'city': 'COCHISE'}, 'population': 290}
{'_id': {'state': 'AZ', 'city': 'HOTEV

{'_id': {'state': 'CO', 'city': 'BEDROCK'}, 'population': 191}
{'_id': {'state': 'CO', 'city': 'LYCAN'}, 'population': 183}
{'_id': {'state': 'CO', 'city': 'ALLENSPARK'}, 'population': 183}
{'_id': {'state': 'CO', 'city': 'SOMERSET'}, 'population': 180}
{'_id': {'state': 'CO', 'city': 'MACK'}, 'population': 176}
{'_id': {'state': 'CO', 'city': '81080'}, 'population': 172}
{'_id': {'state': 'CO', 'city': 'TOWNER'}, 'population': 162}
{'_id': {'state': 'CO', 'city': 'WARD'}, 'population': 159}
{'_id': {'state': 'CO', 'city': 'JEFFERSON'}, 'population': 157}
{'_id': {'state': 'CO', 'city': 'ALMONT'}, 'population': 150}
{'_id': {'state': 'CO', 'city': 'ROGGEN'}, 'population': 150}
{'_id': {'state': 'CO', 'city': 'BOND'}, 'population': 149}
{'_id': {'state': 'CO', 'city': 'VILAS'}, 'population': 145}
{'_id': {'state': 'CO', 'city': 'STONEHAM'}, 'population': 141}
{'_id': {'state': 'CO', 'city': 'ATWOOD'}, 'population': 140}
{'_id': {'state': 'CO', 'city': 'BRANSON'}, 'population': 140}
{'_i

{'_id': {'state': 'IA', 'city': 'ROCKWELL CITY'}, 'population': 2952}
{'_id': {'state': 'IA', 'city': 'SOLON'}, 'population': 2894}
{'_id': {'state': 'IA', 'city': 'ELKADER'}, 'population': 2887}
{'_id': {'state': 'IA', 'city': 'BELLEVUE'}, 'population': 2884}
{'_id': {'state': 'IA', 'city': 'MONROE'}, 'population': 2868}
{'_id': {'state': 'IA', 'city': 'SERGEANT BLUFF'}, 'population': 2853}
{'_id': {'state': 'IA', 'city': 'POCAHONTAS'}, 'population': 2802}
{'_id': {'state': 'IA', 'city': 'LAKE MILLS'}, 'population': 2801}
{'_id': {'state': 'IA', 'city': 'GREENFIELD'}, 'population': 2772}
{'_id': {'state': 'IA', 'city': 'LOGAN'}, 'population': 2764}
{'_id': {'state': 'IA', 'city': 'ALTA'}, 'population': 2757}
{'_id': {'state': 'IA', 'city': 'CLARKSVILLE'}, 'population': 2757}
{'_id': {'state': 'IA', 'city': 'BONDURANT'}, 'population': 2666}
{'_id': {'state': 'IA', 'city': 'CORNING'}, 'population': 2660}
{'_id': {'state': 'IA', 'city': 'HUDSON'}, 'population': 2641}
{'_id': {'state': 'I

{'_id': {'state': 'IL', 'city': 'AROMA PARK'}, 'population': 3151}
{'_id': {'state': 'IL', 'city': 'SANDOVAL'}, 'population': 3145}
{'_id': {'state': 'IL', 'city': 'ARCOLA'}, 'population': 3132}
{'_id': {'state': 'IL', 'city': 'ORION'}, 'population': 3121}
{'_id': {'state': 'IL', 'city': 'RADFORD'}, 'population': 3112}
{'_id': {'state': 'IL', 'city': 'MEDINAH'}, 'population': 3110}
{'_id': {'state': 'IL', 'city': 'LEXINGTON'}, 'population': 3098}
{'_id': {'state': 'IL', 'city': 'TEUTOPOLIS'}, 'population': 3095}
{'_id': {'state': 'IL', 'city': 'FARMINGDALE'}, 'population': 3081}
{'_id': {'state': 'IL', 'city': 'CARROLLTON'}, 'population': 3079}
{'_id': {'state': 'IL', 'city': 'BUNKER HILL'}, 'population': 3052}
{'_id': {'state': 'IL', 'city': 'ROODHOUSE'}, 'population': 3020}
{'_id': {'state': 'IL', 'city': 'NEWARK'}, 'population': 3016}
{'_id': {'state': 'IL', 'city': 'GRANT PARK'}, 'population': 3009}
{'_id': {'state': 'IL', 'city': 'BROWNFIELD'}, 'population': 2997}
{'_id': {'state'

{'_id': {'state': 'KS', 'city': 'GEUDA SPRINGS'}, 'population': 503}
{'_id': {'state': 'KS', 'city': 'QUENEMO'}, 'population': 500}
{'_id': {'state': 'KS', 'city': 'PENALOSA'}, 'population': 497}
{'_id': {'state': 'KS', 'city': 'PIERCEVILLE'}, 'population': 495}
{'_id': {'state': 'KS', 'city': 'COURTLAND'}, 'population': 487}
{'_id': {'state': 'KS', 'city': 'CLAYTON'}, 'population': 485}
{'_id': {'state': 'KS', 'city': 'BLUE MOUND'}, 'population': 484}
{'_id': {'state': 'KS', 'city': 'BUSHTON'}, 'population': 480}
{'_id': {'state': 'KS', 'city': 'CRESTLINE'}, 'population': 478}
{'_id': {'state': 'KS', 'city': 'HERNDON'}, 'population': 477}
{'_id': {'state': 'KS', 'city': 'HEALY'}, 'population': 476}
{'_id': {'state': 'KS', 'city': 'VLIETS'}, 'population': 469}
{'_id': {'state': 'KS', 'city': 'GRAINFIELD'}, 'population': 467}
{'_id': {'state': 'KS', 'city': 'CIRCLEVILLE'}, 'population': 466}
{'_id': {'state': 'KS', 'city': 'MORROWVILLE'}, 'population': 462}
{'_id': {'state': 'KS', 'city

{'_id': {'state': 'MA', 'city': 'SANDWICH'}, 'population': 9007}
{'_id': {'state': 'MA', 'city': 'WRENTHAM'}, 'population': 9006}
{'_id': {'state': 'MA', 'city': 'WHITINSVILLE'}, 'population': 8807}
{'_id': {'state': 'MA', 'city': 'WINCHENDON'}, 'population': 8805}
{'_id': {'state': 'MA', 'city': 'NORTH BILLERICA'}, 'population': 8720}
{'_id': {'state': 'MA', 'city': 'INDIAN ORCHARD'}, 'population': 8702}
{'_id': {'state': 'MA', 'city': 'TYNGSBORO'}, 'population': 8643}
{'_id': {'state': 'MA', 'city': 'FALMOUTH'}, 'population': 8588}
{'_id': {'state': 'MA', 'city': 'BREWSTER'}, 'population': 8535}
{'_id': {'state': 'MA', 'city': 'BASS RIVER'}, 'population': 8514}
{'_id': {'state': 'MA', 'city': 'FT DEVENS'}, 'population': 8480}
{'_id': {'state': 'MA', 'city': 'WILLIAMSTOWN'}, 'population': 8220}
{'_id': {'state': 'MA', 'city': 'MONSON'}, 'population': 8194}
{'_id': {'state': 'MA', 'city': 'BLACKSTONE'}, 'population': 8023}
{'_id': {'state': 'MA', 'city': 'NORTH CHELMSFORD'}, 'populatio

{'_id': {'state': 'MI', 'city': 'PLAINWELL'}, 'population': 15308}
{'_id': {'state': 'MI', 'city': 'HOLLY'}, 'population': 15119}
{'_id': {'state': 'MI', 'city': 'HASTINGS'}, 'population': 15043}
{'_id': {'state': 'MI', 'city': 'HARPER WOODS'}, 'population': 14937}
{'_id': {'state': 'MI', 'city': 'DOWAGIAC'}, 'population': 14921}
{'_id': {'state': 'MI', 'city': 'MARSHALL'}, 'population': 14844}
{'_id': {'state': 'MI', 'city': 'WHITE LAKE'}, 'population': 14778}
{'_id': {'state': 'MI', 'city': 'SPRING LAKE'}, 'population': 14602}
{'_id': {'state': 'MI', 'city': 'STRONACH'}, 'population': 14319}
{'_id': {'state': 'MI', 'city': 'OSCODA'}, 'population': 14188}
{'_id': {'state': 'MI', 'city': 'CLAWSON'}, 'population': 14008}
{'_id': {'state': 'MI', 'city': 'FRANKLIN'}, 'population': 13880}
{'_id': {'state': 'MI', 'city': 'CHEBOYGAN'}, 'population': 13854}
{'_id': {'state': 'MI', 'city': 'BRUCE'}, 'population': 13552}
{'_id': {'state': 'MI', 'city': 'ALBION'}, 'population': 13514}
{'_id': {'

{'_id': {'state': 'MO', 'city': 'ROLLA'}, 'population': 24377}
{'_id': {'state': 'MO', 'city': 'LAKE TAPAWINGO'}, 'population': 23758}
{'_id': {'state': 'MO', 'city': 'FERGUSON'}, 'population': 23173}
{'_id': {'state': 'MO', 'city': 'SIKESTON'}, 'population': 22618}
{'_id': {'state': 'MO', 'city': 'FESTUS'}, 'population': 22497}
{'_id': {'state': 'MO', 'city': 'WARRENSBURG'}, 'population': 21993}
{'_id': {'state': 'MO', 'city': 'MARYLAND HEIGHTS'}, 'population': 21268}
{'_id': {'state': 'MO', 'city': 'NORTH COUNTY'}, 'population': 21055}
{'_id': {'state': 'MO', 'city': 'LEBANON'}, 'population': 20859}
{'_id': {'state': 'MO', 'city': 'KIRKSVILLE'}, 'population': 20717}
{'_id': {'state': 'MO', 'city': 'BELTON'}, 'population': 20208}
{'_id': {'state': 'MO', 'city': 'CREVE COEUR'}, 'population': 20120}
{'_id': {'state': 'MO', 'city': 'HANNIBAL'}, 'population': 20086}
{'_id': {'state': 'MO', 'city': 'HAZELWOOD'}, 'population': 20004}
{'_id': {'state': 'MO', 'city': 'CARTHAGE'}, 'population'

{'_id': {'state': 'MT', 'city': 'RINGLING'}, 'population': 97}
{'_id': {'state': 'MT', 'city': 'SAND SPRINGS'}, 'population': 95}
{'_id': {'state': 'MT', 'city': 'BOYES'}, 'population': 90}
{'_id': {'state': 'MT', 'city': 'RAMSAY'}, 'population': 89}
{'_id': {'state': 'MT', 'city': 'MILDRED'}, 'population': 83}
{'_id': {'state': 'MT', 'city': 'CAPITOL'}, 'population': 73}
{'_id': {'state': 'MT', 'city': 'GOLD CREEK'}, 'population': 66}
{'_id': {'state': 'MT', 'city': 'PROCTOR'}, 'population': 66}
{'_id': {'state': 'MT', 'city': 'BELFRY'}, 'population': 64}
{'_id': {'state': 'MT', 'city': 'OLIVE'}, 'population': 59}
{'_id': {'state': 'MT', 'city': 'NIARADA'}, 'population': 58}
{'_id': {'state': 'MT', 'city': 'NEIHART'}, 'population': 58}
{'_id': {'state': 'MT', 'city': 'ACTON'}, 'population': 55}
{'_id': {'state': 'MT', 'city': 'LEDGER'}, 'population': 42}
{'_id': {'state': 'MT', 'city': 'WILLARD'}, 'population': 39}
{'_id': {'state': 'MT', 'city': 'ANGELA'}, 'population': 35}
{'_id': {

{'_id': {'state': 'NH', 'city': 'GREENFIELD'}, 'population': 1422}
{'_id': {'state': 'NH', 'city': 'BARTLETT'}, 'population': 1379}
{'_id': {'state': 'NH', 'city': 'PLAINFIELD'}, 'population': 1314}
{'_id': {'state': 'NH', 'city': 'GILMANTON'}, 'population': 1308}
{'_id': {'state': 'NH', 'city': 'GILMANTON IRON W'}, 'population': 1301}
{'_id': {'state': 'NH', 'city': 'LYNDEBOROUGH'}, 'population': 1294}
{'_id': {'state': 'NH', 'city': 'TAMWORTH'}, 'population': 1285}
{'_id': {'state': 'NH', 'city': 'SPOFFORD'}, 'population': 1266}
{'_id': {'state': 'NH', 'city': 'GRANTHAM'}, 'population': 1247}
{'_id': {'state': 'NH', 'city': 'BENNINGTON'}, 'population': 1236}
{'_id': {'state': 'NH', 'city': 'LINCOLN'}, 'population': 1229}
{'_id': {'state': 'NH', 'city': 'FRANCESTOWN'}, 'population': 1219}
{'_id': {'state': 'NH', 'city': 'NEW HAMPTON'}, 'population': 1214}
{'_id': {'state': 'NH', 'city': 'TEMPLE'}, 'population': 1194}
{'_id': {'state': 'NH', 'city': 'PITTSBURG'}, 'population': 1104}
{'

{'_id': {'state': 'NY', 'city': 'WYNANTSKILL'}, 'population': 6192}
{'_id': {'state': 'NY', 'city': 'AVON'}, 'population': 6187}
{'_id': {'state': 'NY', 'city': 'WADING RIVER'}, 'population': 6186}
{'_id': {'state': 'NY', 'city': 'TAPPAN'}, 'population': 6181}
{'_id': {'state': 'NY', 'city': 'BEDFORD HILLS'}, 'population': 6161}
{'_id': {'state': 'NY', 'city': 'FORT PLAIN'}, 'population': 6144}
{'_id': {'state': 'NY', 'city': 'BLOOMINGBURG'}, 'population': 6139}
{'_id': {'state': 'NY', 'city': 'BLOOMFIELD'}, 'population': 6129}
{'_id': {'state': 'NY', 'city': 'LIVONIA'}, 'population': 6108}
{'_id': {'state': 'NY', 'city': 'PATTERSON'}, 'population': 6107}
{'_id': {'state': 'NY', 'city': 'MARCELLUS'}, 'population': 6077}
{'_id': {'state': 'NY', 'city': 'SELKIRK'}, 'population': 6062}
{'_id': {'state': 'NY', 'city': 'THOMSON'}, 'population': 6028}
{'_id': {'state': 'NY', 'city': 'GASPORT'}, 'population': 6010}
{'_id': {'state': 'NY', 'city': 'RAVENA'}, 'population': 5976}
{'_id': {'state

{'_id': {'state': 'OH', 'city': 'NORTH LIMA'}, 'population': 2657}
{'_id': {'state': 'OH', 'city': 'MILLFIELD'}, 'population': 2656}
{'_id': {'state': 'OH', 'city': 'SCIO'}, 'population': 2640}
{'_id': {'state': 'OH', 'city': 'FORT LORAMIE'}, 'population': 2639}
{'_id': {'state': 'OH', 'city': 'CUTLER'}, 'population': 2624}
{'_id': {'state': 'OH', 'city': 'OSTRANDER'}, 'population': 2622}
{'_id': {'state': 'OH', 'city': 'STRYKER'}, 'population': 2607}
{'_id': {'state': 'OH', 'city': 'ARLINGTON'}, 'population': 2603}
{'_id': {'state': 'OH', 'city': 'LAURA'}, 'population': 2602}
{'_id': {'state': 'OH', 'city': 'SPENCER'}, 'population': 2595}
{'_id': {'state': 'OH', 'city': 'WEST MANSFIELD'}, 'population': 2580}
{'_id': {'state': 'OH', 'city': 'JUNCTION CITY'}, 'population': 2577}
{'_id': {'state': 'OH', 'city': 'BLOOMVILLE'}, 'population': 2572}
{'_id': {'state': 'OH', 'city': 'PEMBERVILLE'}, 'population': 2569}
{'_id': {'state': 'OH', 'city': 'WESTON'}, 'population': 2560}
{'_id': {'sta

{'_id': {'state': 'PA', 'city': 'SALTSBURG'}, 'population': 3922}
{'_id': {'state': 'PA', 'city': 'TOWER CITY'}, 'population': 3905}
{'_id': {'state': 'PA', 'city': 'TURBOTVILLE'}, 'population': 3902}
{'_id': {'state': 'PA', 'city': 'PULASKI'}, 'population': 3898}
{'_id': {'state': 'PA', 'city': 'CLAYSBURG'}, 'population': 3890}
{'_id': {'state': 'PA', 'city': 'BARNESBORO'}, 'population': 3878}
{'_id': {'state': 'PA', 'city': 'ALBRIGHTSVILLE'}, 'population': 3862}
{'_id': {'state': 'PA', 'city': 'ACME'}, 'population': 3862}
{'_id': {'state': 'PA', 'city': 'PIPERSVILLE'}, 'population': 3856}
{'_id': {'state': 'PA', 'city': 'CONNEAUT LAKE'}, 'population': 3849}
{'_id': {'state': 'PA', 'city': 'MANOR'}, 'population': 3848}
{'_id': {'state': 'PA', 'city': 'MC GRANN'}, 'population': 3844}
{'_id': {'state': 'PA', 'city': 'ERNEST'}, 'population': 3841}
{'_id': {'state': 'PA', 'city': 'MC SHERRYSTOWN'}, 'population': 3838}
{'_id': {'state': 'PA', 'city': 'RUSSELL'}, 'population': 3833}
{'_id':

{'_id': {'state': 'TN', 'city': 'MC EWEN'}, 'population': 3963}
{'_id': {'state': 'TN', 'city': 'BONE CAVE'}, 'population': 3954}
{'_id': {'state': 'TN', 'city': 'SPENCER'}, 'population': 3954}
{'_id': {'state': 'TN', 'city': 'THOMPSONS STATIO'}, 'population': 3945}
{'_id': {'state': 'TN', 'city': 'OAKDALE'}, 'population': 3901}
{'_id': {'state': 'TN', 'city': 'ETHRIDGE'}, 'population': 3854}
{'_id': {'state': 'TN', 'city': 'UNICOI'}, 'population': 3838}
{'_id': {'state': 'TN', 'city': 'NOLENSVILLE'}, 'population': 3813}
{'_id': {'state': 'TN', 'city': 'CARYVILLE'}, 'population': 3811}
{'_id': {'state': 'TN', 'city': 'COSBY'}, 'population': 3800}
{'_id': {'state': 'TN', 'city': 'GEORGETOWN'}, 'population': 3768}
{'_id': {'state': 'TN', 'city': 'HALLS'}, 'population': 3755}
{'_id': {'state': 'TN', 'city': 'ROSSVILLE'}, 'population': 3730}
{'_id': {'state': 'TN', 'city': 'DECATUR'}, 'population': 3718}
{'_id': {'state': 'TN', 'city': 'WATERTOWN'}, 'population': 3640}
{'_id': {'state': 'T

{'_id': {'state': 'VA', 'city': 'CLIFTON'}, 'population': 9554}
{'_id': {'state': 'VA', 'city': 'DUBLIN'}, 'population': 9521}
{'_id': {'state': 'VA', 'city': 'SANDSTON'}, 'population': 9402}
{'_id': {'state': 'VA', 'city': 'HIGHLAND SPRINGS'}, 'population': 9373}
{'_id': {'state': 'VA', 'city': 'TROUTVILLE'}, 'population': 9211}
{'_id': {'state': 'VA', 'city': 'KING GEORGE'}, 'population': 9088}
{'_id': {'state': 'VA', 'city': 'QUANTICO'}, 'population': 9039}
{'_id': {'state': 'VA', 'city': 'WISE'}, 'population': 8957}
{'_id': {'state': 'VA', 'city': 'APPOMATTOX'}, 'population': 8904}
{'_id': {'state': 'VA', 'city': 'FORT LEE'}, 'population': 8817}
{'_id': {'state': 'VA', 'city': 'MONTFORD'}, 'population': 8781}
{'_id': {'state': 'VA', 'city': 'BUENA VISTA'}, 'population': 8464}
{'_id': {'state': 'VA', 'city': 'BERRYVILLE'}, 'population': 8339}
{'_id': {'state': 'VA', 'city': 'GRETNA'}, 'population': 8304}
{'_id': {'state': 'VA', 'city': 'RICHLANDS'}, 'population': 8026}
{'_id': {'sta

{'_id': {'state': 'WI', 'city': 'MILLADORE'}, 'population': 1347}
{'_id': {'state': 'WI', 'city': 'ARLINGTON'}, 'population': 1329}
{'_id': {'state': 'WI', 'city': 'WOODVILLE'}, 'population': 1326}
{'_id': {'state': 'WI', 'city': 'WHITE LAKE'}, 'population': 1324}
{'_id': {'state': 'WI', 'city': 'MERCER'}, 'population': 1321}
{'_id': {'state': 'WI', 'city': 'FAIRCHILD'}, 'population': 1319}
{'_id': {'state': 'WI', 'city': 'MERRILLAN'}, 'population': 1317}
{'_id': {'state': 'WI', 'city': 'CABLE'}, 'population': 1311}
{'_id': {'state': 'WI', 'city': 'WABENO'}, 'population': 1308}
{'_id': {'state': 'WI', 'city': 'BARNEVELD'}, 'population': 1301}
{'_id': {'state': 'WI', 'city': 'PLAIN'}, 'population': 1292}
{'_id': {'state': 'WI', 'city': 'ELAND'}, 'population': 1278}
{'_id': {'state': 'WI', 'city': 'MOUNTAIN'}, 'population': 1261}
{'_id': {'state': 'WI', 'city': 'STETSONVILLE'}, 'population': 1241}
{'_id': {'state': 'WI', 'city': 'LAKE TOMAHAWK'}, 'population': 1223}
{'_id': {'state': 'WI

2. Para el estado de Nueva York (NY), obtener las ciudades ordenadas por población:

In [78]:
pipeline_ciudades_NY = [
    {
        "$match": {"state": "NY"}
    },
    {
        "$sort": {"pop": -1}
    },
    {
        "$group": {
            "_id": {"state": "$state", "city": "$city"},
            "population": {"$first": "$pop"}
        }
    },
    {
        "$sort": {"population": -1}
    }
]

resultado_ciudades_NY = db.zips.aggregate(pipeline_ciudades_NY)

for ciudades_NY in resultado_ciudades_NY:
    print(ciudades_NY)


{'_id': {'state': 'NY', 'city': 'BROOKLYN'}, 'population': 111396}
{'_id': {'state': 'NY', 'city': 'NEW YORK'}, 'population': 106564}
{'_id': {'state': 'NY', 'city': 'JACKSON HEIGHTS'}, 'population': 88241}
{'_id': {'state': 'NY', 'city': 'RIDGEWOOD'}, 'population': 85732}
{'_id': {'state': 'NY', 'city': 'BRONX'}, 'population': 85710}
{'_id': {'state': 'NY', 'city': 'STATEN ISLAND'}, 'population': 78118}
{'_id': {'state': 'NY', 'city': 'WOODSIDE'}, 'population': 75894}
{'_id': {'state': 'NY', 'city': 'CORONA'}, 'population': 75746}
{'_id': {'state': 'NY', 'city': 'FLUSHING'}, 'population': 69164}
{'_id': {'state': 'NY', 'city': 'FOREST HILLS'}, 'population': 65180}
{'_id': {'state': 'NY', 'city': 'DIX HILLS'}, 'population': 62162}
{'_id': {'state': 'NY', 'city': 'WEST BRENTWOOD'}, 'population': 60425}
{'_id': {'state': 'NY', 'city': 'YONKERS'}, 'population': 59476}
{'_id': {'state': 'NY', 'city': 'TROY'}, 'population': 56849}
{'_id': {'state': 'NY', 'city': 'ROME'}, 'population': 56424

3. Obtener la ciudad con más población por cada estado:

In [79]:
pipeline_ciudad_max_poblacion_estado = [
    {
        "$sort": {"pop": -1}
    },
    {
        "$group": {
            "_id": {"state": "$state", "city": "$city"},
            "population": {"$first": "$pop"}
        }
    },
    {
        "$group": {
            "_id": "$_id.state",
            "max_population_city": {"$first": {"city": "$_id.city", "population": "$population"}}
        }
    },
    {
        "$project": {
            "_id": 0,
            "state": "$_id",
            "city": "$max_population_city.city",
            "population": "$max_population_city.population"
        }
    }
]

resultado_ciudad_max_poblacion_estado = db.zips.aggregate(pipeline_ciudad_max_poblacion_estado)

for ciudad_max_poblacion_estado in resultado_ciudad_max_poblacion_estado:
    print(ciudad_max_poblacion_estado)

{'state': 'PA', 'city': 'SHENANGO', 'population': 19982}
{'state': 'GA', 'city': 'TIGER', 'population': 2454}
{'state': 'CA', 'city': 'MAD RIVER', 'population': 6}
{'state': 'VT', 'city': 'CENTER RUTLAND', 'population': 299}
{'state': 'NH', 'city': 'CENTER STRAFFORD', 'population': 436}
{'state': 'AK', 'city': 'MC GRATH', 'population': 618}
{'state': 'RI', 'city': 'JAMESTOWN', 'population': 4999}
{'state': 'MN', 'city': 'MERRIFIELD', 'population': 1552}
{'state': 'NY', 'city': 'NORTH TONAWANDA', 'population': 51399}
{'state': 'CT', 'city': 'QUAKER HILL', 'population': 2886}
{'state': 'ME', 'city': 'BREWER', 'population': 9021}
{'state': 'KS', 'city': 'DENTON', 'population': 378}
{'state': 'NE', 'city': 'WOOD LAKE', 'population': 200}
{'state': 'NJ', 'city': 'OCEANPORT', 'population': 5227}
{'state': 'MT', 'city': 'VIDA', 'population': 772}
{'state': 'IN', 'city': 'STILESVILLE', 'population': 1135}
{'state': 'OR', 'city': 'KERBY', 'population': 78}
{'state': 'SD', 'city': 'VOLGA', 'popu

# 5. Unwind

Se utiliza sobre campos de tipo array. Transforma un el campo de tipo array del documento de entrada en una lisa de documentos. Cada documento de salida, es el documento de entrada con el campo de tipo array reemplazado por el elemento de la lista.

Para ver un ejemplo vamos a crear una colección items e insertamos algunos documentos de prueba. Estos documentos tienen un campo "attributes" cuyo valor es un array de strings.


In [80]:
db.items.drop()

db.items.insert_many([{'_id':'nail', 'attributes':['hard', 'shiny', 'pointy', 'thin']},
                     {'_id':'hammer', 'attributes':['heavy', 'black', 'blunt']},
                     {'_id':'screwdriver', 'attributes':['long', 'black', 'flat']},
                     {'_id':'rock', 'attributes':['heavy', 'rough', 'roundish']}])

<pymongo.results.InsertManyResult at 0x7f27c40f53c8>

In [81]:
unwinded_items = db.items.aggregate([ { "$unwind": "$attributes" } ]);

for item in unwinded_items:
    print(item)

{'_id': 'nail', 'attributes': 'hard'}
{'_id': 'nail', 'attributes': 'shiny'}
{'_id': 'nail', 'attributes': 'pointy'}
{'_id': 'nail', 'attributes': 'thin'}
{'_id': 'hammer', 'attributes': 'heavy'}
{'_id': 'hammer', 'attributes': 'black'}
{'_id': 'hammer', 'attributes': 'blunt'}
{'_id': 'screwdriver', 'attributes': 'long'}
{'_id': 'screwdriver', 'attributes': 'black'}
{'_id': 'screwdriver', 'attributes': 'flat'}
{'_id': 'rock', 'attributes': 'heavy'}
{'_id': 'rock', 'attributes': 'rough'}
{'_id': 'rock', 'attributes': 'roundish'}


Podemos concatenar tantos unwind como necesitemos en diferentes stages del pipeline de agregación. 

Para ver un ejemplo vamos a crear la siguiente colección:

In [82]:
db.inventory.drop();
db.inventory.insert_many([
    {'name':"Polo Shirt", 'sizes':["Small", "Medium", "Large"], 'colors':['navy', 'white', 'orange', 'red']},
    {'name':"T-Shirt", 'sizes':["Small", "Medium", "Large", "X-Large"], 'colors':['navy', "black",  'orange', 'red']},
    {'name':"Chino Pants", 'sizes':["32x32", "31x30", "36x32"], 'colors':['navy', 'white', 'orange', 'violet']}
])


<pymongo.results.InsertManyResult at 0x7f27c40f5408>

In [83]:
items = db.inventory.aggregate([
    { "$unwind": "$sizes" },
    { "$unwind": "$colors" },
    { "$group": {
        '_id': { 'size':'$sizes', 'color':'$colors' },
        'count' : { '$sum':1 } }
    }
])

for item in items:
    print(item)

{'_id': {'size': '32x32', 'color': 'orange'}, 'count': 1}
{'_id': {'size': 'Small', 'color': 'black'}, 'count': 1}
{'_id': {'size': 'Medium', 'color': 'orange'}, 'count': 2}
{'_id': {'size': 'X-Large', 'color': 'black'}, 'count': 1}
{'_id': {'size': 'X-Large', 'color': 'orange'}, 'count': 1}
{'_id': {'size': '36x32', 'color': 'white'}, 'count': 1}
{'_id': {'size': '32x32', 'color': 'violet'}, 'count': 1}
{'_id': {'size': '36x32', 'color': 'violet'}, 'count': 1}
{'_id': {'size': '31x30', 'color': 'orange'}, 'count': 1}
{'_id': {'size': 'Medium', 'color': 'black'}, 'count': 1}
{'_id': {'size': 'Medium', 'color': 'red'}, 'count': 2}
{'_id': {'size': 'Small', 'color': 'red'}, 'count': 2}
{'_id': {'size': 'X-Large', 'color': 'red'}, 'count': 1}
{'_id': {'size': '36x32', 'color': 'navy'}, 'count': 1}
{'_id': {'size': '31x30', 'color': 'white'}, 'count': 1}
{'_id': {'size': 'Large', 'color': 'black'}, 'count': 1}
{'_id': {'size': 'Large', 'color': 'white'}, 'count': 1}
{'_id': {'size': 'X-Lar

Vamos a ver como revertir un unwind:

In [84]:
items = db.inventory.aggregate([
    { "$unwind": "$sizes" },
    { "$unwind": "$colors" },
    { "$group": {
        '_id': "$name",
        'sizes': { "$addToSet": "$sizes" },
        'colors': { "$addToSet": "$colors" },
     }
    }
])

for item in items:
    print(item)

{'_id': 'T-Shirt', 'sizes': ['Medium', 'X-Large', 'Small', 'Large'], 'colors': ['red', 'navy', 'orange', 'black']}
{'_id': 'Polo Shirt', 'sizes': ['Medium', 'Small', 'Large'], 'colors': ['orange', 'white', 'red', 'navy']}
{'_id': 'Chino Pants', 'sizes': ['32x32', '31x30', '36x32'], 'colors': ['orange', 'violet', 'navy', 'white']}


## Ejercicio 5:

Sobre la colección de codigos zips realiza las siguientes sentencias:
* Suma la población de todas las ciudades cuyo nombre es un número.
* Obten la media de población por ciudad y estado para las ciudades de los estados de California (CA) y Nueva York (NY) que tengan una población mayor a 25000 habitantes.


#### SOLUCIÓN:

* Suma la población de todas las ciudades cuyo nombre es un número:

Al establecer "_id": None, indico que no quiero agrupar por ningún campo específico. Implica que todos estos documentos se agruparán juntos y se realizará la operación de suma en ese grupo único.

In [88]:
pipeline_suma_poblacion_numerica = [
    {
        "$match": {
            "city": {"$regex": "^[0-9]+$"}
        }
    },
    {
        "$group": {
            "_id": None,
            "total_population": {"$sum": "$pop"}
        }
    }
]

resultado_suma_poblacion_numerica = db.zips.aggregate(pipeline_suma_poblacion_numerica)

for resultado in resultado_suma_poblacion_numerica:
    print(resultado)

{'_id': None, 'total_population': 298015}


* Obten la media de población por ciudad y estado para las ciudades de los estados de California (CA) y Nueva York (NY) que tengan una población mayor a 25000 habitantes.

In [89]:
pipeline_media_poblacion_estado = [
    {
        "$match": {
            "state": {"$in": ["CA", "NY"]},
            "pop": {"$gt": 25000}
        }
    },
    {
        "$group": {
            "_id": {"state": "$state", "city": "$city"},
            "average_population": {"$avg": "$pop"}
        }
    }
]

resultado_media_poblacion_estado = db.zips.aggregate(pipeline_media_poblacion_estado)

for resultado in resultado_media_poblacion_estado:
    print(resultado)

{'_id': {'state': 'CA', 'city': 'MANTECA'}, 'average_population': 51728.0}
{'_id': {'state': 'NY', 'city': 'RICHMOND HILL'}, 'average_population': 29382.0}
{'_id': {'state': 'CA', 'city': 'LYNWOOD'}, 'average_population': 61606.0}
{'_id': {'state': 'CA', 'city': 'BASSETT'}, 'average_population': 30330.0}
{'_id': {'state': 'CA', 'city': 'SAN FERNANDO'}, 'average_population': 33379.0}
{'_id': {'state': 'CA', 'city': 'CANOGA PARK'}, 'average_population': 43675.0}
{'_id': {'state': 'NY', 'city': 'AMHERST'}, 'average_population': 31912.0}
{'_id': {'state': 'CA', 'city': 'CHINO'}, 'average_population': 69244.0}
{'_id': {'state': 'NY', 'city': 'BALDWIN'}, 'average_population': 30959.0}
{'_id': {'state': 'CA', 'city': 'SAN PEDRO'}, 'average_population': 58821.0}
{'_id': {'state': 'CA', 'city': 'LAKEWOOD'}, 'average_population': 27819.0}
{'_id': {'state': 'CA', 'city': 'SANTA PAULA'}, 'average_population': 28319.0}
{'_id': {'state': 'CA', 'city': 'PIEDMONT'}, 'average_population': 34238.0}
{'_i

## Ejercicio 6:

La coleción grades que creamos al principio del notebook hacer referencia a las notas de estudiantes de un curso.

Vamoas a ver que campos tienen los documentos insertados:

In [90]:
grades = db.grades.find({}).limit(1)

for grade in grades:
    print(grade)

{'_id': ObjectId('50b59cd75bed76f46522c34e'), 'student_id': 0, 'class_id': 2, 'scores': [{'type': 'exam', 'score': 57.92947112575566}, {'type': 'quiz', 'score': 21.24542588206755}, {'type': 'homework', 'score': 68.1956781058743}, {'type': 'homework', 'score': 67.95019716560351}, {'type': 'homework', 'score': 18.81037253352722}]}


Se pide realizar las siguientes sentencias:
* La media de cada estudiante por asignatura.
* La media de cada esturiante por asignatura teniendo en cuenta sólo las notas de exámenes y deberes, ordenadas por media.

#### SOLUCIÓN:

* La media de cada estudiante por asignatura.

In [93]:
pipeline_media_estudiante_asignatura = [
    {
        "$unwind": "$scores"
    },
    {
        "$group": {
            "_id": {"student_id": "$student_id", "class_id": "$class_id"},
            "average_score": {"$avg": "$scores.score"}
        }
    },
    {
        "$project": {
            "_id": 0,
            "student_id": "$_id.student_id",
            "class_id": "$_id.class_id",
            "average_score": {"$round": ["$average_score", 2]}
        }
    },
    {
        "$sort": {"student_id": 1, "average_score": -1}
    }
]

resultado_media_estudiante_asignatura = db.grades.aggregate(pipeline_media_estudiante_asignatura)

for resultado in resultado_media_estudiante_asignatura:
    print(resultado)

{'student_id': 0, 'class_id': 27, 'average_score': 69.05}
{'student_id': 0, 'class_id': 6, 'average_score': 60.76}
{'student_id': 0, 'class_id': 7, 'average_score': 60.16}
{'student_id': 0, 'class_id': 5, 'average_score': 52.78}
{'student_id': 0, 'class_id': 28, 'average_score': 52.23}
{'student_id': 0, 'class_id': 16, 'average_score': 52.02}
{'student_id': 0, 'class_id': 11, 'average_score': 51.65}
{'student_id': 0, 'class_id': 10, 'average_score': 51.43}
{'student_id': 0, 'class_id': 24, 'average_score': 50.95}
{'student_id': 0, 'class_id': 30, 'average_score': 47.03}
{'student_id': 0, 'class_id': 2, 'average_score': 46.83}
{'student_id': 1, 'class_id': 28, 'average_score': 68.4}
{'student_id': 1, 'class_id': 16, 'average_score': 62.31}
{'student_id': 1, 'class_id': 13, 'average_score': 58.58}
{'student_id': 1, 'class_id': 18, 'average_score': 55.62}
{'student_id': 1, 'class_id': 22, 'average_score': 26.32}
{'student_id': 2, 'class_id': 27, 'average_score': 73.62}
{'student_id': 2, '

* La media de cada esturiante por asignatura teniendo en cuenta sólo las notas de exámenes y deberes, ordenadas por media.

In [96]:
pipeline_media_estudiante_examenes_deberes = [
    {
        "$unwind": "$scores"
    },
    {
        "$match": {
            "scores.type": {"$in": ["exam", "homework"]}
        }
    },
    {
        "$group": {
            "_id": {"student_id": "$student_id", "class_id": "$class_id"},
            "average_score": {"$avg": "$scores.score"}
        }
    },
    {
        "$project": {
            "_id": 0,
            "student_id": "$_id.student_id",
            "class_id": "$_id.class_id",
            "average_score": {"$round": ["$average_score", 2]}
        }
    },
    {
        "$sort": {"student_id": 1, "average_score": -1}
    }
]

resultado_media_estudiante_examenes_deberes = db.grades.aggregate(pipeline_media_estudiante_examenes_deberes)

for resultado in resultado_media_estudiante_examenes_deberes:
    print(resultado)

{'student_id': 0, 'class_id': 27, 'average_score': 71.5}
{'student_id': 0, 'class_id': 6, 'average_score': 69.91}
{'student_id': 0, 'class_id': 7, 'average_score': 60.08}
{'student_id': 0, 'class_id': 24, 'average_score': 58.38}
{'student_id': 0, 'class_id': 2, 'average_score': 53.22}
{'student_id': 0, 'class_id': 16, 'average_score': 53.13}
{'student_id': 0, 'class_id': 11, 'average_score': 52.31}
{'student_id': 0, 'class_id': 10, 'average_score': 49.92}
{'student_id': 0, 'class_id': 5, 'average_score': 47.47}
{'student_id': 0, 'class_id': 28, 'average_score': 46.99}
{'student_id': 0, 'class_id': 30, 'average_score': 46.87}
{'student_id': 1, 'class_id': 16, 'average_score': 67.73}
{'student_id': 1, 'class_id': 28, 'average_score': 66.03}
{'student_id': 1, 'class_id': 13, 'average_score': 56.31}
{'student_id': 1, 'class_id': 18, 'average_score': 48.89}
{'student_id': 1, 'class_id': 22, 'average_score': 30.41}
{'student_id': 2, 'class_id': 27, 'average_score': 76.08}
{'student_id': 2, '

## Ejercicio 7:

La coleción de posts guarda información sobre los posts de un blog. 

Vamos a ver campos tiene los docuemtos insertados:

In [97]:
posts = db.posts.find({}).limit(1)

for post in posts:
    print(post)

{'_id': ObjectId('5143ddf3bcf1bf4ab37d9c6d'), 'body': 'We the People of the United States, in Order to form a more perfect Union, establish Justice, insure domestic Tranquility, provide for the common defence, promote the general Welfare, and secure the Blessings of Liberty to ourselves and our Posterity, do ordain and establish this Constitution for the United States of America.\n<p>Article. I.<p><p>Section. 1.<p><p>All legislative Powers herein granted shall be vested in a Congress of the United States, which shall consist of a Senate and House of Representatives.<p><p>Section. 2.<p><p>The House of Representatives shall be composed of Members chosen every second Year by the People of the several States, and the Electors in each State shall have the Qualifications requisite for Electors of the most numerous Branch of the State Legislature.<p><p>No Person shall be a Representative who shall not have attained to the Age of twenty five Years, and been seven Years a Citizen of the United 

Se piden realizar las siguientes consultas:
* El autor que más comentarios a realizado. Ayuda: utiliza unwind, group, sum, sort y limit.
* Los 10 tags más populares. No mostrar el id en el resultado y mostrarlo bajo el campo tag Ayuda: utiliza unwind, group, sum, sort, limit y project.

#### SOLUCIÓN:

* El autor que más comentarios a realizado. Ayuda: utiliza unwind, group, sum, sort y limit.

In [98]:
pipeline_autor_mas_comentarios = [
    {
        "$unwind": "$comments"
    },
    {
        "$group": {
            "_id": "$comments.author",
            "total_comments": {"$sum": 1}
        }
    },
    {
        "$sort": {"total_comments": -1}
    },
    {
        "$limit": 1
    }
]

resultado_autor_mas_comentarios = db.posts.aggregate(pipeline_autor_mas_comentarios)

for resultado in resultado_autor_mas_comentarios:
    print(resultado)


{'_id': 'Mikaela Meidinger', 'total_comments': 493}


* Los 10 tags más populares. No mostrar el id en el resultado y mostrarlo bajo el campo tag Ayuda: utiliza unwind, group, sum, sort, limit y project.

In [99]:
pipeline_tags_mas_populares = [
    {
        "$unwind": "$tags"
    },
    {
        "$group": {
            "_id": "$tags",
            "total_occurrences": {"$sum": 1}
        }
    },
    {
        "$sort": {"total_occurrences": -1}
    },
    {
        "$limit": 10
    },
    {
        "$project": {
            "_id": 0,
            "tag": "$_id",
            "total_occurrences": 1
        }
    }
]

resultado_tags_mas_populares = db.posts.aggregate(pipeline_tags_mas_populares)

for resultado in resultado_tags_mas_populares:
    print(resultado)


{'total_occurrences': 13, 'tag': 'elbow'}
{'total_occurrences': 12, 'tag': 'bonsai'}
{'total_occurrences': 12, 'tag': 'grass'}
{'total_occurrences': 11, 'tag': 'toy'}
{'total_occurrences': 11, 'tag': 'star'}
{'total_occurrences': 11, 'tag': 'quail'}
{'total_occurrences': 11, 'tag': 'lily'}
{'total_occurrences': 11, 'tag': 'maria'}
{'total_occurrences': 11, 'tag': 'oval'}
{'total_occurrences': 11, 'tag': 'feeling'}
