In [1]:
from pymongo import MongoClient

In [2]:
# client = MongoClient('mongodb://localhost:27017')
# Usando mongodblab cloud
client = MongoClient('mongodb://miltonlab:1000tonlab@ds047792.mongolab.com:47792/biblioteca')

In [3]:
bd = client['biblioteca']

In [4]:
from timeit import Timer

![Ejemplo estructura](http://docs.mongodb.org/manual/_images/data-model-tree.png)

##Model Tree Structures with Parent References (Parent Links)
Almacena cada nodo del árbol en un documento; adicionalmente a la información del nodo del árbol el documento almacena el 'id' of the nodo padre.

In [7]:
def test_parent_references():
    bd.categorias.drop()
    bd.categorias.insert( { '_id': "MongoDB", 'parent': "Databases" } ) 
    bd.categorias.insert( { '_id': "dbm", 'parent': "Databases" } ) 
    bd.categorias.insert( { '_id': "Databases", 'parent': "Programming" } ) 
    bd.categorias.insert( { '_id': "Languages", 'parent': "Programming" } ) 
    bd.categorias.insert( { '_id': "Programming", 'parent': "Books" } ) 
    bd.categorias.insert( { '_id': "Books", 'parent': None } )

In [8]:
t = Timer(lambda: test_parent_references())
time = t.timeit(number=10)
print('%.2f ' % time)

0.31 


| Pros        | Cons           
| ------------- |:-------------:|
| Consulta para recuperar el padre de un nodo más rápida y sencilla|   |
| Provee una solución simple para el almacenamiento | Se requiere múltimples consultas para recuperar subárboles|
| Se puede crear un índice sobre el campo 'parent' para permitir búsquedas rápidas |       |
|||
|Se puede consultar por el campo 'parent' para encontrar inmediatamente los nodos hijos |       |

In [25]:
bd.categorias.find_one({'_id': 'MongoDB'}).get('parent')

'Databases'

In [29]:
bd.categorias.create_index('parent')

'parent_1'

In [31]:
cursor = bd.categorias.find({'parent' : 'Databases'})
for c in cursor:
    print(c)

{'_id': 'MongoDB', 'parent': 'Databases'}
{'_id': 'dbm', 'parent': 'Databases'}


##Model Tree Structures with Child References

El patrón "Child References" almacena cada nodo del árbol en un documento; adicionalmente a la información del nodo de árbol, el documento almacena en un arreglo los id(s) de los nodos hijos.

In [9]:
def test_child_references():
    bd.categorias.drop()
    bd.categorias.insert( { "_id": "MongoDB", "children": [] } ) 
    bd.categorias.insert( { "_id": "dbm", "children": [] } ) 
    bd.categorias.insert( { "_id": "Databases", "children": ["MongoDB", "dbm"] } ) 
    bd.categorias.insert( { "_id": "Languages", "'children": [] } ) 
    bd.categorias.insert( { "_id": "Programming", "children": ["Databases", "Languages"] } ) 
    bd.categorias.insert( { "_id": "Books", "children": ["Programming"] } )

In [29]:
t = Timer(lambda: test_child_references())
time = t.timeit(number=10)
print('%.2f ' % time)

7.05 


| Pros        | Cons           
| ------------- |:-------------:|
| La consulta para recuperar los hijos inmediatos de un nodo es más rápida y sencilla |   |
| Se puede crear un índice sobre el campo 'children' para permitir búsquedas rápidas por los nodos hijos| |
| Se puede consultar por un nodo en el campo 'children' para encontrar su *nodo padre así como sus nodos hermanos* |       |
|||
|Provee una solución adecuada para almacenamiento de árboles siempre y cuando no sean necesarias las operaciones en subárboles||
|Puede proveer una solución adecuada para almacenar grafos donde un nodo puede tener múltiples padres||

In [32]:
bd.categorias.find_one( { "_id": "Databases" } ).get("children")

['MongoDB', 'dbm']

In [34]:
bd.categorias.create_index("children")

'children_1'

In [37]:
cursor = bd.categorias.find( { "children": "MongoDB" } )
for c in cursor:
    print(c)

{'_id': 'Databases', 'children': ['MongoDB', 'dbm']}


##Model Tree Structures with an Array of Ancestor

El patrón "Arreglo de Ancestros" almacena cada nodo del árbol en un documento; adicionalmente al nodo de árbol, el documento almacena en un arreglo los id(s) de los nodos ancestros o camino.

In [11]:
def test_array_ancestor():
    bd.categorias.drop()
    bd.categorias.insert( { "_id": "MongoDB", "ancestors": [ "Books", "Programming", "Databases" ], "parent": "Databases" } )
    bd.categorias.insert( { "_id": "dbm", "ancestors": [ "Books", "Programming", "Databases" ], "parent": "Databases" } )
    bd.categorias.insert( { "_id": "Databases", "ancestors": [ "Books", "Programming" ], "parent": "Programming" } )
    bd.categorias.insert( { "_id": "Languages", "ancestors": [ "Books", "Programming" ], "parent": "Programming" } )
    bd.categorias.insert( { "_id": "Programming", "ancestors": [ "Books" ], "parent": "Books" } )
    bd.categorias.insert( { "_id": "Books", "ancestors": [ ], "parent": None } )

In [12]:
t = Timer(lambda: test_array_ancestor())
time = t.timeit(number=10)
print('%.2f ' % time)

15.69 


| Pros        | Cons           
| ------------- |:-------------:|
| | Adicionalmente al campo "ancestors" se necesita almacenar la referencia a la categoría del padre inmediata en el campo 'parent' |
| La consulta para recuperar los ancestros o el camino de un nodo es rápida y sencilla| |
| Se puede crear un índice sobre el campo 'ancestors' para permitir búsquedas rápidas por los nodos ancestros|       |
|Se puede consultar por el campo 'ancestros' para encontrar todos sus **descendientes**||
|||
|El patrón "Array of Ancestors" provee una solución rápida y eficiente para encontrar todos los descendientes y los ancestros de un nodo creando un índice sobre los elementos del campo 'ancestors'. Esto hace a este patrón una buena elección para trabajar con subárboles ||
||Este patrón es ligeramente más lento que el patrón "Materialized Paths" pero es más sencillo de usar|

In [14]:
bd.categorias.find_one( { "_id": "MongoDB" } ).get("ancestors")

['Books', 'Programming', 'Databases']

In [15]:
bd.categorias.create_index("ancestors")

'ancestors_1'

In [17]:
cursor = bd.categorias.find( { "ancestors": "Programming" } )
for c in cursor:
    print(c)

{'_id': 'MongoDB', 'parent': 'Databases', 'ancestors': ['Books', 'Programming', 'Databases']}
{'_id': 'dbm', 'parent': 'Databases', 'ancestors': ['Books', 'Programming', 'Databases']}
{'_id': 'Databases', 'parent': 'Programming', 'ancestors': ['Books', 'Programming']}
{'_id': 'Languages', 'parent': 'Programming', 'ancestors': ['Books', 'Programming']}


##Model Tree Structures with Materialized Paths

Este patrón almacena cada nodo del árbol en un documento; adicionalmente al nodo de árbol, el documento almacena en forma de un string los ids(s) de los nodos ancestros o camino. 
Aunque el patrón "Materialized Paths" requiere pasos adicionales de trabajo con strings y expresiones regulares, el patrón también provee más flexibilidad en el trabajo con el camino, tales como la búsqueda de nodos por caminos parciales. 

In [21]:
def test_materialized_paths():
    bd.categorias.drop()
    bd.categorias.insert( { "_id": "Books", "path": None } )
    bd.categorias.insert( { "_id": "Programming", "path": ",Books," } )
    bd.categorias.insert( { "_id": "Databases", "path": ",Books,Programming," } )
    bd.categorias.insert( { "_id": "Languages", "path": ",Books,Programming," } )
    bd.categorias.insert( { "_id": "MongoDB", "path": ",Books,Programming,Databases," } )
    bd.categorias.insert( { "_id": "dbm", "path": ",Books,Programming,Databases," } )


In [22]:
t = Timer(lambda: test_materialized_paths())
time = t.timeit(number=10)
print('%.2f ' % time)

10.06 
