# Tecnologías NoSQL -- Tutorial en JISBD 2017

Toda la información de este tutorial está disponible en https://github.com/dsevilla/jisbd17-nosql.
Diego Sevilla Ruiz, [dsevilla@um.es](mailto:dsevilla@um.es).

![Slide0](./images/slide000.jpg)

In [None]:
%load utils/functions.py


In [None]:
say(u"")

In [None]:
ds(5)

## MongoDB (documentos)

![Image of MongoDB](https://webassets.mongodb.com/_com_assets/cms/MongoDB-Logo-5c3a7405a85675366beb3a5ec4c032348c390b3f142f5e6dddf1d78e2df5cb5c.png)

In [None]:
%%bash
docker pull mongo
#SUDO_ASKPASS=/usr/bin/qt4-ssh-askpass sudo pip2 install --upgrade pymongo

In [None]:
!docker run --rm -d --name mongo -p 27017:27017 mongo

In [None]:
import pymongo
from pymongo import MongoClient
client = MongoClient("localhost",27017)
client

In [None]:
client.database_names()

Creamos una base de datos `slides`:

In [None]:
db = client.slides

Y la colección `slides`:

In [None]:
slides = db.slides
slides.drop()

In [None]:
slides.insert_one({'_id' : 'slide000',
                   'title': 'blah',
                   'image': 'blah',
                   'references' : ['http://nosql-database.org'],
                   'crossref' : ['slide010', 'slide002'],
                   'links' : ['slide020', 'slide040']
                  })

In [None]:
pp(slides.find_one())

In [None]:
import os
import glob
files = glob.glob('slides/slides-dir/*.jpg')

In [None]:
img =load_img(files[0])
img

In [None]:
for file in files:
    img = load_img(file)
    img_to_thumbnail(img)
    slidename = os.path.basename(os.path.splitext(file)[0])
    slides.update_one({'_id': slidename},
                       {'$set' : {'image': img_to_base64(img)}},
                      True)

In [None]:
for slide in slides.find():
    pp(slide['_id'])

In [None]:
slide0 = slides.find({'_id': 'slide000'})[0]

In [None]:
img_from_base64(slide0['image'])

In [None]:
!docker stop mongo

## HBase (wide-column)

![Image of HBase](http://hbase.apache.org/images/hbase_logo_with_orca_large.png)

Usaré la imagen docker de HBase a partir de aquí: https://github.com/krejcmat/hadoop-hbase-docker, ligeramente modificada. Para iniciar los contenedores (un master y dos "slave"):

    git clone https://github.com/dsevilla/hadoop-hbase-docker.git
    cd hadoop-hbase-docker
    ./start-container.sh latest 2

    # Un conenedor máster, 2 slave, simulan un clúster distribuido de tres nodos
    # Los contenedores arrancan, el shell entra en el master:

    ./configure-slaves.sh
    ./start-hadoop.sh
    ./start-hbase.sh
    hbase-daemon.sh start thrift  # Servidor para conexión externo

Ahora ya podemos conectar a la base de datos. Dentro del contenedor, ejecutando `hbase shell` nos vuelve a mostrar el shell. En él, podemos ejecutar consultas, creación de tablas, etc.:

    status
    # Crear tabla
    # Put
    # Consultas sencillas

También se puede conectar de forma remota. Usaremos, desde Python, el paquete `happybase`:

    sudo pip2 install happybase

In [None]:
import happybase
happybase.__version__

In [None]:
host = '127.0.0.1'
connection = happybase.Connection(host)
connection.tables()

## Neo4j (Grafos)

![Image of HBase](https://neo4j.com/wp-content/themes/neo4jweb/assets/images/neo4j-logo-2015.png)

Se puede utilizar el propio interfaz de Neo4j también en la dirección http://127.0.0.1:7474.

In [None]:
%%bash
docker pull neo4j
docker run -d --rm --name neo4j -p 7474:7474 -p 7687:7687 neo4j

Vamos a cargar la extensión `ipython-cypher` para poder lanzar consultas Cypher directamente a través de la hoja. En mi ordenador he configurado "`root`" como _password_.

Para iniciar Neo4j hay que ir primero a la página de su browser y hacer login con el usuario y clave iniciales:

http://127.0.0.1:7474

Usuario: neo4j
Password: neo4j

Después pide la nueva clave. Yo he puesto "`root`" en esta hoja.

Utilizaremos una extensión de Jupyter Notebook que se llama `ipython-cypher`. Está instalada en la máquina virtual. Si no, se podría instalar con:

    sudo pip2 install ipython-cypher
    
Después, todas las celdas que comiencen por `%%cypher` y todas las instrucciones Python que comiencen por `%cypher` se enviarán a Neo4j para su interpretación

In [None]:
%load_ext cypher
%config CypherMagic.uri='http://neo4j:root@127.0.0.1:7474/db/data'

In [None]:
%config CypherMagic.auto_html=False
%config CypherMagic.auto_pandas=True

In [None]:
%%cypher
match (n) return n.name;