<img src="https://drive.google.com/uc?export=view&id=15SNbs9etrW7wdww8q0BYpewEgOKC1d3m" width="100%" alt="Encabezado unidad 2"></img>

# **Cassandra y Python**
---

En este notebook mostraremos cómo realizar una conexión a una base de datos en _Cassandra_ desde _Python_

## **1. ¿Qué es Cassandra?**
---

<img src="https://drive.google.com/uc?export=view&id=1z60Ka4d5xQZFiiSXp2giyLAEhXHdiHMW" width="50%" alt="Logo cassandra"></img>

* Es una base de datos columnar NoSQL distribuida y basada en modelos de almacenamiento tabulares.
* Fue escrita en _Java_ lo cual permite el manejo de grandes cantidades de datos de forma segura.
* Fue desarrollada en _Facebook_ y lanzada en el 2008, aunque en el 2009 se volvió proyecto de código abierto de tipo Apache.

## **2. Creación de la Base de Datos**
---

Para esta práctica debe crear una cuenta gratuita en [Astra](https://astra.datastax.com/register), puede registrarse con una cuenta de _gmail_, o una cuenta de _GitHub_ o usando su correo personal.

Una vez creada la cuenta debe ingresar la siguiente información sobre el uso de astra:

<img src="https://drive.google.com/uc?export=view&id=1se0WQzpK9GqyacmYWpD6DDGqBWXLV8jC" width="50%">

Con esto, llegará al panel de control general de Astra donde deberá crear una base de datos:

<img src="https://drive.google.com/uc?export=view&id=1bCG3V9XPgvLm2UmuJWNhCG_Vakz4rHmR" width="80%">

Debe poner las siguientes configuraciones en la creación de la base de datos:

* **Database name**: `mlds3`
* **Keyspace name**: `test`
* **Provider and region**: puede usar cualquiera de las disponibles, se recomienda usar los valores de la siguiente imagen.

<img src="https://drive.google.com/uc?export=view&id=1qlIxc-L90RNX70EN7J3OlR5K5I8AiNud" width="50%">

Luego de crear la base de datos, Astra le proveerá un token con la configuración por defecto, no es necesario que lo descargue, pues más adelante configuraremos más permisos para el acceso a la base de datos.

Ahora, vamos a crear el token de acceso para poder acceder a la base de datos y obtener el archivo con la información del servidor. Para ello hacemos clic en la base de datos que creamos y damos clic en **connect**

<img src="https://drive.google.com/uc?export=view&id=1O_hKazRtYp2XDF1f2MWWRQm_qOCBRZS3" width="60%">


Debe bajar seleccionar el tipo de conexión por **driver** de tipo **native** con el lenguaje de programación _Python_. Esto mostrará los pasos que debe seguir para poder realizar la conexión.

<img src="https://drive.google.com/uc?export=view&id=1wSeh1FY8OeDDAIHx4sBJOPxq-CHE0QNn" width="50%">

Descargue el archivo **bundle** y cambie el nombre a `bundle.zip`.

<img src="https://drive.google.com/uc?export=view&id=1YIcapxtqVBtWbC_DNyjPYJm4tiRI82dN" width="50%">

Luego descargue el **token** y cambie el nombre a `token.json`

<img src="https://drive.google.com/uc?export=view&id=1_iRltvUuz3Atfv_T8j07peroBC09NBku" width="50%">

Por último debe subir los archivos `token.json` y `bundle.zip` a google colaboratory o dejarlos en el espacio de trabajo donde está corriendo el notebook.

## **3. Conexión a la Base de Datos**
---

La conexión a la base de datos se da por medio de la librería `cassandra-driver`, la puede instalar con el siguiente comando:

In [None]:
!pip install cassandra-driver

Finalmente, importamos las librerías necesarias para la conexión:

In [None]:
from cassandra.cluster import Cluster
from cassandra.auth import PlainTextAuthProvider
import json

Para conectarse debe descargar el *bundle* y el token de acceso en formato `csv` que obtuvo al momento de crear la base de datos. Estos archivos los debe subir a google colaboratory.

Veamos cómo crear la conexión:

> **Nota**: debe cambiar el nombre del bundle (formato zip) y del token (formato csv) a el nombre que tengan estos archivos en su base de datos.

In [None]:
cloud_config= {
        "secure_connect_bundle": "bundle.zip" # nombre de su archivo de bundle
}
with open('token.json') as user_file:
  token = json.loads(user_file.read())

Ahora, vamos a crear los objeton de conexión y autenticación, creamos los siguientes tres objetos:

* `auth_provider`: objeto de autenticación creado con las credenciales de acceso a [astra](https://astra.datastax.com/).
* `cluster`: objeto de identificación del servidor (cluster) maestro de la base de datos.
* `session`: session de conexión sobre la que se ejecutarán los distintos comandos (es equivalente al objeto cursor en bases SQL).

> **Nota**: las bases de datos gratuitas en [astra](https://astra.datastax.com/) se pausan luego de 48h sin uso, debe revisar desde el panel de control de astra que se encuentre activa o en caso contrario resumirla.

In [None]:
auth_provider = PlainTextAuthProvider(
        token["clientId"],
        token["secret"]
        )
cluster = Cluster(
        cloud=cloud_config,
        auth_provider=auth_provider
        )
session = cluster.connect()

## **4. Ejecución de la Consulta**
---

Veamos como ejecutar un comando en la base de datos:

In [None]:
query = """
SELECT
    release_version
FROM
    system.local
;
"""
row = session.execute(query).one()
print(row[0])

Este resultado muestra la versión del servidor de cassandra, debe obtener un número parecido (no necesariamente igual) al siguiente:

```
4.0.0.6816
```

## **5. Recursos Adicionales**
---

* [AstraDB DataStax](https://www.datastax.com/products/datastax-astra).
* [Python driver for Apache Cassandra](https://docs.datastax.com/en/developer/python-driver/3.25/).

## **6. Créditos**
---

**Profesor**

- [Jorge E. Camargo, PhD](https://dis.unal.edu.co/~jecamargom/)

**Diseño, desarrollo del notebook y material audiovisual**

- [Juan S. Lara MSc](https://www.linkedin.com/in/juan-sebastian-lara-ramirez-43570a214/)

**Universidad Nacional de Colombia** - *Facultad de Ingeniería*