# Introducción a Jupyter y su utilidad en el contexto de bases de datos

Jupyter Notebook es una herramienta interactiva ampliamente utilizada en el ámbito de la ciencia de datos, análisis y desarrollo de software. Permite combinar código, texto, visualizaciones y resultados en un único documento, lo que facilita la documentación y la reproducibilidad de los ejemplos. Se basa en la creación de _notebooks_, que son documentos formados por _celdas_ de código. Estas celdas pueden contener código en diferentes lenguajes de programación, como Python, y código en formato Markdown para la documentación. Estas celdas se pueden ejecutar de forma independiente, lo que permite realizar pruebas y experimentos de manera interactiva.

En el contexto de bases de datos, Jupyter es especialmente útil para:

- **Conexión a bases de datos**: A través de extensiones como `jupy-sql`, un fork de `ipython-sql`, es posible conectarse a diferentes sistemas de gestión de bases de datos (PostgreSQL, MySQL, SQLite, entre otros) y ejecutar consultas SQL directamente desde las celdas del notebook.
- **Exploración de datos**: Permite realizar consultas, visualizar tablas y analizar los datos de manera interactiva.
- **Documentación**: Gracias al soporte de Markdown, se pueden documentar los pasos realizados, explicar los resultados y compartir el análisis con otros.
- **Integración con Python**: Combina la potencia de SQL para consultas con las capacidades analíticas y de visualización de Python.

Esto convierte a Jupyter en una herramienta ideal para trabajar con bases de datos de manera eficiente y colaborativa.


## Extensión SQL en Jupyter Notebook

El comando `%load_ext sql` se utiliza para cargar la extensión `sql` en un Jupyter Notebook. Esta extensión permite ejecutar consultas SQL directamente desde las celdas del notebook, utilizando una sintaxis especial que comienza con `%%sql` para celdas mágicas o `%sql` para comandos en línea.

Es especialmente útil para conectarse a bases de datos y realizar consultas de manera interactiva, integrando los resultados directamente en el flujo de trabajo del notebook. Esto facilita la exploración y análisis de datos almacenados en bases de datos relacionales.

In [None]:
%load_ext sql

In [None]:
%%sql
postgresql://example:example@postgres:5432/example


In [None]:
%%sql
DROP TABLE IF EXISTS transacciones;
DROP TABLE IF EXISTS ctacli;
DROP TABLE IF EXISTS cuentas;
DROP TABLE IF EXISTS empleados;
DROP TABLE IF EXISTS sucursales;
DROP TABLE IF EXISTS clientes;

CREATE TABLE sucursales (
    nombresuc varchar(10),
    ciudadsuc varchar(10),
    activo decimal(8,1),
    PRIMARY KEY(nombresuc)
);

CREATE TABLE empleados (
    nombreemp varchar(8),
    dniemp smallint,
    telefono integer,
    nombresuc varchar(8),
    PRIMARY KEY (dniemp),
    FOREIGN KEY(nombresuc) REFERENCES sucursales(nombresuc)
);

CREATE TABLE cuentas (
    numerocta smallint,
    saldo decimal(6,1),
    nombresuc varchar(8),
    PRIMARY KEY(numerocta),
    FOREIGN KEY(nombresuc) REFERENCES sucursales(nombresuc)
);

CREATE TABLE clientes (
    nombrecli varchar(8),
    dnicli smallint,
    domicilio varchar(23),
    PRIMARY KEY (dnicli)
);

CREATE TABLE ctacli (
    dnicli smallint,
    numerocta smallint,
    PRIMARY KEY(dnicli, numerocta),
    FOREIGN KEY(dnicli) REFERENCES clientes(dnicli),
    FOREIGN KEY(numerocta) REFERENCES cuentas(numerocta)
);

CREATE TABLE transacciones (
    numerocta smallint,
    numerotrans smallint,
    fecha date,
    importe decimal(6,1),
    PRIMARY KEY(numerocta, numerotrans),
    FOREIGN KEY(numerocta) REFERENCES cuentas(numerocta)
);


-- Insertar datos en sucursales
INSERT INTO sucursales VALUES 
('Downtown','Brooklyn',9000000.0),
('Redwood','Palo Alto',2100000.0),
('Perrydge','Horseneck',1700000.0),
('Mianus','Horseneck',400000.0),
('Round Hill','Horseneck',8000000.0),
('Pownal','Bennington',300000.0),
('North Town','Rye',3700000.0),
('Brighton','Brooklyn',7100000.0);

-- Insertar datos en empleados
INSERT INTO empleados VALUES 
('Smith',10,101010,'Downtown'),
('Kortz',11,111111,'Downtown'),
('Hansen',12,121212,'Perrydge'),
('Dubitzky',13,131313,'Perrydge'),
('Henson',14,141414,'Mianus'),
('Kravitz',15,151515,'Brighton');

-- Insertar datos en cuentas
INSERT INTO cuentas VALUES 
(1,10000.0,'Downtown'),
(2,20000.0,'Downtown'),
(3,30000.0,'Perrydge'),
(4,40000.0,'Perrydge'),
(5,50000.0,'Mianus'),
(6,60000.0,'Brighton');

-- Insertar datos en clientes
INSERT INTO clientes VALUES 
('Johnson',1,'La Reina nº 7'),
('Smith',2,'Fragata Azul nº 8'),
('Hayes',3,'Gibraltar Español nº 14'),
('Turner',4,'Gibraltar Español nº 17'),
('Williams',5,'Diamante S/N'),
('Lindsay',6,'Gato negro nº 13'),
('Green',7,'Perro nº 1');

-- Insertar datos en ctacli
INSERT INTO ctacli VALUES 
(1,1),(1,2),(1,6),(2,3),(3,4),(4,5),(5,5),(6,5),(7,6);

-- Insertar datos en transacciones
INSERT INTO transacciones VALUES 
(1,1,'2024-01-01',10000.0),
(2,1,'2024-01-01',30000.0),
(2,2,'2024-01-01',-20000.0),
(3,1,'2024-01-01',30000.0),
(4,1,'2024-01-01',40000.0),
(5,1,'2024-01-01',50000.0),
(6,1,'2024-01-01',60000.0);

In [None]:
%%sql
select * from sucursales;

nombresuc,ciudadsuc,activo
Downtown,Brooklyn,9000000.0
Redwood,Palo Alto,2100000.0
Perrydge,Horseneck,1700000.0
Mianus,Horseneck,400000.0
Round Hill,Horseneck,8000000.0
Pownal,Bennington,300000.0
North Town,Rye,3700000.0
Brighton,Brooklyn,7100000.0


In [None]:
%%sql
mysql+pymysql://example:example@mysql/example

In [None]:
%%sql
select * from sucursales

RuntimeError: If using snippets, you may pass the --with argument explicitly.
For more details please refer: https://jupysql.ploomber.io/en/latest/compose.html#with-argument


Original error message from DB driver:
(pymysql.err.ProgrammingError) (1146, "Table 'example.sucursales' doesn't exist")
[SQL: select * from sucursales]
(Background on this error at: https://sqlalche.me/e/20/f405)

If you need help solving this issue, send us a message: https://ploomber.io/community
