[![Abrir en Google Colab](https://colab.research.google.com/assets/colab-badge.svg)](
https://colab.research.google.com/github/cursoslabra/introBBDD/blob/main/Books/presentacion.ipynb)

# Ejemplos de la presentación
Este notebook contiene ejemplos del curso **introducción a las bases de datos**. Los ejercicios pueden ejecutarse.

## 1. Instalación de requisitos: sqlite3 y otras librerías

In [1412]:
# La siguiente instrucción borra la base de datos si existe, en caso de que se re-ejecute el código y ya esté creada
!rm -f presentacion.db

In [1413]:
import sqlite3
import pandas as pd
import requests

# Mostrar versión de sqlite
print("Versión de sqlite:", sqlite3.sqlite_version)


Versión de sqlite: 3.37.2


In [1414]:
# Crear una base de datos en un archivo local
db_path = "presentacion.db"  # Nombre del archivo de la base
print("Base de datos en:", db_path)
# Descargar una base de datos de ejemplo (opcional)
con = sqlite3.connect("presentacion.db")

Base de datos en: presentacion.db


Conectarse a la base de datos:

In [1415]:

# Crear un cursor para ejecutar consultas
cursor = con.cursor()

# Mostrar las tablas en la base de datos
tables = cursor.execute("SELECT name FROM sqlite_master WHERE type='table';").fetchall()
print("Tablas existentes en la base de datos:")
for t in tables:
    print("-", t[0])


Tablas existentes en la base de datos:


## Gestión de tablas

## Gestión de tablas

### Creación de tablas

Crear una tabla de personas

In [1416]:
cursor.execute("""
CREATE TABLE alumnos (
 Id              TEXT,
 Nombre          TEXT,
 Apellidos       TEXT,
 FechaNacimiento Date
)
""")

con.commit()
print("✅ Tabla 'alumnos' creada con éxito.")


✅ Tabla 'alumnos' creada con éxito.


In [1417]:
# Mostrar las tablas en la base de datos
tables = cursor.execute("SELECT name FROM sqlite_master WHERE type='table';").fetchall()
print("Tablas existentes en la base de datos:")
for t in tables:
    print("-", t[0])

Tablas existentes en la base de datos:
- alumnos


Introducir datos de ejemplo

In [1418]:
cursor.execute("""
INSERT INTO alumnos (Id, Nombre, Apellidos, FechaNacimiento)
VALUES ("uo234", "Jose", "Torres", "1992-03-04"),
       ("uo512", "Ana", "Cardo",  "1987-02-07"),
       ("uo545", "Ana", "Pascual", "2000-01-01");
""")
con.commit()
print("✅ registros insertados en 'alumnos'.")


✅ registros insertados en 'alumnos'.


Consultar datos de la tabla

In [1419]:
for row in cursor.execute("SELECT * FROM alumnos"):
    print(row)

('uo234', 'Jose', 'Torres', '1992-03-04')
('uo512', 'Ana', 'Cardo', '1987-02-07')
('uo545', 'Ana', 'Pascual', '2000-01-01')


También se puede ejecutar la consulta desde Pandas para convertir los resultados en un DataFrame de Pandas que luego permite su análisis.

In [1420]:
pd.read_sql("SELECT * FROM alumnos;", con)


Unnamed: 0,Id,Nombre,Apellidos,FechaNacimiento
0,uo234,Jose,Torres,1992-03-04
1,uo512,Ana,Cardo,1987-02-07
2,uo545,Ana,Pascual,2000-01-01


### Modificación de tablas

In [1421]:
cursor.execute("""
 CREATE TABLE Personas (
 Id              TEXT,
 Nombre          TEXT,
 Apellidos       TEXT,
 FechaNacimiento Date
)
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1422]:
cursor.execute("""
ALTER TABLE Personas RENAME TO Estudiantes;
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1423]:
cursor.execute("""
ALTER TABLE Estudiantes ADD COLUMN Email TEXT;
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1424]:
cursor.execute("""
ALTER TABLE Estudiantes RENAME COLUMN Email TO Correo;
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1425]:
cursor.execute("""
ALTER TABLE Estudiantes DROP COLUMN Correo;
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1426]:
tables = cursor.execute("SELECT name FROM sqlite_master WHERE type='table';").fetchall()
print("Tablas existentes en la base de datos:")
for t in tables:
    print("-", t[0])

Tablas existentes en la base de datos:
- alumnos
- Estudiantes


### Borrar tablas

In [1427]:
cursor.execute("""
 DROP TABLE Estudiantes;
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1428]:
tables = cursor.execute("SELECT name FROM sqlite_master WHERE type='table';").fetchall()
print("Tablas existentes en la base de datos:")
for t in tables:
    print("-", t[0])

Tablas existentes en la base de datos:
- alumnos


## Manipulación de datos

### Inserción de registros

In [1429]:
cursor.execute("""
INSERT INTO alumnos (Id, Nombre, Apellidos, FechaNacimiento)
VALUES ('uo678', 'Daniel', 'Domingo', '2001-05-02'),
       ('uo987', 'Fernando', 'Flores', '1999-06-04')
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

### Borrar registros

In [1430]:
cursor.execute("""
DELETE FROM alumnos WHERE FechaNacimiento = "1999-06-04";
""")
con.commit()
for row in cursor.execute("SELECT * FROM alumnos"):
    print(row)

('uo234', 'Jose', 'Torres', '1992-03-04')
('uo512', 'Ana', 'Cardo', '1987-02-07')
('uo545', 'Ana', 'Pascual', '2000-01-01')
('uo678', 'Daniel', 'Domingo', '2001-05-02')


Volvemos a añadir la fila con `Ana Cardo` cambiando la fecha de nacimiento.

In [1431]:
cursor.execute("""
INSERT INTO alumnos (Id, Nombre, Apellidos, FechaNacimiento)
VALUES ('uo987', 'Fernando', 'Flores', '1987-06-04' );
""");

In [1432]:
con.commit()

In [1433]:
for row in cursor.execute("SELECT * FROM alumnos"):
    print(row)


('uo234', 'Jose', 'Torres', '1992-03-04')
('uo512', 'Ana', 'Cardo', '1987-02-07')
('uo545', 'Ana', 'Pascual', '2000-01-01')
('uo678', 'Daniel', 'Domingo', '2001-05-02')
('uo987', 'Fernando', 'Flores', '1987-06-04')


### Actualizar registros

In [1434]:
cursor.execute("""
UPDATE alumnos SET FechaNacimiento = "2007-06-04"
WHERE Nombre = "Fernando" AND Apellidos = 'Flores';
""");
for row in cursor.execute("SELECT * FROM alumnos"):
    print(row)

('uo234', 'Jose', 'Torres', '1992-03-04')
('uo512', 'Ana', 'Cardo', '1987-02-07')
('uo545', 'Ana', 'Pascual', '2000-01-01')
('uo678', 'Daniel', 'Domingo', '2001-05-02')
('uo987', 'Fernando', 'Flores', '2007-06-04')


## Consultas SQL

### Proyección y Selección

#### Proyección

Se pueden indicar los nombres de las columnas que se desea mostrar

In [1435]:
pd.read_sql("""
  SELECT apellidos, nombre
  FROM  alumnos
  WHERE nombre = 'Ana' ;
""", con)

Unnamed: 0,Apellidos,Nombre
0,Cardo,Ana
1,Pascual,Ana


Mediante `*`  se indica que se quieren seleccionar todas las columnas de la tabla

In [1436]:
pd.read_sql("""
  SELECT *
  FROM  alumnos
  WHERE nombre = 'Ana' AND apellidos = 'Cardo';
""", con)

Unnamed: 0,Id,Nombre,Apellidos,FechaNacimiento
0,uo512,Ana,Cardo,1987-02-07


También se pueden incluir expresiones asociándo un alias a la columna mediante `AS`:

In [1437]:
pd.read_sql("""
  SELECT nombre || ' ' || apellidos AS NombreCompleto,
         strftime('%Y', 'now') AS AñoActual,
         strftime('%Y', FechaNacimiento) AS AñoNacimiento,
         strftime('%Y', 'now') - strftime('%Y', FechaNacimiento) AS Edad
  FROM  alumnos
  WHERE nombre = 'Ana';
""", con)

Unnamed: 0,NombreCompleto,AñoActual,AñoNacimiento,Edad
0,Ana Cardo,2025,1987,38
1,Ana Pascual,2025,2000,25


In [1438]:
pd.read_sql("""
SELECT DISTINCT Nombre
FROM  alumnos
""", con)

Unnamed: 0,Nombre
0,Jose
1,Ana
2,Daniel
3,Fernando


#### Selección (WHERE)

La cláusula `WHERE` permite seleccionar las filas de la tabla que se van a mostrar en el resultado. El contenido de `WHERE` es una expresión booleana y actúa como un filtro excluyendo las filas cuyos valores son falsos o nulos.

In [1439]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM  alumnos
 WHERE FechaNacimiento > '1990-01-01';
""", con)


Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Jose,Torres,1992-03-04
1,Ana,Pascual,2000-01-01
2,Daniel,Domingo,2001-05-02
3,Fernando,Flores,2007-06-04


Se pueden incluir combinaciones de expresiones booleanas mediante `AND`, `OR`, `NOT`

In [1440]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM  alumnos
 WHERE FechaNacimiento > '2000-01-01' OR FechaNacimiento < '1990-31-12'
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Ana,Cardo,1987-02-07
1,Daniel,Domingo,2001-05-02
2,Fernando,Flores,2007-06-04


Existen muchas funciones que permiten manipular los diferentes valores. En SQLite, las funciones disponibles se documentan en: https://www.sqlite.org/lang_corefunc.html

In [1441]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM  alumnos
 WHERE length(Apellidos) > 6
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Ana,Pascual,2000-01-01
1,Daniel,Domingo,2001-05-02


In [1442]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM  alumnos
 WHERE Nombre like '%d%'
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Daniel,Domingo,2001-05-02
1,Fernando,Flores,2007-06-04


#### Ordenación

In [1443]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM   alumnos
 WHERE  length(Apellidos) > 6
 ORDER BY Apellidos ASC, Nombre DESC
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Daniel,Domingo,2001-05-02
1,Ana,Pascual,2000-01-01


#### Limit y Offset

In [1444]:
pd.read_sql("""
 SELECT Nombre, Apellidos, FechaNacimiento
 FROM   alumnos
 ORDER BY Apellidos
 LIMIT 2 OFFSET 3
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Ana,Pascual,2000-01-01
1,Jose,Torres,1992-03-04


### Uniones (Joins)

In [1445]:
con.execute("""
 CREATE TABLE Nombres (
 Id              TEXT,
 Nombre          TEXT );
""")

<sqlite3.Cursor at 0x7d7b9aab9440>

In [1446]:
con.execute("""
 INSERT INTO Nombres (Id, Nombre)
 VALUES ('uo234', 'Jose'),
        ('uo512', 'Ana'),
        ('uo545', 'Luis');
        """)


<sqlite3.Cursor at 0x7d7b9aab88c0>

In [1447]:
con.execute("""
 CREATE TABLE Valores (Id, Nota);
""")

<sqlite3.Cursor at 0x7d7b9aab8240>

In [1448]:
con.execute("""
 INSERT INTO Valores (Id, Nota)
 VALUES ('uo234', 7.8),
        ('uo545', 10),
        ('uo666', 3)
""")

<sqlite3.Cursor at 0x7d7b9aab95c0>

#### Unión cruzada (CROSS Join)

In [1449]:
pd.read_sql("""
 SELECT * FROM Nombres CROSS JOIN Valores;
""", con)

Unnamed: 0,Id,Nombre,Id.1,Nota
0,uo234,Jose,uo234,7.8
1,uo234,Jose,uo545,10.0
2,uo234,Jose,uo666,3.0
3,uo512,Ana,uo234,7.8
4,uo512,Ana,uo545,10.0
5,uo512,Ana,uo666,3.0
6,uo545,Luis,uo234,7.8
7,uo545,Luis,uo545,10.0
8,uo545,Luis,uo666,3.0


#### Unión interna o natural (Inner Join)

In [1450]:
pd.read_sql("""
SELECT Nombres.Id, Nombre, Nota
FROM Nombres INNER JOIN Valores
ON Nombres.Id = Valores.Id;
""", con)


Unnamed: 0,Id,Nombre,Nota
0,uo234,Jose,7.8
1,uo545,Luis,10.0


#### Unión externa (Outer Join)

In [1451]:
pd.read_sql("""
SELECT Nombres.Id, Nombre, Nota
FROM Nombres LEFT OUTER JOIN Valores
ON Nombres.Id = Valores.Id;
""", con)

Unnamed: 0,Id,Nombre,Nota
0,uo234,Jose,7.8
1,uo512,Ana,
2,uo545,Luis,10.0


#### Nombres y alias

Si se desea realizar una unión entre dos tablas que tienen un mismo campo, se puede deshacer la ambigüedad usando una expresión del tipo: `nombre_tabla.campo`.

Cuando una tabla tiene un nombre muy largo, se le puede dar un alias.

In [1452]:
pd.read_sql("""
SELECT N.Id, Nombre, Nota
FROM Nombres N LEFT OUTER JOIN Valores
ON N.Id = Valores.Id;
""", con)

Unnamed: 0,Id,Nombre,Nota
0,uo234,Jose,7.8
1,uo512,Ana,
2,uo545,Luis,10.0


### Funciones agregadas y agrupamiento de datos

In [1453]:
con.execute("""
 CREATE TABLE NotasCurso
   ( Nombre TEXT,
     Nota DECIMAL,
     Curso Text
   )
""")

<sqlite3.Cursor at 0x7d7b9aaba5c0>

In [1454]:
con.execute("""
 INSERT INTO NotasCurso (Nombre, Nota, Curso)
 VALUES ('Jose', 7.8, 'Lógica'),
 ('Eva',9,'Álgebra'),
 ('Luis', 10, 'Lógica'),
 ('Ana', 4, 'Álgebra'),
 ('Luis', 7, 'Álgebra'),
 ('Jose', 6, 'Álgebra')
""")

<sqlite3.Cursor at 0x7d7b9aaa2ec0>

#### GROUP BY

In [1455]:
pd.read_sql("""
 SELECT Curso, Count(*) As Num
 FROM NotasCurso
 GROUP BY Curso
""", con)

Unnamed: 0,Curso,Num
0,Lógica,2
1,Álgebra,4


#### Funciones de agregación

Existen varias funciones de agregación como `AVG`, `MIN`, `MAX`, etc. La lista completa puede consultarse en: https://www.sqlite.org/lang_aggfunc.html

In [1456]:
pd.read_sql("""
 SELECT Curso, AVG(Nota) AS Media, MIN(Nota) AS Mínima, MAX(Nota) AS Máxima
 FROM NotasCurso
 GROUP BY Curso
""", con)

Unnamed: 0,Curso,Media,Mínima,Máxima
0,Lógica,8.9,7.8,10
1,Álgebra,6.5,4.0,9


#### Having

In [1457]:
pd.read_sql("""
 SELECT Curso, AVG(Nota) AS Media
 FROM NotasCurso
 GROUP BY Curso
 HAVING Media > 8
""", con)

Unnamed: 0,Curso,Media
0,Lógica,8.9


### Subconsultas y expresiones compuestas

#### Anidación de SELECT

Una subconsulta es una consulta SELECT que aparece dentro de otra consulta SELECT

A modo de ejemplo, si se desea mostrar para cada uno de los registros su nota, junto con la nota media de la clase y la desviación típica, se puede realizar la siguiente consulta:

In [1458]:
pd.read_sql("""
 SELECT
    N.Id,
    N.Nota,
    (SELECT AVG(N2.Nota) FROM Valores N2) AS Nota_Media,
    N.Nota - (SELECT AVG(N3.Nota) FROM Valores N3) AS Desviación
  FROM Valores N
""", con)


Unnamed: 0,Id,Nota,Nota_Media,Desviación
0,uo234,7.8,6.933333,0.866667
1,uo545,10.0,6.933333,3.066667
2,uo666,3.0,6.933333,-3.933333


El anterior código no es eficiente porque se calcula la nota media para cada registro. Se puede hacer más eficiente creando una tabla auxiliar `Stats` que incluye el valor de la nota media y se calcula una sola vez para todos los registros.

In [1459]:
pd.read_sql("""
 SELECT
    N.Id,
    N.Nota,
    Stats.Nota_Media,
    N.Nota - Stats.Nota_Media AS Desviación
  FROM Valores N,
    (SELECT AVG(Nota) AS Nota_Media FROM Valores) Stats
""", con)

Unnamed: 0,Id,Nota,Nota_Media,Desviación
0,uo234,7.8,6.933333,0.866667
1,uo545,10.0,6.933333,3.066667
2,uo666,3.0,6.933333,-3.933333


#### Unión, intersección y diferencia

Mediante `UNION` se combinan los registros que cumplen dos resultados. Ejemplo, mostrar registros cuya fecha de nacimiento es posterior a 1990 o cuyo nombre tiene una `a`.

In [1460]:
pd.read_sql("""
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE FechaNacimiento >= '1990-01-01'
UNION
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE nombre LIKE '%a%';
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Ana,Cardo,1987-02-07
1,Ana,Pascual,2000-01-01
2,Daniel,Domingo,2001-05-02
3,Fernando,Flores,2007-06-04
4,Jose,Torres,1992-03-04


Obsérvese que `UNION` elimina duplicados. Si hay algún registro que cumpla ambas condiciones, solamente se muestra una vez.

Mediante `INTERSECT` se devuelven los registros que cumplen ambas condiciones.

In [1461]:
pd.read_sql("""
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE FechaNacimiento >= '1990-01-01'
INTERSECT
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE nombre LIKE '%a%';
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Ana,Pascual,2000-01-01
1,Daniel,Domingo,2001-05-02
2,Fernando,Flores,2007-06-04


Mediante `EXCEPT` (en otros sistemas se utiliza `DIFF`) se devuelven los registros que cumplen la primera condición, pero no la segunda.

In [1462]:
pd.read_sql("""
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE FechaNacimiento >= '1990-01-01'
EXCEPT
SELECT nombre, apellidos, FechaNacimiento FROM alumnos WHERE nombre LIKE '%a%';
""", con)

Unnamed: 0,Nombre,Apellidos,FechaNacimiento
0,Jose,Torres,1992-03-04


#### Resultados condicionales

In [1463]:
pd.read_sql("""
SELECT Id, Nota,
Case
  When Nota < 5 then "Suspenso"
  When Nota < 7 then "Aprobado"
  When Nota < 9 then "Notable"
  Else "Sobresaliente"
 End As Texto FROM Valores
""", con)

Unnamed: 0,Id,Nota,Texto
0,uo234,7.8,Notable
1,uo545,10.0,Sobresaliente
2,uo666,3.0,Suspenso


### Transacciones

Las transacciones permiten agrupar sentencias SQL de forma que o bien todas tienen éxito, o en caso de que una falle, fallan todas.

Los comandos que permiten realizar transacciones son: `begin`, `commit` y `rollback`.

Por defecto, todos los comandos SQL se ejecutan en una transacción.

In [1464]:
cursor.execute("""
CREATE TABLE alumnosChecked (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    nombre TEXT NOT NULL,
    apellidos TEXT NOT NULL,
    nota REAL NOT NULL CHECK(nota >= 0 AND nota <= 10)
)
""")

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1465]:
cursor.executemany("""
INSERT INTO alumnosChecked (nombre, apellidos, nota) VALUES (?, ?, ?)
""", [
    ('Ana', 'Pérez', 8.5),
    ('Luis', 'Gómez', 6.7),
    ('Carla', 'López', 9.0),
    ('Juan', 'Torres', 5.5),
    ('Marta', 'Díaz', 7.5)
])

<sqlite3.Cursor at 0x7d7b9aa75140>

In [1466]:
print("Datos iniciales:")
for row in cursor.execute("SELECT * FROM alumnosChecked"):
    print(row)

Datos iniciales:
(1, 'Ana', 'Pérez', 8.5)
(2, 'Luis', 'Gómez', 6.7)
(3, 'Carla', 'López', 9.0)
(4, 'Juan', 'Torres', 5.5)
(5, 'Marta', 'Díaz', 7.5)


In [1467]:
con.commit()

In [1468]:
try:
    # Iniciamos la transacción
    con.execute("BEGIN TRANSACTION;")

    # Actualizamos la nota de Ana
    cursor.execute("""
    UPDATE alumnosChecked
    SET nota = 9.0
    WHERE nombre = 'Ana'
    """)

    # Insertamos un nuevo alumno con nota válida
    cursor.execute("""
    INSERT INTO alumnosChecked (nombre, apellidos, nota)
    VALUES (?, ?, ?)
    """, ('Pedro', 'Martínez', 7.5))

    # Intentamos insertar un alumno con nota inválida (esto provocará error)
    cursor.execute("""
    INSERT INTO alumnosChecked (nombre, apellidos, nota)
    VALUES (?, ?, ?)
    """, ('Lucía', 'García', 12))  # nota > 10, viola CHECK

    # Si todo va bien, confirmamos
    con.commit()
except sqlite3.IntegrityError as e:
    # Si hay error, deshacemos toda la transacción
    print("Error detectado, deshaciendo cambios:", e)
    con.rollback()


Error detectado, deshaciendo cambios: CHECK constraint failed: nota >= 0 AND nota <= 10


## Cerrar la conexión a la base de datos

Para finalizar, borramos la conexión con la base de datos.

##

In [1469]:
con.close()
print("Conexión a la base de datos cerrada.")


Conexión a la base de datos cerrada.
