<a href="https://colab.research.google.com/github/Juan-MonroyS/Ciencia-de-Datos/blob/main/Copy_of_db_SQLite_inventario1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Gestión Básica de Inventario con SQLite3

**Autor: Elias Buitrago B.
Edición: Juan Camilo Monroy Santana**\
Bogotá, Colombia \
Actualizado: 14 Octubre 2025 \
_Nota: Código ajustado para su ejecución en Google Colaboratory_\

## Instalar librerías SQLite3

In [1]:
%%shell
sudo apt-get install sqlite3

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
Suggested packages:
  sqlite3-doc
The following NEW packages will be installed:
  sqlite3
0 upgraded, 1 newly installed, 0 to remove and 38 not upgraded.
Need to get 769 kB of archives.
After this operation, 1,874 kB of additional disk space will be used.
Get:1 http://archive.ubuntu.com/ubuntu jammy-updates/main amd64 sqlite3 amd64 3.37.2-2ubuntu0.5 [769 kB]
Fetched 769 kB in 45s (17.1 kB/s)
debconf: unable to initialize frontend: Dialog
debconf: (No usable dialog-like program is installed, so the dialog based frontend cannot be used. at /usr/share/perl5/Debconf/FrontEnd/Dialog.pm line 78, <> line 1.)
debconf: falling back to frontend: Readline
debconf: unable to initialize frontend: Readline
debconf: (This frontend requires a controlling tty.)
debconf: falling back to frontend: Teletype
dpkg-preconfigure: unable to re-open stdin: 
Selecting previously unselected package sqlite3.
(Reading d



## Crear la base de datos y una tabla de inventario

In [2]:
import sqlite3
import random

# Crear la base de datos con SQlite
conn = sqlite3.connect('productos.db')
c = conn.cursor()

In [3]:
# Crear una tabla llamada 'inventario'
c.execute('''
CREATE TABLE inventario (
    id INTEGER PRIMARY KEY,
    nombre TEXT,
    categoria TEXT,
    precio DECIMAL(10, 2),
    cantidad INTEGER,
    proveedor TEXT,
    fecha_ingreso DATE,
    ubicacion TEXT
)
''')


<sqlite3.Cursor at 0x7dd91a5c6740>

In [4]:
# Generar datos de ejemplo para la tabla
def generar_producto(id):
    nombres = ["Producto", "Artículo", "Objeto"]
    categorias = ["Electrónica", "Hogar", "Jardín", "Moda", "Deportes"]
    proveedores = ["Proveedor1", "Proveedor2", "Proveedor3"]
    ubicaciones = ["Almacén A", "Almacén B", "Almacén C"]

    nombre = random.choice(nombres) + str(id)
    categoria = random.choice(categorias)
    precio = round(random.uniform(10.0, 500.0), 2)
    cantidad = random.randint(1, 100)
    proveedor = random.choice(proveedores)
    fecha_ingreso = f"2023-{random.randint(1, 12):02d}-{random.randint(1, 28):02d}"
    ubicacion = random.choice(ubicaciones)

    return (id, nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)

# Insertar 1000 productos en la tabla
productos = [generar_producto(i + 1) for i in range(10000)]
c.executemany('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', productos)

# Guardar cambios y cerrar la conexión
conn.commit()
conn.close()

In [5]:
print("Base de datos creada y poblada con éxito.")

Base de datos creada y poblada con éxito.


## Consulta para mostrar todos los productos creados

In [6]:
import sqlite3

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Consultar todos los productos
c.execute('SELECT * FROM inventario')
productos = c.fetchall()

# Imprimir los productos
for producto in productos:
    print(producto)

# Cerrar la conexión
conn.close()


(1, 'Artículo1', 'Deportes', 26.41, 28, 'Proveedor2', '2023-02-25', 'Almacén C')
(2, 'Artículo2', 'Hogar', 94.86, 53, 'Proveedor2', '2023-12-24', 'Almacén B')
(3, 'Artículo3', 'Hogar', 451.54, 26, 'Proveedor2', '2023-11-25', 'Almacén C')
(4, 'Objeto4', 'Deportes', 47.28, 56, 'Proveedor3', '2023-10-28', 'Almacén B')
(5, 'Objeto5', 'Hogar', 231.11, 63, 'Proveedor3', '2023-02-13', 'Almacén C')
(6, 'Producto6', 'Electrónica', 83.6, 67, 'Proveedor1', '2023-03-07', 'Almacén B')
(7, 'Objeto7', 'Jardín', 123.14, 48, 'Proveedor3', '2023-05-11', 'Almacén A')
(8, 'Producto8', 'Deportes', 485.5, 70, 'Proveedor3', '2023-09-17', 'Almacén C')
(9, 'Artículo9', 'Hogar', 21.18, 71, 'Proveedor2', '2023-09-25', 'Almacén A')
(10, 'Artículo10', 'Hogar', 42.86, 31, 'Proveedor2', '2023-07-10', 'Almacén C')
(11, 'Producto11', 'Moda', 468.67, 2, 'Proveedor2', '2023-08-13', 'Almacén C')
(12, 'Objeto12', 'Deportes', 260.05, 27, 'Proveedor3', '2023-12-01', 'Almacén A')
(13, 'Producto13', 'Moda', 495.97, 1, 'Provee

## Realizar consulta y transferir a dataframe

In [7]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 450"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)

# Cerrar la conexión
conn.close()


        id        nombre    categoria  precio  cantidad   proveedor  \
0        3     Artículo3        Hogar  451.54        26  Proveedor2   
1        8     Producto8     Deportes  485.50        70  Proveedor3   
2       11    Producto11         Moda  468.67         2  Proveedor2   
3       13    Producto13         Moda  495.97         1  Proveedor3   
4       18      Objeto18        Hogar  484.41        31  Proveedor3   
...    ...           ...          ...     ...       ...         ...   
996   9956    Objeto9956  Electrónica  467.60        97  Proveedor1   
997   9963    Objeto9963        Hogar  491.83        82  Proveedor2   
998   9971    Objeto9971  Electrónica  462.41         5  Proveedor3   
999   9995  Producto9995       Jardín  463.44        18  Proveedor1   
1000  9997  Artículo9997         Moda  486.27        12  Proveedor2   

     fecha_ingreso  ubicacion  
0       2023-11-25  Almacén C  
1       2023-09-17  Almacén C  
2       2023-08-13  Almacén C  
3       2023-03-03 

In [8]:
df_productos.head()

Unnamed: 0,id,nombre,categoria,precio,cantidad,proveedor,fecha_ingreso,ubicacion
0,3,Artículo3,Hogar,451.54,26,Proveedor2,2023-11-25,Almacén C
1,8,Producto8,Deportes,485.5,70,Proveedor3,2023-09-17,Almacén C
2,11,Producto11,Moda,468.67,2,Proveedor2,2023-08-13,Almacén C
3,13,Producto13,Moda,495.97,1,Proveedor3,2023-03-03,Almacén A
4,18,Objeto18,Hogar,484.41,31,Proveedor3,2023-04-25,Almacén C


## Nueva consulta

In [9]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 450 AND cantidad > 25"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)


# Cerrar la conexión
conn.close()

       id      nombre    categoria  precio  cantidad   proveedor  \
0       3   Artículo3        Hogar  451.54        26  Proveedor2   
1       8   Producto8     Deportes  485.50        70  Proveedor3   
2      18    Objeto18        Hogar  484.41        31  Proveedor3   
3      34  Producto34         Moda  467.65        83  Proveedor3   
4      41    Objeto41         Moda  452.91        28  Proveedor3   
..    ...         ...          ...     ...       ...         ...   
721  9937  Objeto9937       Jardín  464.43        51  Proveedor3   
722  9944  Objeto9944  Electrónica  491.20        92  Proveedor2   
723  9946  Objeto9946  Electrónica  475.96        63  Proveedor3   
724  9956  Objeto9956  Electrónica  467.60        97  Proveedor1   
725  9963  Objeto9963        Hogar  491.83        82  Proveedor2   

    fecha_ingreso  ubicacion  
0      2023-11-25  Almacén C  
1      2023-09-17  Almacén C  
2      2023-04-25  Almacén C  
3      2023-12-10  Almacén C  
4      2023-09-10  Almacén C

## Insertar nuevo producto

In [10]:
# Datos del nuevo producto
nuevo_producto = (
    None,  # SQLite genera un nuevo id automáticamente si la columna es autoincrement
    'NuevoProducto123',
    'Electrónica',
    249.99,
    20,
    'ProveedorX',
    '2024-04-16',
    'Almacén D'
)

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de nuevo producto
c.execute('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', nuevo_producto)

# Guardar (commit) los cambios y cerrar conexión con la DB
conn.commit()
conn.close()

## Insertar nuevo producto desde Excel

### Crear tabla excel de nuevos productos


In [11]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

np.random.seed(0)
num_prods = 5000

# Productos nuevos
nombres = ['Producto' + str(i) for i in range(num_prods)]
categorias = np.random.choice(['Electrónica', 'Hogar', 'Jardín', 'Moda', 'Deportes'], num_prods)
precios = np.round(np.random.uniform(10.0, 500.0, num_prods), 2)
cantidades = np.random.randint(1, 100, num_prods)
proveedores = np.random.choice(['Proveedor1', 'Proveedor2', 'Proveedor3'], num_prods)
fechas = [datetime.today() - timedelta(days=np.random.randint(0, 365)) for _ in range(num_prods)]
ubicaciones = np.random.choice(['Almacén A', 'Almacén B', 'Almacén C'], num_prods)

# DataFrame
df = pd.DataFrame({
    'Nombre': nombres,
    'Categoría': categorias,
    'Precio': precios,
    'Cantidad': cantidades,
    'Proveedor': proveedores,
    'Fecha de Ingreso': pd.to_datetime(fechas),
    'Ubicación': ubicaciones
})

print(df.head())

# Guardar el DataFrame en un archivo Excel
df.to_excel('nuevos_productos_inventario.xlsx', index=False)

      Nombre    Categoría  Precio  Cantidad   Proveedor  \
0  Producto0     Deportes  489.97        77  Proveedor1   
1  Producto1  Electrónica  347.86        78  Proveedor3   
2  Producto2         Moda   10.40        93  Proveedor2   
3  Producto3         Moda  402.25        51  Proveedor3   
4  Producto4         Moda  445.18        50  Proveedor1   

            Fecha de Ingreso  Ubicación  
0 2025-06-20 03:09:13.310890  Almacén B  
1 2025-03-25 03:09:13.310931  Almacén C  
2 2024-12-31 03:09:13.310941  Almacén B  
3 2025-08-28 03:09:13.310949  Almacén A  
4 2024-12-14 03:09:13.310956  Almacén A  


### Agregar datos de tabla excel al inventario

In [12]:
import pandas as pd

# Leer archivo Excel
ruta_archivo = '/content/nuevos_productos_inventario.xlsx'
df = pd.read_excel(ruta_archivo)

# Verificación de formatos (tipo de dato)
# Precio a float
if df['Precio'].dtype != 'float':
    df['Precio'] = df['Precio'].astype(float)

# Fecha de Ingreso a datetime
if df['Fecha de Ingreso'].dtype != 'datetime64[ns]':
    df['Fecha de Ingreso'] = pd.to_datetime(df['Fecha de Ingreso'], errors='coerce')

# Verificar y corregir fechas no válidas, usando la fecha de hoy
df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)

df.head()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)


Unnamed: 0,Nombre,Categoría,Precio,Cantidad,Proveedor,Fecha de Ingreso,Ubicación
0,Producto0,Deportes,489.97,77,Proveedor1,2025-06-20 03:09:13.311,Almacén B
1,Producto1,Electrónica,347.86,78,Proveedor3,2025-03-25 03:09:13.311,Almacén C
2,Producto2,Moda,10.4,93,Proveedor2,2024-12-31 03:09:13.311,Almacén B
3,Producto3,Moda,402.25,51,Proveedor3,2025-08-28 03:09:13.311,Almacén A
4,Producto4,Moda,445.18,50,Proveedor1,2024-12-14 03:09:13.311,Almacén A


In [13]:
# @title
import sqlite3

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de datos en la DB
for index, row in df.iterrows():
    c.execute("""
        INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
        VALUES (?, ?, ?, ?, ?, ?, ?)
    """, (row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], row['Fecha de Ingreso'], row['Ubicación']))


# # Insersión de datos en la DB
# for index, row in df.iterrows():
#     c.executemany("""
#         INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
#         VALUES(?, ?, ?, ?, ?, ?,)""",
#         [row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], row['Fecha de Ingreso'], row['Ubicación']])

# Guardar cambios y cerrar conexión con DB
conn.commit()
conn.close()

print("¡Datos importados exitosamente!")


ProgrammingError: Error binding parameter 6: type 'Timestamp' is not supported

1. El argumento especifica el nombre del archivo de la base de datos, Si hay un archivo existente en el directorio, sqlite3 va a crear una conexión con el, si no, sqlite3 creará automaticamente una nueva base de datos con ese nombre.
2. el argumento conn.cursor() crea un objeto "cursor" desde la conexión de la base de datos (conn), la cual actua como un puntero para manejar y ejecutar comandos de SQL dentro de una sesion de base de datos, Este puntero nos permite navegar en los datos de forma mas organizada.
3. Definir la columna como "Integer Primary Key" cumple dos cosas importantes, la primera es que garantiza que cada fila de la tabla tenga un valor único en esa columna (osea no se repiten) y además SQLite asigna automáticamente un número consecutivo a cada registro insertado, sin la necesesidad de que por el ejemplo el programador lo diga.
4. La ventaja principal de usar "executemany()" es que el envía todas las inserciones en un solo bloque a la base de datos, esto es mucho más rapido y consume menos rcursos que usando un bucle con "execute".{
5. Si omitimos el "coon.commit()" los datos no se guardaran realmente en nuestra base de datos, solo quedaria en la memoria temporal.

In [15]:

conn = sqlite3.connect('productos.db')

#Consulta SQL: solo los productos del Proveedor1
query = """
SELECT nombre, categoria, precio
FROM inventario
WHERE proveedor = 'Proveedor1'
"""

# Mostrar los resultados como tabla
df_proveedor1.head(20)  # puedes cambiar el número si quieres ver más filas

# Cerrar conexión
conn.close()

print(df_proveedor1)



NameError: name 'df_proveedor1' is not defined

7. Las ventajas que ofrece "pd.read_sql_query()" seria que convierte automáticamente los resultados que tenemos en un DataFrame de pandas, con eso nos permite analizarlos y verlos más facil y organizados, ademas evitamos recorrer los resultados manualmente como lo hariamos con un bucle como "for".


In [14]:
query = "SELECT * FROM inventario WHERE precio > 480 OR cantidad < 5"


9. Usar los signos de interrogación es una buena práctica porque evita que los valores se concatenen directamente en SQL, además mejora la legibilidad y facilita la reutización del codigo.
10. Es fundamental porque garantiza que los datos tengan el tipo correcto en precios y fechas, si esto no se hace, puede generarse errores de tipo o inserciones incorrectas, lo que puede causar fallos en el futuro con la base de datos.
