<a href="https://colab.research.google.com/github/LuisFontalvoM374/Trabajos-ElectivaCienciasDeDatos-GitHub/blob/main/db_SQLite_inventario1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Gestión Básica de Inventario con SQLite3

## Instalar librerías SQLite3

In [None]:
%%shell
sudo apt-get install sqlite3

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
sqlite3 is already the newest version (3.37.2-2ubuntu0.5).
0 upgraded, 0 newly installed, 0 to remove and 38 not upgraded.




## Crear la base de datos y una tabla de inventario

In [None]:
import sqlite3
import random

# Crear la base de datos con SQLite
conn = sqlite3.connect('productos.db')
c = conn.cursor()

In [None]:
# Nombre de la tabla a eliminar/crear
inventario = 'inventario'

# Eliminar la tabla si existe
c.execute(f"DROP TABLE IF EXISTS {inventario}")

# Crear una nueva tabla llamada 'inventario'
c.execute('''CREATE TABLE inventario (
    id INTEGER PRIMARY KEY,
    nombre TEXT,
    categoria TEXT,
    precio DECIMAL(10, 2),
    cantidad INTEGER,
    proveedor TEXT,
    fecha_ingreso DATE,
    ubicacion TEXT
)''')

<sqlite3.Cursor at 0x7f623ff95240>

In [None]:
# Generar datos de ejemplo para la tabla
def generar_producto(id):
    nombres = ["Producto", "Artículo", "Objeto"]
    categorias = ["Electrónica", "Hogar", "Jardín", "Moda", "Deportes"]
    proveedores = ["Proveedor1", "Proveedor2", "Proveedor3"]
    ubicaciones = ["Almacén A", "Almacén B", "Almacén C"]

    nombre = random.choice(nombres) + str(id)
    categoria = random.choice(categorias)
    precio = round(random.uniform(10.0, 500.0), 2)
    cantidad = random.randint(1, 100)
    proveedor = random.choice(proveedores)
    fecha_ingreso = f"2023-{random.randint(1, 12):02d}-{random.randint(1, 28):02d}"
    ubicacion = random.choice(ubicaciones)

    return (id, nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)

# Insertar 1000 productos en la tabla
productos = [generar_producto(i + 1) for i in range(10000)]
c.executemany('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', productos)

# Guardar cambios y cerrar la conexión
conn.commit()
conn.commit()

In [None]:
print("Base de datos creada y poblada con éxito.")

Base de datos creada y poblada con éxito.


## Consulta para mostrar todos los productos creados

In [None]:
import sqlite3

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Consultar todos los productos
c.execute('SELECT * FROM inventario')
productos = c.fetchall()

# Imprimir los productos
for producto in productos:
    print(producto)

# Cerrar la conexión
conn.close()


[1;30;43mSe han truncado las últimas 5000 líneas del flujo de salida.[0m
(5001, 'Objeto5001', 'Hogar', 312.15, 51, 'Proveedor2', '2023-08-11', 'Almacén A')
(5002, 'Artículo5002', 'Jardín', 438.24, 71, 'Proveedor1', '2023-08-14', 'Almacén A')
(5003, 'Artículo5003', 'Electrónica', 326.23, 79, 'Proveedor1', '2023-08-14', 'Almacén B')
(5004, 'Producto5004', 'Moda', 35.95, 20, 'Proveedor3', '2023-08-26', 'Almacén C')
(5005, 'Producto5005', 'Moda', 44.19, 66, 'Proveedor3', '2023-09-09', 'Almacén A')
(5006, 'Objeto5006', 'Jardín', 354.59, 5, 'Proveedor1', '2023-01-20', 'Almacén A')
(5007, 'Artículo5007', 'Moda', 290.31, 81, 'Proveedor2', '2023-03-08', 'Almacén B')
(5008, 'Artículo5008', 'Hogar', 247.8, 79, 'Proveedor2', '2023-11-06', 'Almacén C')
(5009, 'Artículo5009', 'Deportes', 51.26, 24, 'Proveedor2', '2023-07-22', 'Almacén B')
(5010, 'Producto5010', 'Electrónica', 72.52, 21, 'Proveedor1', '2023-05-15', 'Almacén B')
(5011, 'Artículo5011', 'Jardín', 464.33, 33, 'Proveedor3', '2023-02-26'

## Realizar consulta y transferir a dataframe

In [None]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 450"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)

# Cerrar la conexión
conn.close()


       id        nombre    categoria  precio  cantidad   proveedor  \
0       9       Objeto9        Hogar  478.27        52  Proveedor2   
1      53      Objeto53         Moda  471.42        18  Proveedor1   
2      59      Objeto59         Moda  484.96        75  Proveedor1   
3      64      Objeto64         Moda  454.55        41  Proveedor3   
4      77      Objeto77        Hogar  462.24        52  Proveedor2   
..    ...           ...          ...     ...       ...         ...   
972  9950  Producto9950         Moda  497.74        66  Proveedor1   
973  9962    Objeto9962        Hogar  488.91       100  Proveedor3   
974  9973  Artículo9973        Hogar  452.85        64  Proveedor2   
975  9993    Objeto9993  Electrónica  455.71        15  Proveedor1   
976  9996  Producto9996       Jardín  469.64        31  Proveedor2   

    fecha_ingreso  ubicacion  
0      2023-06-28  Almacén C  
1      2023-07-24  Almacén A  
2      2023-10-26  Almacén A  
3      2023-05-14  Almacén C  
4   

In [None]:
df_productos.head()

Unnamed: 0,id,nombre,categoria,precio,cantidad,proveedor,fecha_ingreso,ubicacion
0,9,Objeto9,Hogar,478.27,52,Proveedor2,2023-06-28,Almacén C
1,53,Objeto53,Moda,471.42,18,Proveedor1,2023-07-24,Almacén A
2,59,Objeto59,Moda,484.96,75,Proveedor1,2023-10-26,Almacén A
3,64,Objeto64,Moda,454.55,41,Proveedor3,2023-05-14,Almacén C
4,77,Objeto77,Hogar,462.24,52,Proveedor2,2023-12-06,Almacén B


## Nueva consulta

In [None]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 450 AND cantidad > 25"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)


# Cerrar la conexión
conn.close()

       id        nombre categoria  precio  cantidad   proveedor fecha_ingreso  \
0       9       Objeto9     Hogar  478.27        52  Proveedor2    2023-06-28   
1      59      Objeto59      Moda  484.96        75  Proveedor1    2023-10-26   
2      64      Objeto64      Moda  454.55        41  Proveedor3    2023-05-14   
3      77      Objeto77     Hogar  462.24        52  Proveedor2    2023-12-06   
4     107   Artículo107      Moda  453.15        27  Proveedor3    2023-02-15   
..    ...           ...       ...     ...       ...         ...           ...   
740  9927    Objeto9927  Deportes  480.96        99  Proveedor2    2023-07-10   
741  9950  Producto9950      Moda  497.74        66  Proveedor1    2023-02-02   
742  9962    Objeto9962     Hogar  488.91       100  Proveedor3    2023-09-08   
743  9973  Artículo9973     Hogar  452.85        64  Proveedor2    2023-04-17   
744  9996  Producto9996    Jardín  469.64        31  Proveedor2    2023-07-20   

     ubicacion  
0    Almac

## Insertar nuevo producto

In [None]:
# Datos del nuevo producto
nuevo_producto = (
    None,  # SQLite genera un nuevo id automáticamente si la columna es autoincrement
    'NuevoProducto123',
    'Electrónica',
    249.99,
    20,
    'ProveedorX',
    '2024-04-16',
    'Almacén D'
)

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de nuevo producto
c.execute('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', nuevo_producto)

# Guardar (commit) los cambios y cerrar conexión con la DB
conn.commit()
conn.close()

## Insertar nuevo producto desde Excel

### Crear tabla excel de nuevos productos


In [None]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

np.random.seed(0)
num_prods = 5000

# Productos nuevos
nombres = ['Producto' + str(i) for i in range(num_prods)]
categorias = np.random.choice(['Electrónica', 'Hogar', 'Jardín', 'Moda', 'Deportes'], num_prods)
precios = np.round(np.random.uniform(10.0, 500.0, num_prods), 2)
cantidades = np.random.randint(1, 100, num_prods)
proveedores = np.random.choice(['Proveedor1', 'Proveedor2', 'Proveedor3'], num_prods)
fechas = [datetime.today() - timedelta(days=np.random.randint(0, 365)) for _ in range(num_prods)]
ubicaciones = np.random.choice(['Almacén A', 'Almacén B', 'Almacén C'], num_prods)

# DataFrame
df = pd.DataFrame({
    'Nombre': nombres,
    'Categoría': categorias,
    'Precio': precios,
    'Cantidad': cantidades,
    'Proveedor': proveedores,
    'Fecha de Ingreso': pd.to_datetime(fechas),
    'Ubicación': ubicaciones
})

print(df.head())

# Guardar el DataFrame en un archivo Excel
df.to_excel('nuevos_productos_inventario.xlsx', index=False)

      Nombre    Categoría  Precio  Cantidad   Proveedor  \
0  Producto0     Deportes  489.97        77  Proveedor1   
1  Producto1  Electrónica  347.86        78  Proveedor3   
2  Producto2         Moda   10.40        93  Proveedor2   
3  Producto3         Moda  402.25        51  Proveedor3   
4  Producto4         Moda  445.18        50  Proveedor1   

            Fecha de Ingreso  Ubicación  
0 2025-06-01 20:43:46.653749  Almacén B  
1 2025-03-06 20:43:46.653789  Almacén C  
2 2024-12-12 20:43:46.653801  Almacén B  
3 2025-08-09 20:43:46.653811  Almacén A  
4 2024-11-25 20:43:46.653819  Almacén A  


### Agregar datos de tabla excel al inventario

In [None]:
import pandas as pd

# Leer archivo Excel
ruta_archivo = '/content/nuevos_productos_inventario.xlsx'
df = pd.read_excel(ruta_archivo)

# Verificación de formatos (tipo de dato)
# Precio a float
if df['Precio'].dtype != 'float':
    df['Precio'] = df['Precio'].astype(float)

# Fecha de Ingreso a datetime
if df['Fecha de Ingreso'].dtype != 'datetime64[ns]':
    df['Fecha de Ingreso'] = pd.to_datetime(df['Fecha de Ingreso'], errors='coerce')

# Verificar y corregir fechas no válidas, usando la fecha de hoy
df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)

df.head()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)


Unnamed: 0,Nombre,Categoría,Precio,Cantidad,Proveedor,Fecha de Ingreso,Ubicación
0,Producto0,Deportes,489.97,77,Proveedor1,2025-06-01 20:43:46.654,Almacén B
1,Producto1,Electrónica,347.86,78,Proveedor3,2025-03-06 20:43:46.654,Almacén C
2,Producto2,Moda,10.4,93,Proveedor2,2024-12-12 20:43:46.654,Almacén B
3,Producto3,Moda,402.25,51,Proveedor3,2025-08-09 20:43:46.654,Almacén A
4,Producto4,Moda,445.18,50,Proveedor1,2024-11-25 20:43:46.654,Almacén A


In [None]:
import sqlite3

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de datos en la DB
for index, row in df.iterrows():
    c.execute("""
        INSERT INTO inventario (id, nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
        VALUES (?, ?, ?, ?, ?, ?, ?, ?)""", (None, row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], row['Fecha de Ingreso'], row['Ubicación']))


# # Insersión de datos en la DB
# for index, row in df.iterrows():
#     c.executemany("""
#         INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
#         VALUES(?, ?, ?, ?, ?, ?,)""",
#         [row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], row['Fecha de Ingreso'], row['Ubicación']])

# Guardar cambios y cerrar conexión con DB
conn.commit()
conn.close()

print("¡Datos importados exitosamente!")


NameError: name 'df' is not defined