##Instalacion de librerias

Se instala la libreria sqlite para poder trabajar con bases de datos

In [None]:
%%shell
sudo apt-get install sqlite3

##Crear la base de datos y una tabla de inventario

El siguiente codigo crea una base de datos llamada "productos.db" y un cursor "c" para facilitar la conexion y ejecucion de comandos sql.

In [None]:
import sqlite3
import random

# Crear la base de datos con SQlite
conn = sqlite3.connect('productos.db')
c = conn.cursor()

Se crea una tabla en la base de datos con 8 atributos

In [None]:
# Crear una tabla llamada 'inventario'
c.execute('''
CREATE TABLE inventario (
    id INTEGER PRIMARY KEY,
    nombre TEXT,
    categoria TEXT,
    precio DECIMAL(10, 2),
    cantidad INTEGER,
    proveedor TEXT,
    fecha_ingreso DATE,
    ubicacion TEXT
)
''')


<sqlite3.Cursor at 0x793dad61ce40>

Se crea una funcion para automatizar la creacion de datos para la tabla. Para que los datos no sean iguales se hace uso de random.

In [None]:
# Generar datos de ejemplo para la tabla
def generar_producto(id):
    nombres = ["Producto", "Artículo", "Objeto"]
    categorias = ["Electrónica", "Hogar", "Jardín", "Moda", "Deportes"]
    proveedores = ["Proveedor1", "Proveedor2", "Proveedor3"]
    ubicaciones = ["Almacén A", "Almacén B", "Almacén C"]

    nombre = random.choice(nombres) + str(id)
    categoria = random.choice(categorias)
    precio = round(random.uniform(10.0, 500.0), 2)
    cantidad = random.randint(1, 100)
    proveedor = random.choice(proveedores)
    fecha_ingreso = f"2023-{random.randint(1, 12):02d}-{random.randint(1, 28):02d}"
    ubicacion = random.choice(ubicaciones)

    return (id, nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)

# Insertar 1000 productos en la tabla
productos = [generar_producto(i + 1) for i in range(10000)]
c.executemany('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', productos)

# Guardar cambios y cerrar la conexión
conn.commit()
conn.close()

In [None]:
print("Base de datos creada y poblada con éxito.")

Base de datos creada y poblada con éxito.


##Consulta para mostrar todos los productos creados

In [None]:
import sqlite3

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Consultar todos los productos
c.execute('SELECT * FROM inventario')
productos = c.fetchall()

# Imprimir los productos
for producto in productos:
    print(producto)

# Cerrar la conexión
conn.close()


(1, 'Objeto1', 'Jardín', 420.37, 62, 'Proveedor1', '2023-09-17', 'Almacén C')
(2, 'Producto2', 'Moda', 348.83, 42, 'Proveedor3', '2023-02-21', 'Almacén C')
(3, 'Artículo3', 'Moda', 308.65, 76, 'Proveedor2', '2023-03-25', 'Almacén B')
(4, 'Objeto4', 'Hogar', 201.76, 91, 'Proveedor2', '2023-11-21', 'Almacén C')
(5, 'Objeto5', 'Hogar', 235.66, 85, 'Proveedor1', '2023-10-19', 'Almacén A')
(6, 'Objeto6', 'Electrónica', 304.85, 24, 'Proveedor3', '2023-03-23', 'Almacén C')
(7, 'Artículo7', 'Moda', 52.63, 27, 'Proveedor1', '2023-11-05', 'Almacén B')
(8, 'Objeto8', 'Electrónica', 421.48, 86, 'Proveedor2', '2023-12-01', 'Almacén C')
(9, 'Producto9', 'Electrónica', 70.5, 44, 'Proveedor1', '2023-04-26', 'Almacén A')
(10, 'Objeto10', 'Moda', 381.07, 80, 'Proveedor1', '2023-01-22', 'Almacén B')
(11, 'Objeto11', 'Jardín', 385.79, 32, 'Proveedor2', '2023-09-10', 'Almacén B')
(12, 'Producto12', 'Electrónica', 273.98, 12, 'Proveedor2', '2023-05-27', 'Almacén C')
(13, 'Artículo13', 'Moda', 339.6, 17, 'Pr

##Realizar consulta y transferir a dataframe

A diferencia del anterior codigo, este se muestra de manera mas ordenada.

In [None]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 450"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)

# Cerrar la conexión
conn.close()

        id        nombre    categoria  precio  cantidad   proveedor  \
0       16    Artículo16       Jardín  462.53         6  Proveedor2   
1       23      Objeto23  Electrónica  489.34        73  Proveedor3   
2       31      Objeto31     Deportes  498.32        60  Proveedor3   
3       51    Producto51       Jardín  495.95        73  Proveedor1   
4       57    Producto57     Deportes  490.78        58  Proveedor3   
...    ...           ...          ...     ...       ...         ...   
1046  9933  Producto9933  Electrónica  452.54        84  Proveedor3   
1047  9969  Artículo9969     Deportes  462.55         7  Proveedor3   
1048  9975    Objeto9975     Deportes  495.50        41  Proveedor1   
1049  9980  Artículo9980        Hogar  474.88         9  Proveedor1   
1050  9987    Objeto9987       Jardín  451.15        95  Proveedor1   

     fecha_ingreso  ubicacion  
0       2023-11-23  Almacén A  
1       2023-11-26  Almacén A  
2       2023-07-12  Almacén C  
3       2023-04-17 

In [None]:
df_productos.head()

Unnamed: 0,id,nombre,categoria,precio,cantidad,proveedor,fecha_ingreso,ubicacion
0,16,Artículo16,Jardín,462.53,6,Proveedor2,2023-11-23,Almacén A
1,23,Objeto23,Electrónica,489.34,73,Proveedor3,2023-11-26,Almacén A
2,31,Objeto31,Deportes,498.32,60,Proveedor3,2023-07-12,Almacén C
3,51,Producto51,Jardín,495.95,73,Proveedor1,2023-04-17,Almacén A
4,57,Producto57,Deportes,490.78,58,Proveedor3,2023-12-24,Almacén C


In [None]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Realizar la consulta y cargar los resultados en un DataFrame
query = "SELECT * FROM inventario WHERE precio > 480 OR cantidad > 5"
df_productos = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print(df_productos)


# Cerrar la conexión
conn.close()

         id        nombre    categoria  precio  cantidad   proveedor  \
0         1       Objeto1       Jardín  420.37        62  Proveedor1   
1         2     Producto2         Moda  348.83        42  Proveedor3   
2         3     Artículo3         Moda  308.65        76  Proveedor2   
3         4       Objeto4        Hogar  201.76        91  Proveedor2   
4         5       Objeto5        Hogar  235.66        85  Proveedor1   
...     ...           ...          ...     ...       ...         ...   
9505   9995  Artículo9995  Electrónica  231.88        81  Proveedor1   
9506   9996    Objeto9996        Hogar  331.03        16  Proveedor2   
9507   9998  Producto9998         Moda  324.91        75  Proveedor1   
9508   9999  Artículo9999     Deportes  167.85        18  Proveedor1   
9509  10000   Objeto10000     Deportes   14.89        12  Proveedor1   

     fecha_ingreso  ubicacion  
0       2023-09-17  Almacén C  
1       2023-02-21  Almacén C  
2       2023-03-25  Almacén B  
3      

In [None]:
# Datos del nuevo producto
nuevo_producto = (
    None,  # SQLite genera un nuevo id automáticamente si la columna es autoincrement
    'NuevoProducto123',
    'Electrónica',
    249.99,
    20,
    'ProveedorX',
    '2024-04-16',
    'Almacén D'
)

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de nuevo producto
c.execute('INSERT INTO inventario VALUES (?, ?, ?, ?, ?, ?, ?, ?)', nuevo_producto)

# Guardar (commit) los cambios y cerrar conexión con la DB
conn.commit()
conn.close()

In [None]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

np.random.seed(0)
num_prods = 5000

# Productos nuevos
nombres = ['Producto' + str(i) for i in range(num_prods)]
categorias = np.random.choice(['Electrónica', 'Hogar', 'Jardín', 'Moda', 'Deportes'], num_prods)
precios = np.round(np.random.uniform(10.0, 500.0, num_prods), 2)
cantidades = np.random.randint(1, 100, num_prods)
proveedores = np.random.choice(['Proveedor1', 'Proveedor2', 'Proveedor3'], num_prods)
fechas = [datetime.today() - timedelta(days=np.random.randint(0, 365)) for _ in range(num_prods)]
ubicaciones = np.random.choice(['Almacén A', 'Almacén B', 'Almacén C'], num_prods)

# DataFrame
df = pd.DataFrame({
    'Nombre': nombres,
    'Categoría': categorias,
    'Precio': precios,
    'Cantidad': cantidades,
    'Proveedor': proveedores,
    'Fecha de Ingreso': pd.to_datetime(fechas),
    'Ubicación': ubicaciones
})

print(df.head())

# Guardar el DataFrame en un archivo Excel
df.to_excel('nuevos_productos_inventario.xlsx', index=False)

      Nombre    Categoría  Precio  Cantidad   Proveedor  \
0  Producto0     Deportes  489.97        77  Proveedor1   
1  Producto1  Electrónica  347.86        78  Proveedor3   
2  Producto2         Moda   10.40        93  Proveedor2   
3  Producto3         Moda  402.25        51  Proveedor3   
4  Producto4         Moda  445.18        50  Proveedor1   

            Fecha de Ingreso  Ubicación  
0 2025-06-06 15:56:53.009228  Almacén B  
1 2025-03-11 15:56:53.009279  Almacén C  
2 2024-12-17 15:56:53.009295  Almacén B  
3 2025-08-14 15:56:53.009307  Almacén A  
4 2024-11-30 15:56:53.009317  Almacén A  


In [None]:
import pandas as pd

# Leer archivo Excel
ruta_archivo = '/content/nuevos_productos_inventario.xlsx'
df = pd.read_excel(ruta_archivo)

# Verificación de formatos (tipo de dato)
# Precio a float
if df['Precio'].dtype != 'float':
    df['Precio'] = df['Precio'].astype(float)

# Fecha de Ingreso a datetime
if df['Fecha de Ingreso'].dtype != 'datetime64[ns]':
    df['Fecha de Ingreso'] = pd.to_datetime(df['Fecha de Ingreso'], errors='coerce')

# Verificar y corregir fechas no válidas, usando la fecha de hoy
df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)

df.head()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['Fecha de Ingreso'].fillna(pd.Timestamp.today(), inplace=True)


Unnamed: 0,Nombre,Categoría,Precio,Cantidad,Proveedor,Fecha de Ingreso,Ubicación
0,Producto0,Deportes,489.97,77,Proveedor1,2025-06-06 15:56:53.009,Almacén B
1,Producto1,Electrónica,347.86,78,Proveedor3,2025-03-11 15:56:53.009,Almacén C
2,Producto2,Moda,10.4,93,Proveedor2,2024-12-17 15:56:53.009,Almacén B
3,Producto3,Moda,402.25,51,Proveedor3,2025-08-14 15:56:53.009,Almacén A
4,Producto4,Moda,445.18,50,Proveedor1,2024-11-30 15:56:53.009,Almacén A


In [None]:
import sqlite3

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Insersión de datos en la DB
for index, row in df.iterrows():
    fecha_ingreso_str = row['Fecha de Ingreso'].strftime('%Y-%m-%d')
    c.execute("""
         INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
         VALUES(?, ?, ?, ?, ?, ?, ?)""",(row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], fecha_ingreso_str, row['Ubicación']))

# # Insersión de datos en la DB
# for index, row in df.iterrows():
#     c.executemany("""
#         INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
#         VALUES(?, ?, ?, ?, ?, ?,)""",
#         [row['Nombre'], row['Categoría'], row['Precio'], row['Cantidad'], row['Proveedor'], row['Fecha de Ingreso'], row['Ubicación']])

# Guardar cambios y cerrar conexión con DB
conn.commit()
conn.close()

print("¡Datos importados exitosamente!")

¡Datos importados exitosamente!


In [None]:
import sqlite3

# Conexión con la DB
conn = sqlite3.connect('productos.db')
c = conn.cursor()

# Dupla con los datos
datos_ingreso = []
for index, row in df.iterrows():
    # Convierte Timestamp a string en formato 'YYYY-MM-DD'
    fecha_ingreso_str = row['Fecha de Ingreso'].strftime('%Y-%m-%d')
    datos_ingreso.append((
        row['Nombre'],
        row['Categoría'],
        row['Precio'],
        row['Cantidad'],
        row['Proveedor'],
        fecha_ingreso_str,
        row['Ubicación']
    ))

# Insersión de datos
c.executemany("""
    INSERT INTO inventario (nombre, categoria, precio, cantidad, proveedor, fecha_ingreso, ubicacion)
    VALUES (?, ?, ?, ?, ?, ?, ?)""", datos_ingreso)

# Guardar cambios y cerrar conexión con DB
conn.commit()
conn.close()

print("¡Datos importados exitosamente!")

¡Datos importados exitosamente!


In [None]:
import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('productos.db')

# Consulta SQL para calcular el valor total por categoría y ordenar
query = """
SELECT
    categoria,
    SUM(precio * cantidad) AS valor_total
FROM
    inventario
GROUP BY
    categoria
ORDER BY
    valor_total DESC;
"""

# Ejecutar la consulta y cargar los resultados en un DataFrame
df_valor_por_categoria = pd.read_sql_query(query, conn)

# Mostrar el DataFrame
print("Valor total del inventario por categoría:")
print(df_valor_por_categoria)

# Cerrar la conexión
conn.close()

Valor total del inventario por categoría:
     categoria  valor_total
0     Deportes  52186385.92
1         Moda  51976592.82
2        Hogar  51631739.15
3  Electrónica  51441153.72
4       Jardín  51024334.63
