# Ejercicio Análisis de Datos de Ventas con SQLite en Python

### **Objetivo:** 
Utilizar Python y SQLite para crear una base de datos, cargar datos y realizar consultas para analizar los datos de ventas de una empresa ficticia, todo dentro de un notebook de Python.

###  **Parte 1: Creación de la Base de Datos y Tablas**

**1. Conexión a SQLite**
- Utilizar la librería `sqlite3` para establecer una conexión con una base de datos llamada `ventas_tecnologia.db`. Si la base de datos no existe, se creará automáticamente.

**2. Creación de Tablas**
Se emplean comandos SQL dentro de un script en Python para definir la estructura de las siguientes tablas:

**a) Tabla `Productos`**
- Columnas:
  - `id_producto` (INT, clave primaria): Identificador único del producto.
  - `nombre_producto` (TEXT): Nombre del producto.
  - `precio` (REAL): Precio del producto.
  - `categoria` (TEXT): Categoría a la que pertenece el producto.

**b) Tabla `Clientes`**
- Columnas:
  - `id_cliente` (INT, clave primaria): Identificador único del cliente.
  - `nombre_cliente` (TEXT): Nombre del cliente.
  - `email` (TEXT): Dirección de correo electrónico del cliente.

**c) Tabla `Ventas`**
- Columnas:
  - `id_venta` (INT, clave primaria): Identificador único de la venta.
  - `fecha_venta` (DATE): Fecha en que se realizó la venta.
  - `id_cliente` (INT, clave foránea): Relación con la tabla `Clientes` (quién realizó la compra).
  - `id_producto` (INT, clave foránea): Relación con la tabla `Productos` (qué producto se compró).
  - `cantidad` (INT): Número de unidades vendidas del producto.


In [1]:
import sqlite3

# Crear conexión y cursor
conn = sqlite3.connect('ventas_tecnologia.db')
cursor = conn.cursor()

# Crear tablas
cursor.executescript('''
DROP TABLE IF EXISTS Productos;
DROP TABLE IF EXISTS Clientes;
DROP TABLE IF EXISTS Ventas;

CREATE TABLE Productos (
    id_producto INTEGER PRIMARY KEY,
    nombre_producto TEXT NOT NULL,
    precio REAL NOT NULL,
    categoria TEXT NOT NULL
);

CREATE TABLE Clientes (
    id_cliente INTEGER PRIMARY KEY,
    nombre_cliente TEXT NOT NULL,
    email TEXT NOT NULL
);

CREATE TABLE Ventas (
    id_venta INTEGER PRIMARY KEY,
    fecha_venta DATE NOT NULL,
    id_cliente INTEGER NOT NULL,
    id_producto INTEGER NOT NULL,
    cantidad INTEGER NOT NULL,
    FOREIGN KEY (id_cliente) REFERENCES Clientes(id_cliente),
    FOREIGN KEY (id_producto) REFERENCES Productos(id_producto)
);
''')

print("Tablas creadas exitosamente.")
conn.commit()


Tablas creadas exitosamente.


###  **Parte 2: Cargar Datos**
 
  
**1. Generar Datos Ficticios: Escribir un script en Python para generar datos ficticios para Productos, Clientes y Ventas. Usar por ejemplo módulos random y Faker.**


**2. Cargar los Datos: Usar sqlite3 para insertar los datos generados en las tablas correspondientes.**


In [3]:
!pip install Faker

Collecting Faker
  Downloading Faker-33.1.0-py3-none-any.whl.metadata (15 kB)
Downloading Faker-33.1.0-py3-none-any.whl (1.9 MB)
   ---------------------------------------- 0.0/1.9 MB ? eta -:--:--
   ---------------------------------------- 1.9/1.9 MB 17.3 MB/s eta 0:00:00
Installing collected packages: Faker
Successfully installed Faker-33.1.0


In [4]:
import random
from faker import Faker
from datetime import datetime, timedelta

fake = Faker()

# Generar datos para la tabla Productos
productos = [
    (1, "Laptop", 800.0, "Electrónica"),
    (2, "Smartphone", 600.0, "Electrónica"),
    (3, "Impresora", 150.0, "Oficina"),
    (4, "Monitor", 200.0, "Electrónica"),
    (5, "Teclado", 50.0, "Oficina"),
]
cursor.executemany("INSERT INTO Productos VALUES (?, ?, ?, ?)", productos)

# Generar datos para la tabla Clientes
clientes = [(i, fake.name(), fake.email()) for i in range(1, 21)]
cursor.executemany("INSERT INTO Clientes VALUES (?, ?, ?)", clientes)

# Generar datos para la tabla Ventas
ventas = []
for i in range(1, 101):
    id_venta = i
    fecha_venta = fake.date_between(start_date='-1y', end_date='today')
    id_cliente = random.randint(1, 20)
    id_producto = random.randint(1, 5)
    cantidad = random.randint(1, 10)
    ventas.append((id_venta, fecha_venta, id_cliente, id_producto, cantidad))

cursor.executemany("INSERT INTO Ventas VALUES (?, ?, ?, ?, ?)", ventas)

print("Datos cargados exitosamente.")
conn.commit()


Datos cargados exitosamente.


  cursor.executemany("INSERT INTO Ventas VALUES (?, ?, ?, ?, ?)", ventas)


### **Parte 3: Consultas y Análisis de Datos con SQL**  

**Realizar Consultas SQL: Usar Python para ejecutar consultas SQL y obtener datos de la base de datos. Las consultas deben incluir:**

**a) Lista de todas las ventas.**  
**b)Total de ventas por categoría de producto.**  
**c)Cinco clientes con mayor número de compras.**  
**d)Análisis de ventas mensuales a lo largo de un año.**  

In [5]:
# Consulta: Listar todas las ventas
cursor.execute('''
SELECT V.id_venta, V.fecha_venta, C.nombre_cliente, P.nombre_producto, V.cantidad
FROM Ventas V
JOIN Clientes C ON V.id_cliente = C.id_cliente
JOIN Productos P ON V.id_producto = P.id_producto
''')
ventas = cursor.fetchall()
for venta in ventas:
    print(venta)


(1, '2024-02-17', 'James Oliver', 'Impresora', 7)
(2, '2024-06-07', 'Denise Harris', 'Monitor', 8)
(3, '2024-03-06', 'Marie Turner', 'Smartphone', 3)
(4, '2024-01-10', 'Matthew Martinez', 'Monitor', 7)
(5, '2024-03-16', 'John Watson', 'Smartphone', 3)
(6, '2024-09-25', 'Angelica Ellis', 'Laptop', 4)
(7, '2024-11-20', 'Marie Turner', 'Laptop', 10)
(8, '2024-05-21', 'Rachel Mckee', 'Teclado', 4)
(9, '2024-10-27', 'Angelica Ellis', 'Impresora', 6)
(10, '2023-12-14', 'Bonnie Oconnell', 'Impresora', 6)
(11, '2024-02-20', 'Matthew Acosta', 'Laptop', 6)
(12, '2024-10-31', 'Isaac Rush', 'Smartphone', 2)
(13, '2024-02-23', 'Amy Stout', 'Monitor', 5)
(14, '2024-04-18', 'Angelica Ellis', 'Monitor', 10)
(15, '2024-01-21', 'Amy Stout', 'Teclado', 6)
(16, '2024-07-01', 'Rachel Mckee', 'Impresora', 5)
(17, '2024-11-06', 'Jonathan Jacobs Jr.', 'Smartphone', 4)
(18, '2024-04-25', 'Jonathan Jacobs Jr.', 'Smartphone', 2)
(19, '2024-10-03', 'Amy Stout', 'Smartphone', 1)
(20, '2024-08-24', 'Isaac Rush', 'T

In [6]:
# Consulta: Total de ventas por categoría
cursor.execute('''
SELECT P.categoria, SUM(V.cantidad * P.precio) AS total_ventas
FROM Ventas V
JOIN Productos P ON V.id_producto = P.id_producto
GROUP BY P.categoria
''')
categorias = cursor.fetchall()
for categoria in categorias:
    print(categoria)


('Electrónica', 187800.0)
('Oficina', 20400.0)


In [7]:
# Consulta: Top 5 clientes con mayor número de compras
cursor.execute('''
SELECT C.nombre_cliente, COUNT(V.id_venta) AS total_compras
FROM Ventas V
JOIN Clientes C ON V.id_cliente = C.id_cliente
GROUP BY V.id_cliente
ORDER BY total_compras DESC
LIMIT 5
''')
clientes_top = cursor.fetchall()
for cliente in clientes_top:
    print(cliente)


('Rachel Mckee', 8)
('Denise Harris', 7)
('Matthew Martinez', 7)
('Amy Stout', 7)
('Steven Cortez', 7)


In [8]:
# Consulta: Ventas mensuales
cursor.execute('''
SELECT strftime('%Y-%m', fecha_venta) AS mes, SUM(cantidad * P.precio) AS total_ventas
FROM Ventas V
JOIN Productos P ON V.id_producto = P.id_producto
GROUP BY mes
ORDER BY mes
''')
ventas_mensuales = cursor.fetchall()
for mes in ventas_mensuales:
    print(mes)


('2023-12', 11500.0)
('2024-01', 22300.0)
('2024-02', 11800.0)
('2024-03', 24050.0)
('2024-04', 15250.0)
('2024-05', 11800.0)
('2024-06', 19000.0)
('2024-07', 14200.0)
('2024-08', 8000.0)
('2024-09', 27000.0)
('2024-10', 17650.0)
('2024-11', 25650.0)


In [9]:
# Cierro la  BD
conn.close()