# Proyecto 2
## Ciencias de Datos en Python

- Diego Morales - 13001893
- Jerry Rivera - 24005123

In [1]:
import boto3
import pandas as pd
import numpy as np
import configparser
import psycopg2

## Inicialización

In [2]:
config = configparser.ConfigParser()
config.read('config.cfg')

aws_rds_conn = boto3.client('rds', aws_access_key_id=config.get('IAM', 'ACCESS_KEY'),
                           aws_secret_access_key=config.get('IAM', 'SECRET_KEY'),
                           region_name='us-east-1')

## Creación de instancia

In [3]:
try:
    response = aws_rds_conn.create_db_instance(
                            DBInstanceIdentifier=config.get('SAKILA', 'DB_INSTANCE_ID'),
                            DBName=config.get('SAKILA', 'DB_NAME'),
                            MasterUsername=config.get('SAKILA', 'DB_USERNAME'),
                            MasterUserPassword=config.get('SAKILA', 'DB_PASSWORD'),
                            Port=int(config.get('SAKILA', 'DB_PORT')),
                            DBInstanceClass='db.t3.micro',
                            Engine='postgres',
                            PubliclyAccessible=True,
                            AllocatedStorage=20,
                            VpcSecurityGroupIds=[config.get('VPC', 'SECURITY_GROUP')]
                            )
    print(response)
except aws_rds_conn.exceptions.DBInstanceAlreadyExistsFault:
    print('La instancia ya existe')
except Exception as ex:
    print('Error', ex)

{'DBInstance': {'DBInstanceIdentifier': 'sakila-db-pg', 'DBInstanceClass': 'db.t3.micro', 'Engine': 'postgres', 'DBInstanceStatus': 'creating', 'MasterUsername': 'admin_postgres', 'DBName': 'sakila', 'AllocatedStorage': 20, 'PreferredBackupWindow': '04:13-04:43', 'BackupRetentionPeriod': 1, 'DBSecurityGroups': [], 'VpcSecurityGroups': [{'VpcSecurityGroupId': 'sg-0b4d5bb09a6396352', 'Status': 'active'}], 'DBParameterGroups': [{'DBParameterGroupName': 'default.postgres16', 'ParameterApplyStatus': 'in-sync'}], 'DBSubnetGroup': {'DBSubnetGroupName': 'default', 'DBSubnetGroupDescription': 'default', 'VpcId': 'vpc-069af3dd3aa36b4d8', 'SubnetGroupStatus': 'Complete', 'Subnets': [{'SubnetIdentifier': 'subnet-02d2d39959fbcddb6', 'SubnetAvailabilityZone': {'Name': 'us-east-1b'}, 'SubnetOutpost': {}, 'SubnetStatus': 'Active'}, {'SubnetIdentifier': 'subnet-032422906c9f500fb', 'SubnetAvailabilityZone': {'Name': 'us-east-1f'}, 'SubnetOutpost': {}, 'SubnetStatus': 'Active'}, {'SubnetIdentifier': 'sub

## Obtención de instancia

In [5]:
try:
    instance = aws_rds_conn.describe_db_instances(DBInstanceIdentifier=config.get('SAKILA', 'DB_INSTANCE_ID'))
    RDS_HOSTNAME = instance.get('DBInstances')[0].get('Endpoint').get('Address')
    print(RDS_HOSTNAME)
except Exception as ex:
    print('Error', ex)

sakila-db-pg.clcwc6cec8sd.us-east-1.rds.amazonaws.com


## Conexión a base de datos

In [6]:
import ddl as query

try:
    db_pg_conn = psycopg2.connect(
                    database=config.get('SAKILA', 'DB_NAME'),
                    user=config.get('SAKILA', 'DB_USERNAME'),
                    password=config.get('SAKILA', 'DB_PASSWORD'),
                    port=config.get('SAKILA', 'DB_PORT'),
                    host=RDS_HOSTNAME
    )
    cursor = db_pg_conn.cursor()
    cursor.execute(query.DDL_QUERY)
    db_pg_conn.commit()
except Exception as ex:
    print('Error', ex)

## Inserción de datos

In [7]:
driver = f"""postgresql://{config.get('SAKILA', 'DB_USERNAME')}:{config.get('SAKILA', 'DB_PASSWORD')}@{RDS_HOSTNAME}:{config.get('SAKILA', 'DB_PORT')}/{config.get('SAKILA', 'DB_NAME')}"""
driver

'postgresql://admin_postgres:jublnuh1Kor3KEPO1rADldLmi@sakila-db-pg.clcwc6cec8sd.us-east-1.rds.amazonaws.com:5432/sakila'

In [8]:
def insertData2SQL(data_dict, table_name, driver):
    df_data = pd.DataFrame.from_records(data_dict)
    try:
        response = df_data.to_sql(table_name, driver, index=False, if_exists='append')
        print(f'Se han insertado {response} nuevos registros')
    except Exception as ex:
        print('Error', ex)

In [9]:
# rol
data_rol = [
    {'idrol' : 1, 'nombre' : 'Dueño', 'descripcion': 'Propietario de la tienda', 'estado': '1'},
    {'idrol' : 2, 'nombre' : 'Vendedor', 'descripcion': 'Encargado de las ventas', 'estado': '1'},
    {'idrol' : 3, 'nombre' : 'Asistente', 'descripcion': 'Apoyo para ventas', 'estado': '1'},
    {'idrol' : 4, 'nombre' : 'Mensajero', 'descripcion': 'Entrega de pedidos a domicilio', 'estado': '1'},
    {'idrol' : 5, 'nombre' : 'Contador', 'descripcion': 'Finanzas de la tienda', 'estado': '1'}
]

insertData2SQL(data_rol, 'rol', driver)

Se han insertado 5 nuevos registros


In [10]:
# categoria
data_categoria = [
    {'idcategoria' : 1, 'nombre' : 'Alimentos', 'descripcion': 'Pan, galletas, snacks y helados', 'estado': '1'},
    {'idcategoria' : 2, 'nombre' : 'Bebidas', 'descripcion': 'Agua, gaseosas, jugos y leche', 'estado': '1'},
    {'idcategoria' : 3, 'nombre' : 'Limpieza', 'descripcion': 'Jabón, detergente, cloro y bolsas', 'estado': '1'},
    {'idcategoria' : 4, 'nombre' : 'Miscelania', 'descripcion': 'Baterías, pegamento y medicamentos', 'estado': '1'},
]
insertData2SQL(data_categoria, 'categoria', driver)

Se han insertado 4 nuevos registros


In [12]:
# articulo
import random
import string

data_articulo = [
    {'idarticulo' : 1, 'idcategoria' : 1, 'codigo': 'torlim', 'nombre': 'Totrix limón',
     'precio_venta': 2.00, 'stock': random.randint(1, 20),
     'descripcion': 'unidad de 38 gramos', 'imagen': f'torlim.png.', 'estado': '1'},
    {'idarticulo' : 2, 'idcategoria' : 1, 'codigo': 'sandbutt', 'nombre': 'Pan Sándwich Butter',
     'precio_venta': 22.95, 'stock': random.randint(1, 20),
     'descripcion': 'bolsa de 690 gramos', 'imagen': f'sandbutt.png.', 'estado': '1'},
    {'idarticulo' : 3, 'idcategoria' : 1, 'codigo': 'gallchk', 'nombre': 'Galleta Chocolate Chiky Pack',
     'precio_venta': 19.30, 'stock': random.randint(1, 20),
     'descripcion': 'pack de 10 unidades, 40 gramos/unidad', 'imagen': f'gallchik.png.', 'estado': '1'},
     {'idarticulo' : 4, 'idcategoria' : 1, 'codigo': 'gallwaff', 'nombre': 'Galleta Waffle 12 pack',
     'precio_venta': 12.70, 'stock': random.randint(1, 20),
     'descripcion': 'pack de 256.5 gramos', 'imagen': f'gallwaff.png.', 'estado': '1'},
     {'idarticulo' : 5, 'idcategoria' : 2, 'codigo': 'cczero', 'nombre': 'Coca Cola sin azúcar',
     'precio_venta': 16.00, 'stock': random.randint(1, 20),
     'descripcion': 'envase de 2.5 litros’', 'imagen': f'cczero.png.', 'estado': '1'},
     {'idarticulo' : 6, 'idcategoria' : 2, 'codigo': 'jugnar', 'nombre': 'Jugo de Naranja',
     'precio_venta': 25.95, 'stock': random.randint(1, 20),
     'descripcion': 'envase de 1.8 litros’', 'imagen': f'jugnar.png.', 'estado': '1'},
     {'idarticulo' : 7, 'idcategoria' : 2, 'codigo': 'minsal', 'nombre': 'Agua Mineral Salutaris',
     'precio_venta': 9.90, 'stock': random.randint(1, 20),
     'descripcion': 'envase de 2 litros’', 'imagen': f'minsal.png.', 'estado': '1'},
     {'idarticulo' : 8, 'idcategoria' : 2, 'codigo': 'agusal', 'nombre': 'Agua Pura Salvavidas',
     'precio_venta': 10.50, 'stock': random.randint(1, 20),
     'descripcion': 'envase de 3.78 litros’', 'imagen': f'agusall.png.', 'estado': '1'},
     {'idarticulo' : 9, 'idcategoria' : 2, 'codigo': 'suehid', 'nombre': 'Suero Hidravida',
     'precio_venta': 16.15, 'stock': random.randint(1, 20),
     'descripcion': 'unidad de 625 ml’', 'imagen': f'suehid.png.', 'estado': '1'},
     {'idarticulo' : 10, 'idcategoria' : 3, 'codigo': 'jabaxn', 'nombre': 'Jabón para platos Axión',
     'precio_venta': 10.30, 'stock': random.randint(1, 20),
     'descripcion': 'unidad de 600 gramos', 'imagen': f'jabaxn.png.', 'estado': '1'},
     {'idarticulo' : 11, 'idcategoria' : 4, 'codigo': 'conben', 'nombre': 'Concentrado Perro Beneful',
     'precio_venta': 181.30, 'stock': random.randint(1, 20),
     'descripcion': 'bolsa de 4 kilogramos', 'imagen': f'conben.png.', 'estado': '1'}
]

insertData2SQL(data_articulo, 'articulo', driver)

Se han insertado 11 nuevos registros


In [13]:
# persona
from faker import Faker

data_persona = []
cant_personas = 20
tipo_personas = ['Cliente', 'Proveedor']

for i in range(cant_personas):
    fake = Faker()
    persona = {'idpersona' : i, 'tipo_persona' : random.choice(tipo_personas), 'nombre': fake.name(),
               'tipo_documento': 'DPI', 'num_documento' : str(random.randint(2e19, 3e19)),
               'direccion': fake.address()[:70], 'telefono': fake.phone_number()[:20],
               'email': f'{fake.user_name()}@gmail.com'}
    data_persona.append(persona)

insertData2SQL(data_persona, 'persona', driver)

Se han insertado 20 nuevos registros


In [14]:
# usuario
from faker import Faker

data_usuario = []
cant_usuarios = 5
roles = [1, 2, 3, 4, 5] 

for i in range(cant_usuarios):
    fake = Faker()
    rol = random.choice(roles)
    roles.remove(rol)
    usuario = {'idusuario' : i, 'idrol' : rol, 'nombre': fake.name(),
               'tipo_documento': 'DPI', 'num_documento' : str(random.randint(2e19, 3e19)),
               'direccion': fake.address()[:70], 'telefono': fake.phone_number()[:20],
               'email': f'{fake.user_name()}@gmail.com', 'clave': '1010101',
               'estado': '1'}
    data_usuario.append(usuario)

insertData2SQL(data_usuario, 'usuario', driver)

Se han insertado 5 nuevos registros


In [21]:
# venta, detalle_venta
from faker import Faker
from datetime import datetime

data_venta = []
data_detalle_venta = []
articulos = [1, 2, 3, 4, 5]

cant_venta = 5

for i in range(cant_venta):
    fake = Faker()
    while True:
        random_cliente = random.choice(data_persona)
        if random_cliente['tipo_persona']=='Cliente':
            break
    random_usuario = random.choice(data_usuario)
    
    cant_detalle_venta = random.randint(1, 3)
    total = 0
    for j in range(cant_detalle_venta):
        random_articulo = random.choice(data_articulo)
        detalle_venta = {'iddetalle_venta': i*10 + j,
                         'idventa' : i,
                         'idarticulo' : random_articulo['idarticulo'],
                         'cantidad': random.randint(1, 3),
                         'precio' : random_articulo['precio_venta'],
                         'descuento': 0.0}
        total += detalle_venta['cantidad']*detalle_venta['precio']
        data_detalle_venta.append(detalle_venta)
    venta = {'idventa': i,
             'idcliente' : random_cliente['idpersona'],
             'idusuario' : random_usuario['idusuario'],
             'tipo_comprobante' : 'Factura',
             'serie_comprobante' : str(random.randint(1e6, 9e6)),
             'num_comprobante' : str(random.randint(1e9, 9e9)),
             'fecha' : fake.date_between_dates(datetime(2024,1,1), datetime(2024,4,1)),
             'impuesto' : 0.12*total,
             'total' : total,
             'estado': '1'}
    data_venta.append(venta)

insertData2SQL(data_venta, 'venta', driver)
insertData2SQL(data_detalle_venta, 'detalle_venta', driver)

Se han insertado 5 nuevos registros
Se han insertado 10 nuevos registros


In [22]:
# ingreso, detalle_ingreso
from faker import Faker
from datetime import datetime

data_ingreso = []
data_detalle_ingreso = []
articulos = [1, 2, 3, 4, 5]

cant_ingreso = 3

for i in range(cant_ingreso):
    fake = Faker()
    while True:
        random_cliente = random.choice(data_persona)
        if random_cliente['tipo_persona']=='Proveedor':
            break
    random_usuario = random.choice(data_usuario)
    
    cant_detalle_ingreso = random.randint(1, 10)
    total = 0
    for j in range(cant_detalle_ingreso):
        random_articulo = random.choice(data_articulo)
        detalle_ingreso = {'iddetalle_ingreso': i*10 + j,
                         'idingreso' : i,
                         'idarticulo' : random_articulo['idarticulo'],
                         'cantidad': random.randint(1, 3),
                         'precio' : random_articulo['precio_venta']
                         }
        total += detalle_ingreso['cantidad']*detalle_ingreso['precio']
        data_detalle_ingreso.append(detalle_ingreso)
    ingreso = {'idingreso': i,
             'idproveedor' : random_cliente['idpersona'],
             'idusuario' : random_usuario['idusuario'],
             'tipo_comprobante' : 'Factura',
             'serie_comprobante' : str(random.randint(1e6, 9e6)),
             'num_comprobante' : str(random.randint(1e9, 9e9)),
             'fecha' : fake.date_between_dates(datetime(2024,1,1), datetime(2024,4,1)),
             'impuesto' : 0.12*total,
             'total' : total,
             'estado': '1'}
    data_ingreso.append(ingreso)

insertData2SQL(data_ingreso, 'ingreso', driver)
insertData2SQL(data_detalle_ingreso, 'detalle_ingreso', driver)

[{'idingreso': 0,
  'idproveedor': 2,
  'idusuario': 3,
  'tipo_comprobante': 'Factura',
  'serie_comprobante': '8278279',
  'num_comprobante': '4176342047',
  'fecha': datetime.date(2024, 1, 16),
  'impuesto': 5.508,
  'total': 45.9,
  'estado': '1'},
 {'idingreso': 1,
  'idproveedor': 14,
  'idusuario': 1,
  'tipo_comprobante': 'Factura',
  'serie_comprobante': '5122744',
  'num_comprobante': '5598888717',
  'fecha': datetime.date(2024, 3, 11),
  'impuesto': 15.636000000000001,
  'total': 130.3,
  'estado': '1'},
 {'idingreso': 2,
  'idproveedor': 0,
  'idusuario': 0,
  'tipo_comprobante': 'Factura',
  'serie_comprobante': '2355732',
  'num_comprobante': '2804086857',
  'fecha': datetime.date(2024, 2, 21),
  'impuesto': 66.654,
  'total': 555.45,
  'estado': '1'}]

## TODO
- agregar más artículos
- agregar lógica para solo seleccionar Clientes para Ventas y solo Proveedores para ingresos