In [1]:
import boto3
import pandas as pd
import numpy as np
import psycopg2
import configparser

## LEEMOS ARCHIVOS 

In [2]:
config = configparser.ConfigParser()
config.read('config.cfg')

['config.cfg']

In [3]:
config.get('IAM','ACCES_KEY')

'AKIATCKAOU3HWISGUXTG'

## Nos identificamos con AWS

In [4]:
aws_rds_conn = boto3.client('rds', aws_access_key_id=config.get('IAM','ACCES_KEY'),
                            aws_secret_access_key=config.get('IAM','SECRETE_ACCES_KEY'),
                            region_name='us-east-1')


## Verificamos instancias de AWS disponibles en el usuario 

In [5]:
rds_instances_ids =[]
aws_response= aws_rds_conn.describe_db_instances()

for response in aws_response ['DBInstances']:
    rds_instances_ids.append(response['DBInstanceIdentifier'])
print(f" Instancias Disponilbes:{rds_instances_ids}")

 Instancias Disponilbes:[]


In [6]:
config.get('TRANSACC','DB_INSTANCE_ID')

'venta-transactional'

In [7]:
config.get('TRANSACC','DB_USER')

'postgres_admin'

In [8]:
try:
    response = aws_rds_conn.create_db_instance(
        DBInstanceIdentifier=config.get('TRANSACC', 'DB_INSTANCE_ID'),
        DBName=config.get('TRANSACC', 'DB_NAME'),
        DBInstanceClass='db.t3.micro',
        Engine='postgres',
        MasterUsername=config.get('TRANSACC', 'DB_USER'),
        MasterUserPassword=config.get('TRANSACC', 'DB_PASSWORD'),
        Port=int(config.get('TRANSACC', 'DB_PORT')),
        PubliclyAccessible=True,
        VpcSecurityGroupIds=[config.get('VPC', 'SECURITY_GROUP')],
        AllocatedStorage=15
    )
    print(response)
except aws_rds_conn.exceptions.DBInstanceAlreadyExistsFault as ex:
    print("La instancia ya existe")
except Exception as ex:
    print("Error!!!", ex)


{'DBInstance': {'DBInstanceIdentifier': 'venta-transactional', 'DBInstanceClass': 'db.t3.micro', 'Engine': 'postgres', 'DBInstanceStatus': 'creating', 'MasterUsername': 'postgres_admin', 'DBName': 'venta', 'AllocatedStorage': 15, 'PreferredBackupWindow': '09:19-09:49', 'BackupRetentionPeriod': 1, 'DBSecurityGroups': [], 'VpcSecurityGroups': [{'VpcSecurityGroupId': 'sg-0a97d74a59af1d931', 'Status': 'active'}], 'DBParameterGroups': [{'DBParameterGroupName': 'default.postgres16', 'ParameterApplyStatus': 'in-sync'}], 'DBSubnetGroup': {'DBSubnetGroupName': 'default', 'DBSubnetGroupDescription': 'default', 'VpcId': 'vpc-0dd175419325379b9', 'SubnetGroupStatus': 'Complete', 'Subnets': [{'SubnetIdentifier': 'subnet-032f27e8a91f8335e', 'SubnetAvailabilityZone': {'Name': 'us-east-1e'}, 'SubnetOutpost': {}, 'SubnetStatus': 'Active'}, {'SubnetIdentifier': 'subnet-01d571f20d4210b92', 'SubnetAvailabilityZone': {'Name': 'us-east-1c'}, 'SubnetOutpost': {}, 'SubnetStatus': 'Active'}, {'SubnetIdentifier'

## Obtenemos el hostname de la instancias

In [10]:
try:
    instance = aws_rds_conn.describe_db_instances(DBInstanceIdentifier=config.get('TRANSACC', 'DB_INSTANCE_ID'))
    RDS_HOSTNAME = instance.get('DBInstances')[0].get('Endpoint').get('Address')
    print(RDS_HOSTNAME)
except Exception as ex:
    print("Error!!!", ex)


venta-transactional.c1i8ws84e2em.us-east-1.rds.amazonaws.com


## Nos conectamos a la base de datos desde Python

In [11]:
import sql_queries
sql_queries.DDL_QUERY

'\n-- create database venta;\n-- Creación de la tabla categoria\nCREATE TABLE categoria (\n    idcategoria serial PRIMARY KEY,\n    nombre VARCHAR(50) NOT NULL,\n    descripcion VARCHAR(255),\n    estado BOOLEAN\n);\n\n-- Creación de la tabla articulo\nCREATE TABLE articulo (\n    idarticulo serial PRIMARY KEY,\n    idcategoria INTEGER REFERENCES categoria(idcategoria),\n    codigo VARCHAR(50) NOT NULL,\n    nombre VARCHAR(100) NOT NULL,\n    precio_venta DECIMAL(11,2),\n    stock INTEGER,\n    descripcion VARCHAR(255),\n    imagen VARCHAR(20),\n    estado BOOLEAN\n);\n\n-- Creación de la tabla persona\nCREATE TABLE persona (\n    idpersona serial PRIMARY KEY,\n    tipo_persona VARCHAR(20) NOT NULL,\n    nombre VARCHAR(100) NOT NULL,\n    tipo_documento VARCHAR(20),\n    num_documento VARCHAR(20),\n    direccion VARCHAR(70),\n    telefono VARCHAR(20),\n    email VARCHAR(50)\n);\n-- Creación de la tabla rol\nCREATE TABLE rol (\n    idrol serial PRIMARY KEY,\n    nombre VARCHAR(30) NOT N

In [270]:
try:
    db_pg_conn = psycopg2.connect(
        database=config.get('TRANSACC', 'DB_NAME'),
        user=config.get('TRANSACC', 'DB_USER'),
        password=config.get('TRANSACC', 'DB_PASSWORD'),
        host=RDS_HOSTNAME,
        port=config.get('TRANSACC', 'DB_PORT')
    )

    cursor = db_pg_conn.cursor()
    cursor.execute(sql_queries.DDL_QUERY)
    db_pg_conn.commit()
    print("Base de Datos Creada Exitosamente")
except Exception as ex:
    print("Error!!!", ex)


Base de Datos Creada Exitosamente


## Insertamos datos en la BD

In [271]:
def insertData2SQL(data_dict,table_name, driver):
    df_data = pd.DataFrame.from_records(data_dict)
    try:
        response = df_data.to_sql(table_name, driver, index=False, if_exists='append')
        print(f"Se han insertado {response} nuevos registros")
    except Exception as ex:
        print(ex)

def insertData2SQLFromCsv(path,table_name, driver):
    df_data = pd.read_csv(path)
    try:
        response = df_data.to_sql(table_name, driver, index=False, if_exists='append')
        print(f"Se han insertado {response} nuevos registros")
    except Exception as ex:
        print(ex)

In [272]:
driver = f"""postgresql://{config.get('TRANSACC', 'DB_USER')}:{config.get('TRANSACC', 'DB_PASSWORD')}@{RDS_HOSTNAME}:{config.get('TRANSACC', 'DB_PORT')}/{config.get('TRANSACC', 'DB_NAME')}"""  
driver

'postgresql://postgres_admin:W8GB7F4Tks63-gjl@venta-transactional.c1i8ws84e2em.us-east-1.rds.amazonaws.com:5432/venta'

## Categorias


In [273]:
insertData2SQLFromCsv('./data/categoria.csv', 'categoria', driver)


Se han insertado 10 nuevos registros


## Articulos

In [274]:
insertData2SQLFromCsv('./data/articulos.csv', 'articulo', driver)

Se han insertado 400 nuevos registros


## Rol

In [275]:
insertData2SQLFromCsv('./data/roles.csv', 'rol', driver)

Se han insertado 5 nuevos registros


## Usuario

In [276]:
insertData2SQLFromCsv('./data/usuarios.csv', 'usuario', driver)

Se han insertado 50 nuevos registros


## Persona

In [277]:
insertData2SQLFromCsv('./data/personas.csv', 'persona', driver)

Se han insertado 50 nuevos registros


## Ingreso

In [278]:
insertData2SQLFromCsv('./data/ingreso.csv', 'ingreso', driver)

Se han insertado 100 nuevos registros


## Detalle Ingreso

In [279]:
insertData2SQLFromCsv('./data/detalle_ingreso.csv', 'detalle_ingreso', driver)


Se han insertado 200 nuevos registros


## Ventas y Detalle Ventas

In [280]:
import uuid
from datetime import datetime

def generar_detalles(id_venta,articulos_df):
    detalles = []
    
    for i in range(0,np.random.randint(1,15)):
        
        articulo = articulos_df.sample(n=1)
        descuento = 0 
        detalle = {
            "iddetalle_venta" : 500 * id_venta + i,
            "idventa":id_venta,
            "idarticulo":articulo.iloc[0,0],
            "cantidad": np.random.randint(1,6),
            "precio": articulo.iloc[0,4],
            "descuento":descuento
        }
        
        detalles.append(detalle)
        
    return detalles

def generar_venta(articulos_df,persona_df,usuario_df,index):
    tipo_comprobantes = ["factura","factura digital"]
    estado = "completada"
    estado_rand = np.random.randint(0, 100)
    if(estado_rand > 90):
        estado = "cancelada"


    tipo_comprobante = tipo_comprobantes[np.random.randint(0, 2)]
    serie_comprobante = str(uuid.uuid4())[0:7]
    num_comprobante = str(uuid.uuid4().int)[0:10]
    fecha = datetime(np.random.randint(2000, 2024),np.random.randint(1, 12),np.random.randint(1, 27))
    persona = persona_df.sample(n=1)
    usuario = usuario_df.sample(n=1)


    detalle_ventas = generar_detalles(index,articulos_df)
    total = 0
    for detalle in detalle_ventas:
        subtotal = detalle["cantidad"] * detalle["precio"]
        total = total + subtotal

    venta = {
        "idventa":index,
        "idcliente":persona.iloc[0,0],
        "idusuario":usuario.iloc[0,0],
        "tipo_comprobante": tipo_comprobante,
        "serie_comprobante": serie_comprobante,
        "num_comprobante": num_comprobante,
        "fecha":fecha,
        "impuesto":12.0,
        "total":total,
        "estado": estado
    }
    
    return {"venta":venta,"detalle":detalle_ventas}

In [281]:


np.random.seed(5234) 

articulos_df = pd.read_csv("./data/articulos.csv")
persona_df = pd.read_csv("./data/personas.csv")
usuario_df = pd.read_csv("./data/usuarios.csv")
index = 1

ventas = []
detalles = []


for i in range(1,500):
    venta_generada = generar_venta(articulos_df,persona_df,usuario_df,index)
    venta = venta_generada["venta"]
    ventas.append(venta)
    
    detalles_gen = venta_generada["detalle"]

    for detalles_gen in detalles_gen:
        detalles.append(detalles_gen)

    index = index + 1

insertData2SQL(ventas,"venta",driver)
insertData2SQL(detalles,"detalle_venta",driver)



Se han insertado 499 nuevos registros
Se han insertado 827 nuevos registros
