Angel Josué Mazariegos Guzmán 19000522 - Ciencia de datos en Python - Sección V

---

# Proyecto final

### Creacion de instancia de db, sistema transaccional e insercion de datos

In [58]:
import pandas as pd
import numpy as np
import boto3
import psycopg2
import configparser
from faker import Faker
import random
from datetime import datetime
import secrets

In [4]:
config = configparser.ConfigParser()
config.read('config1.cfg')

['config1.cfg']

In [5]:
aws_rds_conn = boto3.client('rds', aws_access_key_id=config.get('IAM','ACCESS_KEY'), 
                           aws_secret_access_key=config.get('IAM', 'SECRET_KEY'),
                           region_name='us-east-1')

In [6]:
rds_instances_ids = []
aws_response = aws_rds_conn.describe_db_instances()

for response in aws_response['DBInstances']:
    rds_instances_ids.append(response['DBInstanceIdentifier'])
    
print(f"Instancias disponibles: {rds_instances_ids}")

Instancias disponibles: ['proyect-venta-db', 'sakila-db-pg-v']


In [None]:
try:
    response = aws_rds_conn.create_db_instance(DBInstanceIdentifier=config.get('VENTAS','DB_INSTANCE_ID'),
                                               DBName=config.get('VENTAS', 'DB_NAME'),
                                               MasterUsername=config.get('VENTAS','DB_USERNAME'),
                                               MasterUserPassword=config.get('VENTAS','DB_PASSWORD'),
                                               Port=int(config.get('VENTAS','DB_PORT')),
                                               DBInstanceClass='db.t3.micro',
                                               Engine = 'postgres',
                                               PubliclyAccessible = True,
                                               AllocatedStorage=20,
                                               VpcSecurityGroupIds=[config.get('VPC', 'SECURITY_GROUP')]
                                              )
    print(response)
except aws_rds_conn.exceptions.DBInstanceAlreadyExistsFault:
    print('La Instancia ya existe')
except Exception as ex:
    print('Error!!!',ex)

In [7]:
try:
    instance = aws_rds_conn.describe_db_instances(DBInstanceIdentifier=config.get('VENTAS','DB_INSTANCE_ID'))
    RDS_HOSTNAME = instance.get('DBInstances')[0].get('Endpoint').get('Address')
    print(RDS_HOSTNAME)
except Exception as ex:
    print("Error!!!",ex)

proyect-venta-db.c5a4euw2wd87.us-east-1.rds.amazonaws.com


---

### Conexion con la base de datos

In [78]:
import sql_transac8

In [79]:
try:
    db_pg_conn = psycopg2.connect(database=config.get('VENTAS','DB_NAME'),
                                  user=config.get('VENTAS','DB_USERNAME'),
                                  password=config.get('VENTAS','DB_PASSWORD'),
                                  port=config.get('VENTAS','DB_PORT'),
                                  host=RDS_HOSTNAME)
    cursor = db_pg_conn.cursor()
    cursor.execute(sql_transac8.DDL_QUERY)
    db_pg_conn.commit()
except Exception as ex:
    print("Error!!!",ex)

Funcion para insertar datos a las tablas:

---

### Creacion de data utilizando faker

In [43]:
faker = Faker()

---

**Rol**

In [86]:
def generar_rol(num_roles):
    roles = []
    for i in range(num_roles):
        estado_bit = str(faker.random_element(elements=(0, 1)))
        rol = {
            'idrol': i + 1,  # Asumimos que los IDs de rol comienzan desde 1
            'nombre': faker.job(),
            'descripcion': faker.sentence(),
            'estado': estado_bit
        }
        roles.append(rol)
    return roles

data_rol = generar_rol(5)

---

**Usuario**

In [94]:
def generar_usuarios(num_usuarios, rol):
    usuarios = []
    for i in range(num_usuarios):
        estado_bit = str(faker.random_element(elements=(0, 1)))
        usuario = {
            'idusuario': i + 1,  # Asumimos que los IDs de usuario comienzan desde 1
            'idrol': random.choice(rol),
            'nombre': faker.name(),
            'tipo_documento': faker.random_element(elements=('DPI', 'Carnet_extranjería', 'Pasaporte')),
            'num_documento': str(faker.unique.random_number(digits=5)),
            'direccion': faker.address(),
            'telefono': faker.phone_number(),
            'email': faker.email(),
            'clave': secrets.token_hex(1),
            'estado': estado_bit
        }
        usuarios.append(usuario)
    return usuarios

idroles_= [rol['idrol'] for rol in data_rol]
data_usuario = generar_usuarios(50, idroles_)

---

**Persona**

In [103]:
def generar_personas(num_personas):
    personas = []
    for _ in range(num_personas):
        telefono = faker.phone_number()
        #direccion = faker.address()
        # Truncar el número de teléfono si tiene más de 15 caracteres
        telefono_truncado = telefono[:19]
        #dir_truncado = direccion[:65]
        persona = {
            'idpersona': faker.random_number(digits=5),
            'tipo_persona': 'Cliente' if faker.random_number(digits=1) == 0 else 'Proveedor',
            'nombre': faker.name(),
            'tipo_documento': faker.random_element(elements=('DNI', 'Carnet_extranjería', 'Pasaporte')),
            'num_documento': faker.unique.random_number(digits=8),
            'direccion': faker.address(),
            'telefono': telefono_truncado,
            'email': faker.email()
        }
        personas.append(persona)
    return personas

data_persona= generar_personas(100)

---

**Venta**

In [106]:
def generar_ventas(num_ventas, cliente, usuario):
    ventas = []
    for _ in range(num_ventas):
        venta = {
            'idventa': faker.random_number(digits=5),
            'idcliente': random.choice(cliente),
            'idusuario': random.choice(usuario),
            'tipo_comprobante': random.choice(['Factura', 'Boleta']),
            'serie_comprobante': faker.random_number(digits=3),
            'num_comprobante': faker.random_number(digits=7),
            'fecha': faker.date_time_between(start_date='-1y', end_date='now'),
            'impuesto': random.uniform(0.05, 0.20),
            'total': random.uniform(50, 5000),
            'estado': random.choice(['Pendiente', 'Pagado'])
        }
        ventas.append(venta)
    return ventas

idcliente_= [rol['idpersona'] for rol in data_persona]
idusuario_= [rol['idusuario'] for rol in data_usuario]

data_ventas = generar_ventas(100, idcliente_, idusuario_)

---

**Ingreso**

In [108]:
def generar_ingresos(num_ingresos, cliente_, usuario_):
    ingresos = []
    for i in range(num_ingresos):
        ingreso = {
            'idingreso': i + 1,
            'idproveedor': random.choice(cliente_),
            'idusuario': random.choice(usuario_),
            'tipo_comprobante': random.choice(['Factura', 'Boleta']),
            'serie_comprobante': faker.random_number(digits=3),
            'num_comprobante': faker.random_number(digits=7),
            'fecha': faker.date_time_between(start_date='-1y', end_date='now'),
            'impuesto': round(random.uniform(0.05, 0.20), 2),
            'total': round(random.uniform(50, 5000), 2),
            'estado': random.choice(['Pendiente', 'Pagado'])
        }
        ingresos.append(ingreso)
    return ingresos

data_ingreso = generar_ingresos(100, idcliente_, idusuario_)

---

**Categoria**

In [111]:
data_categoria = [
    {'idcategoria':101, 'nombre':'Electrónica', 'descripcion':'teléfonos móviles, computadoras portátiles, televisores, cámaras', 'estado':'1'},
    {'idcategoria':102, 'nombre':'Ropa', 'descripcion':'camisetas, pantalones, vestidos, chaquetas, ', 'estado':'1'},
    {'idcategoria':103, 'nombre':'Calzado', 'descripcion':'Tennis, botas, sandalias, casuales', 'estado':'1'},
    {'idcategoria':104, 'nombre':'Alimentos', 'descripcion':'Carnes, verdura, fruta, lacteos, legumbres', 'estado':'0'},
    {'idcategoria':105, 'nombre':'Salud y belleza', 'descripcion':'cremas faciales, shampoo, jabon para manos, medicamentos', 'estado':'1'},
]

---

**Articulo**

In [113]:
def generar_articulos(num_articulos, data_categoria):
    articulos = []
    nom = []
    for i in range(num_articulos):
        categoria = random.choice(data_categoria)
        
        if(categoria['idcategoria']==101):
            nom=['iphone 14','Televisor','Tablet','Audifonos','Laptop','Playstation 5']
            pre=['1300.00','2000.00','800.00','75.99','2499.99','550.00']
            num= random.randint(0, 5)
        elif(categoria['idcategoria']==102):
            nom = ['Camisetas','Pantalones','Vestidos','Chaquetas','Sweaters','Faldas']
            pre = ['12.49','29.99','88.49','55.99','33.15','19.20']
            num= random.randint(0, 5)
        elif(categoria['idcategoria']==103):
            nom=['Tennis','Botas','Sandalias','Zapatillas','Zapatos de vestir','Chanclas']
            pre=['58.00','96.99','14.50','29.99','59.99','9.65']
            num= random.randint(0, 5)
        elif(categoria['idcategoria']==104):
            nom=['Carnes','Verduras','Frutas','Lácteos','Legumbres','Pescado','Cereales','Huevos','Frutos secos','Pan']
            pre=['8.99','2.50','2.33','5.49','1.50','8.80','5.30','2.00','1.38','1.69']
            num= random.randint(0, 9)
        elif(categoria['idcategoria']==105):
            nom=['Cremas faciales','Shampoo','Jabón para manos','Maquillaje','Perfume','Cepillos de dientes eléctricos']
            pre =['5.80','18.50','3.00','16.30','49.80','12.00']
            num= random.randint(0, 5)
            
        articulo = {
            'idarticulo': i + 1,
            'idcategoria': categoria['idcategoria'],
            'codigo': faker.unique.random_number(digits=8),
            'nombre': nom[num],
            'precio_venta': pre[num],
            'stock': random.randint(1, 100),
            'descripcion': faker.sentence(),
            'imagen': faker.file_name(category=None, extension='jpg'),
            'estado': categoria['estado']
        }
        articulos.append(articulo)
    return articulos

# Número de artículos ficticios que deseas generar
num_articulos = 20

# Generamos los artículos ficticios
data_articulo= generar_articulos(num_articulos, data_categoria)

---

**Detalle ingreso**

In [115]:
def generar_detalle_ingreso(num_detalles, iding, idart):
    detalles_ingreso = []
    for i in range(num_detalles):
        detalle_ingreso = {
            'iddetalle_ingreso': i + 1,
            'idingreso': random.choice(iding),
            'idarticulo': random.choice(idart),
            'cantidad': random.randint(1, 100),
            'precio': round(random.uniform(1, 200), 2)
        }
        detalles_ingreso.append(detalle_ingreso)
    return detalles_ingreso

idingreso_= [rol['idingreso'] for rol in data_ingreso]
idarticulo_= [rol['idarticulo'] for rol in data_articulo]
data_detalle_ingreso = generar_detalle_ingreso(100, idingreso_, idarticulo_ )

---

**Detalle venta**

In [119]:
def generar_detalle_venta(num_detalles, idvent, idart):
    detalles_venta = []
    for i in range(num_detalles):
        detalle_venta = {
            'iddetalle_venta': i + 1,
            'idventa': random.choice(idvent),
            'idarticulo': random.choice(idart),
            'cantidad': random.randint(1, 100),
            'precio': round(random.uniform(10, 500), 2),
            'descuento': round(random.uniform(0, 50), 2)
        }
        detalles_venta.append(detalle_venta)
    return detalles_venta



idventa_= [rol['idventa'] for rol in data_ventas]
data_detalles_venta = generar_detalle_venta(100, idventa_, idarticulo_)

### Comenzamos a insertar datos

In [51]:
driver = f"""postgresql://{config.get('VENTAS', 'DB_USERNAME')}:{config.get('VENTAS', 'DB_PASSWORD')}@{RDS_HOSTNAME}:{config.get('VENTAS', 'DB_PORT')}/{config.get('VENTAS', 'DB_NAME')}"""
driver

'postgresql://admin_postgres:bo*Y+EoY+wA--7.Kb559C@proyect-venta-db.c5a4euw2wd87.us-east-1.rds.amazonaws.com:5432/ventas'

In [52]:
def insertData2SQL(data_dict, table_name, driver):
    df_data=pd.DataFrame.from_records(data_dict)
    try:
        response = df_data.to_sql(table_name, driver, index=False, if_exists='append')
        print(f"Se han insertado {response} nuevos registros")
    except Exception as ex:
        print("Error!!!",ex)

In [87]:
insertData2SQL(data_rol,'rol', driver)

Se han insertado 5 nuevos registros


In [95]:
insertData2SQL(data_usuario,'usuario',driver)

Se han insertado 50 nuevos registros


In [104]:
insertData2SQL(data_persona,'persona',driver)

Se han insertado 100 nuevos registros


In [107]:
insertData2SQL(data_ventas,'venta',driver)

Se han insertado 100 nuevos registros


In [109]:
insertData2SQL(data_ingreso,'ingreso',driver)

Se han insertado 100 nuevos registros


In [112]:
insertData2SQL(data_categoria,'categoria',driver)

Se han insertado 5 nuevos registros


In [114]:
insertData2SQL(data_articulo,'articulo',driver)

Se han insertado 20 nuevos registros


In [116]:
insertData2SQL(data_detalle_ingreso,'detalle_ingreso',driver)

Se han insertado 100 nuevos registros


In [120]:
insertData2SQL(data_detalles_venta,'detalle_venta',driver)

Se han insertado 100 nuevos registros


In [121]:
!git init

Initialized empty Git repository in C:/Users/Alienware M15/Universidad/Proyecto2/.git/


In [125]:
!git remote add origin https://github.com/ElMangel/Proyecto_final.git

In [123]:
!git status

On branch master

No commits yet

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	.ipynb_checkpoints/
	Carga_Transporte.ipynb
	Preguntas.ipynb
	Transaccional.ipynb
	Untitled.ipynb
	__pycache__/
	config1.cfg
	corregir_sql2.py
	sql_transac8.py

nothing added to commit but untracked files present (use "git add" to track)


In [124]:
!git add Transaccional.ipynb
!git commit -m "Modelo transaccional, creacion de instancia y poblacion de la base de datos"
!git push --set-upstream origin master



[master (root-commit) c4acf57] Modelo transaccional, creacion de instancia y poblacion de la base de datos
 1 file changed, 957 insertions(+)
 create mode 100644 Transaccional.ipynb


fatal: 'origin' does not appear to be a git repository
fatal: Could not read from remote repository.

Please make sure you have the correct access rights
and the repository exists.
