#### Generar Datos en .CSV

In [24]:
import random
import pandas as pd
from faker import Faker

fake = Faker()

##### Proveedores

In [None]:
tipo_energia = ['eolica', 'hidroelectrica', 'nuclear']

proveedores = []
for p in range(1, 11):
    proveedor = {
        'id_proveedor': random.randint(10000000, 99999999),
        'nombre_proveedor': fake.company(), 
        'tipo_energia': random.choice(tipo_energia)
    }
    proveedores.append(proveedor)
    
df_proveedor = pd.DataFrame(proveedores)

df_proveedor.to_csv('proveedores.csv', index=False)

"\nproveedor = {\n        'id_proveedor': [range(10000000, 99999999) for _ in range(10) ],\n        'nombre_proveedor': [fake.company() for _ in range(10)], \n        'tipo_energia': [random.choice(tipo_energia) for _ in range(10)]\n    }\n"

##### Clientes

In [None]:
tipo_identificacion = ['dni', 'cc', 'ce']
clientes = []

for c in range(1, 11):
    cliente = {
        'identificacion_cliente': fake.ssn(),
        'tipo_identificacion_cliente':  random.choice(tipo_identificacion),
        'nombre_cliente': fake.name(), 
        'ciudad_cliente': fake.city()
    }
    clientes.append(cliente)

df_cliente = pd.DataFrame(clientes)
df_cliente.to_csv('clientes.csv', index=False)

##### Unificar todos los IDs

In [36]:
ids = []
id_proveedor = df_proveedor['id_proveedor'].to_list()
id_cliente = df_cliente['identificacion_cliente'].to_list()
ids.extend(id_cliente)
ids.extend(id_proveedor)

##### Transacciones

In [37]:
tipo_transaccion = ['venta', 'compra']
transacciones = []

for t in range (1, 11):    
    transaccion = {
        'id_transaccion': random.randint(10000, 99999),
        'tipo_transaccion': random.choice(tipo_transaccion),
        'cantidad_transaccion': round(fake.random_number(digits=4), 0),
        'precio': round(fake.random_number(digits=6), 2),
        'id_persona': random.choice(ids)
    }
    transacciones.append(transaccion)

df_transaccion = pd.DataFrame(transacciones)
df_transaccion.to_csv('transacciones.csv', index=False)
    

##### Subir archivos a S3

In [2]:
import boto3
from datetime import datetime

In [None]:
year = f"{datetime.now().year}"
month = f"{datetime.now().month:02}"
day = f"{datetime.now().day:02}"

s3_client = boto3.client('s3', region_name='us-east-1')

nombre_bucket = 'datalake-energia-raw'
archivos = ['transacciones.csv','clientes.csv', 'proveedores.csv']
rutas = ['transacciones', 'clientes', 'proveedores']
# Subir el archivo
try:
    for archivo, ruta in zip(archivos, rutas):
        ruta_salida =  f"{ruta}/{year}/{month}/{day}/{archivo}"
        s3_client.upload_file(archivo, nombre_bucket, ruta_salida)
        print(f'Archivo {archivo} subido exitosamente a {nombre_bucket}/{ruta_salida}')
except Exception as e:
    print(f'Error al subir el archivo: {e}')

Archivo transacciones.csv subido exitosamente a poc-dev-us-east-1-863518421644-raw/transacciones/2025/06/16/transacciones.csv
Archivo clientes.csv subido exitosamente a poc-dev-us-east-1-863518421644-raw/clientes/2025/06/16/clientes.csv
Archivo proveedores.csv subido exitosamente a poc-dev-us-east-1-863518421644-raw/proveedores/2025/06/16/proveedores.csv


In [6]:
now = datetime.now()
year = f"{now.year}"
month = f"{now.month:02}"
day = f"{now.day:02}"
print(now)


2025-06-16 20:12:33.230445
