# Ejemplo de ejecución de python en PBI

## Simulamos contenido cargado en PBI

In [None]:
import pandas as pd
from sqlalchemy import create_engine, text

# Configura los parámetros de conexión
conn_string = 'postgresql+psycopg2://usuario:contraseña@localhost:5432/nombre_basedatos'
engine = create_engine(conn_string)

# Consulta SQL para traer los datos
query = "SELECT * FROM sales;"

# Cargar los datos en un DataFrame
dataset = pd.read_sql(query, engine)
# OLD py versions
# df = pd.DataFrame(engine.connect().execute(text(query)))


## Script python para PBI

In [None]:
# Importar librerías necesarias
import pandas as pd

# Cargar los datos limpios del análisis anterior
df = dataset

# Eliminar columnas vacias
df.dropna(inplace=True)

# Convertir fechas al tipo datetime
df['orderdate'] = pd.to_datetime(df['orderdate'])
df['shippeddate'] = pd.to_datetime(df['shippeddate'])
df['requireddate'] = pd.to_datetime(df['requireddate'])

# Rellenar valores faltantes en sales_amount usando quantityOrdered y priceEach
df['sales_amount'] = df['sales_amount'].fillna(df['quantityordered'] * df['priceeach'])

# Rellenar comentarios vacíos
df['comments'] = df['comments'].fillna("Sin comentarios")


# Eliminar outliers extremos (ajustar según contexto)
df = df[df['priceeach'] <= 10000]
df = df[df['quantityordered'] <= 1000]


# Calcular días entre orden y envío (si ya fue enviado)
df['days_to_ship'] = (df['shippeddate'] - df['orderdate']).dt.days

# Calcular días entre orden y fecha requerida
df['days_required'] = (df['requireddate'] - df['orderdate']).dt.days




## df resultante

In [None]:
df