In [None]:
pip install gdown psycopg2 pandas

In [None]:
import gdown
import os

# URL de la carpeta compartida
file_url = "https://drive.google.com/drive/folders/17a0kvZD1ZfRPyMCgrNlr4vCCdqN9djCv"
output_folder = "Downloads/Spaceman"
os.makedirs(output_folder, exist_ok=True)

# Descargar archivos usando gdown
def download_from_folder(file_url, output_folder):
    print("Descargando archivos de la carpeta...")
# Convertir la URL de la carpeta a formato descargable
    gdown.download_folder(file_url, output=output_folder, quiet=False)

download_from_folder(file_url, output_folder)
print(f"Descarga completa. Archivos guardados en: {output_folder}")


In [None]:
import os
import psycopg2
import pandas as pd

# Configuración de conexión a PostgreSQL
db_host = os.getenv("DB_HOST", "localhost")
db_name = os.getenv("DB_NAME", "spaceman")
db_user = os.getenv("DB_USER", "postgres")
db_password = os.getenv("DB_PASSWORD", "dba")
db_port = os.getenv("DB_PORT", "5432")

# Ruta local donde se encuentran los archivos
local_folder = r"C:\Users\dsantander\Downloads\Spaceman"

# Inferir el tipo de datos de PostgreSQL basado en pandas
def infer_postgresql_type(dtype, max_value=None, min_value=None):
    if pd.api.types.is_integer_dtype(dtype):
        if max_value and (max_value > 2_147_483_647 or min_value < -2_147_483_648):
            return "BIGINT"
        return "INTEGER"
    elif pd.api.types.is_float_dtype(dtype):
        return "REAL"
    elif pd.api.types.is_bool_dtype(dtype):
        return "BOOLEAN"
    elif pd.api.types.is_datetime64_any_dtype(dtype):
        return "TIMESTAMP"
    else:
        return "TEXT"

# Crear tabla e insertar registros en PostgreSQL
def process_file(file_path, delimiter=";"):
    conn = None
    cur = None
    try:
        # Conexión a la base de datos
        conn = psycopg2.connect(host=db_host, database=db_name, user=db_user, password=db_password, port=db_port)
        cur = conn.cursor()

        # Leer el archivo con pandas, probando diferentes codificaciones
        encodings_to_try = ['utf-8', 'latin-1', 'ISO-8859-1']
        df = None
        for encoding in encodings_to_try:
            try:
                df = pd.read_csv(file_path, delimiter=delimiter, low_memory=False, on_bad_lines='skip', encoding=encoding)
                break  # Si se lee correctamente, salimos del bucle
            except UnicodeDecodeError:
                continue  # Intenta con la siguiente codificación

        if df is None:
            print(f"No se pudo leer el archivo {file_path} con las codificaciones probadas.")
            return

        # Validar que el DataFrame no esté vacío
        if df.empty:
            print(f"El archivo {file_path} está vacío o no tiene datos válidos.")
            return

        # Inferir tipos de columnas y construir la sentencia CREATE TABLE
        table_name = "tickets"  # Nombre de la tabla basada en el nombre requerido
        columns_with_types = []
        for col in df.columns:
            max_value, min_value = None, None
            if pd.api.types.is_numeric_dtype(df[col]):
                max_value, min_value = df[col].max(), df[col].min()
            pg_type = infer_postgresql_type(df[col].dtype, max_value, min_value)
            columns_with_types.append(f'"{col}" {pg_type}')

        create_table_query = f"CREATE TABLE IF NOT EXISTS {table_name} ({', '.join(columns_with_types)});"
        cur.execute(create_table_query)
        conn.commit()
        print(f"Tabla '{table_name}' creada exitosamente.")

        # Insertar datos en la tabla
        data_tuples = [tuple(row) for row in df.to_numpy()]
        cols = ', '.join([f'"{col}"' for col in df.columns])
        placeholders = ', '.join(['%s'] * len(df.columns))
        insert_query = f"INSERT INTO {table_name} ({cols}) VALUES ({placeholders});"
        cur.executemany(insert_query, data_tuples)
        conn.commit()
        print(f"{len(data_tuples)} registros insertados en la tabla '{table_name}'.")

    except Exception as e:
        print(f"Error al procesar el archivo {file_path}: {e}")
    finally:
        if cur:
            cur.close()
        if conn:
            conn.close()

# Leer el directorio y procesar archivos que comiencen con "tickets"
for filename in os.listdir(local_folder):
    if filename.startswith("tickets"):  # Verifica si el archivo comienza con "tickets"
        file_path = os.path.join(local_folder, filename)
        process_file(file_path)


In [None]:
import os
import psycopg2
import pandas as pd

# Configuración de conexión a PostgreSQL
db_host = os.getenv("DB_HOST", "localhost")
db_name = os.getenv("DB_NAME", "spaceman")
db_user = os.getenv("DB_USER", "postgres")
db_password = os.getenv("DB_PASSWORD", "dba")
db_port = os.getenv("DB_PORT", "5432")

# Ruta local donde se encuentran los archivos
local_folder = r"C:\Users\dsantander\Downloads\Spaceman"

# Inferir el tipo de datos de PostgreSQL basado en pandas
def infer_postgresql_type(dtype, max_value=None, min_value=None):
    if pd.api.types.is_integer_dtype(dtype):
        if max_value and (max_value > 2_147_483_647 or min_value < -2_147_483_648):
            return "BIGINT"
        return "INTEGER"
    elif pd.api.types.is_float_dtype(dtype):
        return "REAL"
    elif pd.api.types.is_bool_dtype(dtype):
        return "BOOLEAN"
    elif pd.api.types.is_datetime64_any_dtype(dtype):
        return "TIMESTAMP"
    else:
        return "TEXT"

# Crear tabla e insertar registros en PostgreSQL
def process_file(file_path, delimiter=";"):
    conn = None
    cur = None
    try:
        # Conexión a la base de datos
        conn = psycopg2.connect(host=db_host, database=db_name, user=db_user, password=db_password, port=db_port)
        cur = conn.cursor()

        # Leer el archivo con pandas, probando diferentes codificaciones
        encodings_to_try = ['utf-8', 'latin-1', 'ISO-8859-1']
        df = None
        for encoding in encodings_to_try:
            try:
                df = pd.read_csv(file_path, delimiter=delimiter, low_memory=False, on_bad_lines='skip', encoding=encoding)
                break  # Si se lee correctamente, salimos del bucle
            except UnicodeDecodeError:
                continue  # Intenta con la siguiente codificación

        if df is None:
            print(f"No se pudo leer el archivo {file_path} con las codificaciones probadas.")
            return

        # Validar que el DataFrame no esté vacío
        if df.empty:
            print(f"El archivo {file_path} está vacío o no tiene datos válidos.")
            return

        # Inferir tipos de columnas y construir la sentencia CREATE TABLE
        table_name = "productos"  # Nombre de la tabla basada en el nombre requerido
        columns_with_types = []
        for col in df.columns:
            max_value, min_value = None, None
            if pd.api.types.is_numeric_dtype(df[col]):
                max_value, min_value = df[col].max(), df[col].min()
            pg_type = infer_postgresql_type(df[col].dtype, max_value, min_value)
            columns_with_types.append(f'"{col}" {pg_type}')

        create_table_query = f"CREATE TABLE IF NOT EXISTS {table_name} ({', '.join(columns_with_types)});"
        cur.execute(create_table_query)
        conn.commit()
        print(f"Tabla '{table_name}' creada exitosamente.")

        # Insertar datos en la tabla
        data_tuples = [tuple(row) for row in df.to_numpy()]
        cols = ', '.join([f'"{col}"' for col in df.columns])
        placeholders = ', '.join(['%s'] * len(df.columns))
        insert_query = f"INSERT INTO {table_name} ({cols}) VALUES ({placeholders});"
        cur.executemany(insert_query, data_tuples)
        conn.commit()
        print(f"{len(data_tuples)} registros insertados en la tabla '{table_name}'.")

    except Exception as e:
        print(f"Error al procesar el archivo {file_path}: {e}")
    finally:
        if cur:
            cur.close()
        if conn:
            conn.close()

# Leer el directorio y procesar archivos que comiencen con "tickets"
for filename in os.listdir(local_folder):
    if filename.startswith("productos"):  # Verifica si el archivo comienza con "tickets"
        file_path = os.path.join(local_folder, filename)
        process_file(file_path)