# SCRIPT DE CARGA DE DATOS LIMPIOS EN BBDD AZURE

In [None]:
import pandas as pd
import sys
import os
import pyodbc

# Verificar argumento CSV
if len(sys.argv) < 2:
    print("Error: No se ha proporcionado la ruta del archivo .csv")
    sys.exit(1)

csv_path = sys.argv[1]

if not os.path.exists(csv_path):
    print(f"Error: El archivo {csv_path} no existe")
    sys.exit(1)

# Cargar el CSV
df = pd.read_csv(csv_path)

# Columnas tipo bit (solo 0 o 1)
bit_columns = [
    'SAQUE CENTRO', 'RASO', 'OFENSIVA', 'ALTO', 'OFF T', 'AEREO GANADO', 'NORMAL',
    'CABEZA', 'DESVIADO', 'SUELO', 'ROTURA LINEA', 'AEREA', 'MEDIO', 'SAQUE PUERTA',
    'BANDA', 'CENTRO', 'PARADA', 'CAMBIO ORIENTACION', 'ASISTENCIA TIRO',
    'PRIMER TOQUE', 'JUGADA', 'SEGUNDO TOQUE', 'BLOQUEADO', 'INTERCEPTADO',
    'DEFENSIVA', 'CORNER', 'GOL', 'VOLEA', 'PRIMER AMARILLA', 'POSTE',
    'ASISTENCIA GOL', 'IN', 'OFF',
]

# Convertir columnas a int si están en el DataFrame
for col in bit_columns:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0).astype(int)

# Diagnóstico: revisar columnas no válidas para tipo float
for col in df.columns:
    if df[col].dtype == 'object':
        try:
            df[col] = pd.to_numeric(df[col], errors='ignore')
        except:
            pass  # No forzar si no puede convertirse

# Reemplazar NaNs con 0 para columnas numéricas (opcional)
df = df.fillna(0)

# Conexión a Azure (ajusta a tu configuración)
server = 'server-rodrigo.database.windows.net'
database = 'bbdd_TFM'
username = 'rodrigo'
password = '79341353rR?'
driver = '{ODBC Driver 17 for SQL Server}'

try:
    conn = pyodbc.connect(
        f'DRIVER={driver};SERVER={server};DATABASE={database};UID={username};PWD={password}'
    )
    cursor = conn.cursor()
    print("✅ Conexión establecida con SQL Server.")

    # Escapar nombres de columnas con espacios
    columns = ', '.join(f"[{col}]" for col in df.columns)
    placeholders = ', '.join(['?'] * len(df.columns))
    sql = f"INSERT INTO dbo.Eventos3rfef ({columns}) VALUES ({placeholders})"

    for _, row in df.iterrows():
        cursor.execute(sql, tuple(row))

    conn.commit()
    print("✅ Datos insertados correctamente en SQL Server.")

except Exception as e:
    print(f"❌ Error al conectar o insertar datos: {e}")

finally:
    try:
        cursor.close()
        conn.close()
    except:
        pass