In [1]:
# Descargar e instalar este componente: https://go.microsoft.com/fwlink/?linkid=2307162

# Instalar la librería:
!pip install pyodbc



In [4]:
# Probando conectividad con el servidor Azure SQL Database
import pyodbc

# --- 1. CONFIGURACIÓN ---
server = 'proyecto-analisis-de-datos.database.windows.net' 
database = 'ProyectoFinalDB' # Aqui depende si usamos esta base de datos para todo o ustedes quieren crear más, pero yo preferiría que usemos esta para todo, nada más hay que tener cuidado con el nombre de las tablas que no se repitan
username = 'admin-epn' 
password = 'Brandon.2.0' 

# --- 2. CONSTRUIR LA CADENA DE CONEXIÓN ---
connection_string = (
    f'DRIVER={{ODBC Driver 17 for SQL Server}};'
    f'SERVER={server};'
    f'DATABASE={database};'
    f'UID={username};'
    f'PWD={password}'
)

# --- 3. INTENTAR LA CONEXIÓN ---
try:
    print("Intentando conectar a Azure SQL Database...")
    # Usamos un bloque with para asegurar que la conexión se cierre al final
    with pyodbc.connect(connection_string, timeout=30) as cnxn:
        print("✅ ¡Éxito! La conexión con Azure SQL se estableció correctamente.")
        
        # Opcional: Hacemos una pequeña consulta para verificar
        cursor = cnxn.cursor()
        cursor.execute("SELECT @@VERSION;")
        row = cursor.fetchone()
        print(f"Versión de SQL Server: {row[0]}")

except pyodbc.Error as ex:
    sqlstate = ex.args[0]
    print(f"❌ FALLO al conectar a Azure SQL.")
    print(f"   Error: {sqlstate}")
    print("   Asegúrate de que tu IP esté en las reglas de firewall y que tus credenciales sean correctas.")

Intentando conectar a Azure SQL Database...
✅ ¡Éxito! La conexión con Azure SQL se estableció correctamente.
Versión de SQL Server: Microsoft SQL Azure (RTM) - 12.0.2000.8 
	Jul  3 2025 16:52:14 
	Copyright (C) 2025 Microsoft Corporation



In [8]:
import pandas as pd
import pymongo
import pyodbc

# --- 1. CONFIGURACIÓN DE CONEXIONES (Sin cambios) ---
MONGO_URI = "mongodb+srv://juan:12345@cluster0.agcdm8h.mongodb.net/"
mongo_client = pymongo.MongoClient(MONGO_URI)
db_mongo = mongo_client['proyecto_futbol']

server = 'proyecto-analisis-de-datos.database.windows.net'
database = 'ProyectoFinalDB'
username = 'admin-epn'
password = 'Brandon.2.0'
driver = '{ODBC Driver 18 for SQL Server}'
sql_conn_str = f'DRIVER={driver};SERVER=tcp:{server},1433;DATABASE={database};UID={username};PWD={password};Encrypt=yes;TrustServerCertificate=no;Connection Timeout=30;'

# --- 2. PROCESO DE MIGRACIÓN (VERSIÓN OPTIMIZADA) ---
try:
    sql_conn = pyodbc.connect(sql_conn_str)
    cursor = sql_conn.cursor()
    # Habilitamos el modo de inserción rápida, la clave para la velocidad
    cursor.fast_executemany = True
    print("✅ ¡Conexión a Azure SQL Server exitosa!")

    # --- MIGRACIÓN 1: DATOS DE DEPORTES ---
    print("\nIniciando migración de Eventos Deportivos...")
    collection_deportes = db_mongo['eventos_procesados']
    df_deportes = pd.DataFrame(list(collection_deportes.find()))
    # (El código de limpieza aquí no cambia...)
    columnas_a_usar = ['id_odsp', 'id_event', 'sort_order', 'time', 'text', 'event_type', 'event_type2', 'side', 'event_team', 'opponent', 'player', 'player2', 'shot_place', 'shot_outcome', 'is_goal', 'location', 'bodypart', 'assist_method', 'situation', 'fast_break']
    df_deportes_sql = df_deportes[columnas_a_usar].copy()
    df_deportes_sql.rename(columns={'text': 'texto_evento', 'event_team': 'equipo_evento'}, inplace=True)
    for col in df_deportes_sql.select_dtypes(include=['object']).columns: df_deportes_sql[col] = df_deportes_sql[col].fillna('')
    for col in df_deportes_sql.select_dtypes(include=['number']).columns: df_deportes_sql[col] = df_deportes_sql[col].fillna(0)
    
    # Preparamos los datos para la inserción masiva
    datos_deportes_tuplas = [tuple(x) for x in df_deportes_sql.to_numpy()]
    
    # Creamos la sentencia SQL y la ejecutamos de una sola vez
    sql_insert_deportes = """
        INSERT INTO EventosDeportivos (id_odsp, id_event, sort_order, "time", texto_evento, event_type, event_type2, side, equipo_evento, opponent, player, player2, shot_place, shot_outcome, is_goal, "location", bodypart, assist_method, situation, fast_break)
        VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
    """
    cursor.executemany(sql_insert_deportes, datos_deportes_tuplas)
    print(f"✅ Se insertaron {len(df_deportes_sql)} registros en EventosDeportivos.")

    # --- MIGRACIÓN 2: DATOS DE GITHUB ---
    print("\nIniciando migración de Repositorios de GitHub...")
    collection_github = db_mongo['repositorios_github']
    df_github = pd.DataFrame(list(collection_github.find()))
    df_github_sql = df_github[['repo_name', 'language_name', 'language_bytes']].rename(columns={'repo_name': 'nombre_repo', 'language_name': 'nombre_lenguaje', 'language_bytes': 'bytes_lenguaje'})
    datos_github_tuplas = [tuple(x) for x in df_github_sql.to_numpy()]
    sql_insert_github = "INSERT INTO RepositoriosGitHub (nombre_repo, nombre_lenguaje, bytes_lenguaje) VALUES (?, ?, ?)"
    cursor.executemany(sql_insert_github, datos_github_tuplas)
    print(f"✅ Se insertaron {len(df_github_sql)} registros en RepositoriosGitHub.")

    # --- MIGRACIÓN 3: DATOS DE REDDIT ---
    print("\nIniciando migración de Sentimientos de Reddit...")
    collection_reddit = db_mongo['sentimiento_reddit']
    df_reddit = pd.DataFrame(list(collection_reddit.find()))
    df_reddit_sql = df_reddit[['texto', 'sentimiento_score', 'sentimiento_label']].rename(columns={'texto': 'texto_comentario'})
    datos_reddit_tuplas = [tuple(x) for x in df_reddit_sql.to_numpy()]
    sql_insert_reddit = "INSERT INTO SentimientoReddit (texto_comentario, sentimiento_score, sentimiento_label) VALUES (?, ?, ?)"
    cursor.executemany(sql_insert_reddit, datos_reddit_tuplas)
    print(f"✅ Se insertaron {len(df_reddit_sql)} registros en SentimientoReddit.")

    sql_conn.commit()

except Exception as e:
    print(f"❌ Error durante la migración: {e}")
finally:
    if 'cursor' in locals():
        cursor.close()
    if 'sql_conn' in locals():
        sql_conn.close()
    if 'mongo_client' in locals():
        mongo_client.close()
    print("\nProceso finalizado y conexiones cerradas.")

✅ ¡Conexión a Azure SQL Server exitosa!

Iniciando migración de Eventos Deportivos...
✅ Se insertaron 160000 registros en EventosDeportivos.

Iniciando migración de Repositorios de GitHub...
✅ Se insertaron 90000 registros en RepositoriosGitHub.

Iniciando migración de Sentimientos de Reddit...
✅ Se insertaron 249999 registros en SentimientoReddit.

Proceso finalizado y conexiones cerradas.
