## Librerias

In [1]:
import pyodbc
import pandas as pd
import numpy as np
import os

## Pruebas de funcionamiento

**Funcinamiento Driver**

In [2]:
try:
    conn_str = "DRIVER={ODBC Driver 17 for SQL Server};SERVER=localhost;DATABASE=master;Trusted_Connection=yes"
    conn = pyodbc.connect(conn_str)
    print("✅ Conexión exitosa a SQL Server")
    conn.close()
except Exception as e:
    print(f" Error de conexión: {e}")


✅ Conexión exitosa a SQL Server


**Importacion de las Consultas SQL**

In [None]:
BASE_DIR = os.getcwd()  # Devuelve el directorio actual donde se ejecuta el script
print(f" Directorio actual: {BASE_DIR}")

#Construir la ruta de la carpeta `queries`
SQL_QUERIES_PATH = os.path.join(BASE_DIR, "queries")
print(f" Ruta esperada para queries: {SQL_QUERIES_PATH}")

#  Verificar si encuentra la cerpta de las queries
if os.path.exists(SQL_QUERIES_PATH):
    print(" Carpeta encontrada correctamente.")
else:
    print(" ERROR: La carpeta no existe")


 Directorio actual: c:\Users\marti\gd_clv-2\data_migration
 Ruta esperada para queries: c:\Users\marti\gd_clv-2\data_migration\queries
 Carpeta encontrada correctamente.


In [9]:
if os.path.exists(SQL_QUERIES_PATH):
    sql_files = [f for f in os.listdir(SQL_QUERIES_PATH) if f.endswith(".sql")]
    print(f"🗂 Archivos SQL encontrados: {sql_files}")
else:
    print("❌ ERROR: No se encontró la carpeta `queries/`.")


🗂 Archivos SQL encontrados: ['cliente.sql', 'fact_table.sql', 'geog.sql', 'prod.sql', 'tiempo.sql']


In [2]:
import pyodbc
import pandas as pd
import os
import numpy as np

# Rutas de conexión Azure
AZURE_SERVER = 'uaxmathfis.database.windows.net'
AZURE_DATABASE = 'usecases'
AZURE_DRIVER = '{ODBC Driver 17 for SQL Server}'
#Conexión Azure
azure_conn_str = f"DRIVER={AZURE_DRIVER};SERVER={AZURE_SERVER};DATABASE={AZURE_DATABASE};Authentication=ActiveDirectoryInteractive"

# Rutas SSMS
LOCAL_SERVER = 'localhost'
LOCAL_DATABASE = 'dwh_case1'
LOCAL_DRIVER = '{ODBC Driver 17 for SQL Server}'
# Conexión a SQL Server Local
local_conn_str = f"DRIVER={LOCAL_DRIVER};SERVER={LOCAL_SERVER};DATABASE={LOCAL_DATABASE};Trusted_Connection=yes;TrustServerCertificate=yes"

#  Ruta de la carpeta donde están las consutlas para modelo dimensional 
SQL_QUERIES_PATH = os.path.join(os.getcwd(), "queries")

#  Obtener lista de archivos SQL
sql_files = [f for f in os.listdir(SQL_QUERIES_PATH) if f.endswith(".sql")]

# Verificar si hay consultas en la carpeta
if not sql_files:
    print(" ERROR: No se encontraron archivos .sql en la carpeta.")
else:
    print(f" Encontrados {len(sql_files)} archivos SQL.")

#  Conectar a Azure SQL
try:
    print("1.Conectando a Azure SQL")
    conn_azure = pyodbc.connect(azure_conn_str)
    cursor_azure = conn_azure.cursor()

    print("2.Conectando a SQL Server Local")
    conn_local = pyodbc.connect(local_conn_str)
    cursor_local = conn_local.cursor()

    for sql_file in sql_files:
        file_path = os.path.join(SQL_QUERIES_PATH, sql_file)

        print(f" Procesando archivo: {sql_file}")

        # Leer el contenido del archivo SQL
        with open(file_path, 'r', encoding='utf-8') as file:
            sql_query = file.read()

        # Ejecutar consulta en Azure SQL
        print(f" Ejecutando consulta en Azure SQL para {sql_file}")
        df = pd.read_sql(sql_query, conn_azure)

        if df.empty:
            print(f" No hay datos para {sql_file}.No se creará la tabla en SQL Server Local.")
            continue

        print(f" Datos extraídos: {df.shape[0]} filas.")

        # Convertir NaN a 0
        df = df.fillna(0)

        # Ajustar tipos de datos
        for col in df.select_dtypes(include=['float64']).columns:
            df[col] = df[col].astype(np.float32)
        for col in df.select_dtypes(include=['int64']).columns:
            df[col] = df[col].astype(np.int32)

        # Nombre de la tabla local (sin extensión)
        table_name = os.path.splitext(sql_file)[0]

        # Eliminar tabla si ya existe
        drop_table_sql = f"DROP TABLE IF EXISTS {table_name}"
        cursor_local.execute(drop_table_sql)
        conn_local.commit()

        print(f" Tabla {table_name} eliminada si existía.")

        # Crear la tabla con los tipos de datos ajustados
        create_table_sql = f"""
        CREATE TABLE {table_name} (
            {', '.join([
                f'[{col}] FLOAT' if df[col].dtype == np.float32 
                else f'[{col}] INT' if df[col].dtype == np.int32 
                else f'[{col}] NVARCHAR(255)' for col in df.columns
            ])}
        );
        """
        cursor_local.execute(create_table_sql)
        conn_local.commit()

        print(f"✅ Tabla {table_name} creada en SQL Server Local.")

        # Insertar datos en la tabla
        placeholders = ', '.join(['?' for _ in df.columns])
        insert_sql = f"INSERT INTO {table_name} VALUES ({placeholders})"

        cursor_local.fast_executemany = True
        cursor_local.executemany(insert_sql, df.values.tolist())
        conn_local.commit()

        print(f" {df.shape[0]} filas insertadas en {table_name}.")

except Exception as e:
    print(f"ERROR: {e}")

finally:
    if 'conn_azure' in locals():
        conn_azure.close()
    if 'conn_local' in locals():
        conn_local.close()

print("\n ¡Proceso completado!")


 Encontrados 5 archivos SQL.
1.Conectando a Azure SQL
2.Conectando a SQL Server Local
 Procesando archivo: cliente.sql
 Ejecutando consulta en Azure SQL para cliente.sql


  df = pd.read_sql(sql_query, conn_azure)


 Datos extraídos: 44053 filas.
 Tabla cliente eliminada si existía.
✅ Tabla cliente creada en SQL Server Local.
 44053 filas insertadas en cliente.
 Procesando archivo: fact_table.sql
 Ejecutando consulta en Azure SQL para fact_table.sql


  df = pd.read_sql(sql_query, conn_azure)


 Datos extraídos: 58049 filas.
 Tabla fact_table eliminada si existía.
✅ Tabla fact_table creada en SQL Server Local.
 58049 filas insertadas en fact_table.
 Procesando archivo: geog.sql
 Ejecutando consulta en Azure SQL para geog.sql
 Datos extraídos: 12 filas.
 Tabla geog eliminada si existía.
✅ Tabla geog creada en SQL Server Local.


  df = pd.read_sql(sql_query, conn_azure)


 12 filas insertadas en geog.
 Procesando archivo: prod.sql
 Ejecutando consulta en Azure SQL para prod.sql
 Datos extraídos: 404 filas.
 Tabla prod eliminada si existía.
✅ Tabla prod creada en SQL Server Local.
 404 filas insertadas en prod.
 Procesando archivo: tiempo.sql
 Ejecutando consulta en Azure SQL para tiempo.sql


  df = pd.read_sql(sql_query, conn_azure)
  df = pd.read_sql(sql_query, conn_azure)


 Datos extraídos: 3652 filas.
 Tabla tiempo eliminada si existía.
✅ Tabla tiempo creada en SQL Server Local.
 3652 filas insertadas en tiempo.

 ¡Proceso completado!
