# ETL y Creación de Base de Datos MySQL para Enlaces MW

Este cuaderno está diseñado en **secciones** para que lo ejecutes paso a paso:

1. Preparación (instalación de dependencias)
2. Carga de archivos Excel (Exportes)
3. Estandarización y limpieza de datos
4. Definición de esquema MySQL (DDL) y creación de tablas
5. Poblado de la base de datos desde DataFrames
6. Verificación y consultas de ejemplo

Antes de ejecutar: coloca los archivos Excel en una ruta accesible y actualiza la cadena de conexión a MySQL.

Rutas de ejemplo (reemplazar):
- `/path/to/exporte_enlaces_MW.xlsx`
- `/path/to/exporte_modelos_radios.xlsx`
- `/path/to/exporte_caracteristicas_radios.xlsx`
- `/path/to/exporte_modelos_antenas.xlsx`

Cuando termines, el notebook generará tablas en MySQL (InnoDB, utf8mb4) siguiendo el diseño físico acordado.


## 1) Instalación de dependencias

Instala las siguientes librerías si no las tienes:

- pandas
- sqlalchemy
- pymysql
- openpyxl
- python-dotenv (opcional: para manejar credenciales)

Comando recomendado (ejecutar en terminal o en una celda con `!`):
```
pip install pandas sqlalchemy pymysql openpyxl python-dotenv xlrd
```


## 2) Importar librerías y definir rutas / conexión

Edita las variables `PATH_*` y `MYSQL_CONN_STR` según tu entorno.

In [1]:
import pandas as pd
import sqlalchemy
from sqlalchemy import text
import getpass
from pathlib import Path
import re
import numpy as np
import math

import json


#Importar jsons con información de las tablas con el estandar rfc2544
with open("rfc2544_table.json", "r", encoding="utf-8-sig") as f:
    RFC2544_TABLE = json.load(f)

with open("rfc2544_xpic.json", "r", encoding="utf-8-sig") as f:
    RFC2544_XPIC = json.load(f)

# Convertir claves de string → int
RFC2544_TABLE = {int(k): v for k, v in RFC2544_TABLE.items()}
RFC2544_XPIC = {int(k): v for k, v in RFC2544_XPIC.items()}



# ---- RUTAS: reemplaza por las tuyas ----
# Recordar abrir el archivo exporte_enlaces_MW y volverlo a guardar en .xlsx
PATH_MW = 'exporte_enlaces_MW2.xls'
PATH_MODELOS_RADIOS = 'exporte_modelos_radios.xls'
PATH_CARACTERISTICAS_RADIOS = 'exporte_caracteristicas_radios.xls'
PATH_MODELOS_ANTENAS = 'exporte_modelos_antenas.xls'
PATH_ESTACIONES = 'exporte_estaciones2.xls'

# ---- MySQL connection string: ejemplo ---
# mysql+pymysql://<user>:<password>@<host>:<port>/<database>
MYSQL_CONN_STR = 'mysql+pymysql://root:Tigo2025@localhost:3306/radiostigodb'

print('Rutas definidas:')
print(PATH_MW)
print(PATH_MODELOS_RADIOS)
print(PATH_CARACTERISTICAS_RADIOS)
print(PATH_MODELOS_ANTENAS)
print(PATH_ESTACIONES)
print('\nCadena de conexión MySQL:')
print(MYSQL_CONN_STR)
print("Estado: CONECTADO")


Rutas definidas:
exporte_enlaces_MW2.xls
exporte_modelos_radios.xls
exporte_caracteristicas_radios.xls
exporte_modelos_antenas.xls
exporte_estaciones2.xls

Cadena de conexión MySQL:
mysql+pymysql://root:Tigo2025@localhost:3306/radiostigodb
Estado: CONECTADO


In [2]:
with open("rfc2544_table.json", "r") as f:
    print(repr(f.read()))
    print(repr(f.read()))


print (RFC2544_TABLE)

'{\n  "56": {\n    "2048": 493.7,\n    "1024": 445.5,\n    "512": 405.9,\n    "256": 363.0,\n    "128": 316.7,\n    "64": 271.6,\n    "32": 226.0,\n    "16": 180.8,\n    "QPSK": 90.2\n  },\n  "40": {\n    "2048": 340.5,\n    "1024": 307.2,\n    "512": 279.9,\n    "256": 250.3,\n    "128": 218.3,\n    "64": 187.2,\n    "32": 155.8,\n    "16": 124.6,\n    "QPSK": 62.0\n  },\n  "28": {\n    "2048": 246.1,\n    "1024": 222.0,\n    "512": 202.3,\n    "256": 180.9,\n    "128": 157.7,\n    "64": 135.2,\n    "32": 112.5,\n    "16": 90.0,\n    "QPSK": 44.7\n  },\n  "14": {\n    "2048": 121.2,\n    "1024": 109.4,\n    "512": 98.6,\n    "256": 88.1,\n    "128": 76.8,\n    "64": 65.7,\n    "32": 54.7,\n    "16": 43.7,\n    "QPSK": 21.5\n  },\n  "7": {\n    "1024": 53.0,\n    "512": 47.7,\n    "256": 42.6,\n    "128": 37.0,\n    "64": 31.7,\n    "32": 26.3,\n    "16": 21.0,\n    "QPSK": 10.2\n  }\n}\n'
''
{56: {'2048': 493.7, '1024': 445.5, '512': 405.9, '256': 363.0, '128': 316.7, '64': 271.6, '32

## 3) Funciones de estandarización

Definimos funciones reutilizables para limpiar nombres, convertir tipos numéricos y normalizar columnas.

In [3]:
def normalize_colname(s: str) -> str:
    """Normaliza nombres de columnas: elimina espacios, pasa a minúsculas y reemplaza caracteres."""
    s = s.strip()
    s = s.replace('\n', ' ')
    s = re.sub(r"\s+", ' ', s)
    s = s.replace(' ', '_')
    s = s.lower()
    s = re.sub(r'[^0-9a-zA-Z_]', '', s)
    return s

def parse_numeric(val):
    if pd.isna(val):
        return None
    try:
        # remove thousands separators and possible units like 'MBps'
        s = str(val)
        s = s.replace(',', '').replace(' ', '')
        s = re.sub(r'[A-Za-z%]+', '', s)
        if s == '':
            return None
        if '.' in s:
            return float(s)
        else:
            return int(s)
    except Exception:
        return None

def clean_string(s):
    if pd.isna(s):
        return None
    s = str(s).strip()
    if s == '':
        return None
    return s


In [4]:
def fix_value(v):
    if v is None:
        return None

    # Manejo seguro de floats NaN o Inf
    try:
        if isinstance(v, float) and (math.isnan(v) or math.isinf(v)):
            return None
    except:
        pass

    if isinstance(v, str):
        v = v.strip()

        # Aquí agregamos limpieza robusta:
        if v == "" or v.upper() in ["N/A", "NULL", "NONE", "-", "SIN DATO", "NO APLICA"]:
            return None

    return v


## 4) Cargar los Excel en DataFrames 

Las siguientes celdas leen cada archivo en un DataFrame y renombrarán las columnas a nombres estandarizados.

In [5]:
def load_and_standardize(path, sheet_name=0):
    #df = pd.read_excel(path, sheet_name=sheet_name, engine='openpyxl') -> Solo usar si el archivo es .xlsx

    #El siguiente usa el engine xlrd por defecto, para archivos xls (antiguo formato de excel)
    df = pd.read_excel(path, sheet_name=sheet_name) 
    # renombrar columnas
    df.columns = [normalize_colname(str(c)) for c in df.columns]
    return df

# Lee cada archivo (las rutas deben existir en tu equipo)
try:
    df_mw = load_and_standardize(PATH_MW)
    df_modelos_radios = load_and_standardize(PATH_MODELOS_RADIOS)
    df_caracteristicas_radios = load_and_standardize(PATH_CARACTERISTICAS_RADIOS)
    df_modelos_antenas = load_and_standardize(PATH_MODELOS_ANTENAS)
    df_estaciones = load_and_standardize(PATH_ESTACIONES)
    print('Lectura completada. Filas:')
    print('df_mw', len(df_mw))
    print('df_modelos_radios', len(df_modelos_radios))
    print('df_caracteristicas_radios', len(df_caracteristicas_radios))
    print('df_modelos_antenas', len(df_modelos_antenas))
    print('df_estaciones', len(df_estaciones))
except FileNotFoundError as e:
    print('Archivo no encontrado. Asegúrate de editar las rutas en la celda anterior.', e)
    # Crear DF vacíos de ejemplo para que el notebook pueda seguir mostrando el flujo
    df_mw = pd.DataFrame(columns=[
        'nombre_estacion_a','nombre_estacion_b','frecuencia_tx_a','frecuencia_tx_b','es_frecuencia_principal',
        'ancho_de_banda','potencia_tx','potencia_rx','tipo_redundancia','tipo_modulacion','fecha_puesta_servicio',
        'capacidad_total_enlace','cantidad_puertos_ethernet','capacidad_por_puerto_ethernet_mbps','modelo_radio',
        'jerarquia','modelo_antena','modelo_antena_b','altura_antena_a','altura_antena_b','polarizacion_antena',
        'tiene_modulacion_adaptativa','modulacion_maxima','modulacion_minima','velocidad_transmision_maxima',
        'velocidad_transmision_minima','banda','subbanda','separacionfrecuencias','indice_diferenciador','capa','odu','fabricante'
    ])
    df_modelos_radios = pd.DataFrame(columns=['modelo','fabricante','maxima_capacidad'])
    df_caracteristicas_radios = pd.DataFrame(columns=['modelo','banda','modulacion','frecuencia_minima','frecuencia_maxima','tx_min','tx_max','sensibilidad','separacion','subbanda'])
    df_modelos_antenas = pd.DataFrame(columns=['modelo','fabricante','diametro','ganancia','apertura_lobulo','frecuencia_minima','frecuencia_maxima','tipo','tipo_desempeno'])
    df_estaciones = pd.DataFrame(columns=['nombre_estacion','direccion','departamento','municipio','longitud','latitud','altura_del_sitio','codigosistemaposc','regional'])
#df_mw.head(5)
#df_modelos_antenas.head(5)
df_estaciones.head(5)
df_mw.head(5)

Lectura completada. Filas:
df_mw 8797
df_modelos_radios 132
df_caracteristicas_radios 281
df_modelos_antenas 347
df_estaciones 10055


Unnamed: 0,nombre_estacin_a,nombre_estacin_b,frecuencia_tx_a,frecuencia_tx_b,es_frecuencia_principal,ancho_de_banda,potencia_tx,potencia_rx,tipo_redundancia,tipo_modulacin,...,modulacion_minima,velocidad_transmision_maxima,velocidad_transmision_minima,banda,subbanda,separacionfrecuencias,indice_diferenciador,capa,odu,fabricante
0,AMA0001.LETICIA,AMA7001.SAN_JORGE,7289.0,7128.0,1.0,7.0,31.0,-25.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat
1,AMA7005.NARANJALES,AMA7006.SAN JUAN DEL SOCO,7296.0,7135.0,1.0,7.0,25.0,-31.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat
2,AMA7011.PUERTO PEREA,AMA7010.PUERTO REYES,13020.5,12754.5,1.0,7.0,21.0,-32.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat
3,AMA7019.SAN _JORGE 2,AMA0001.LETICIA,7131.5,7292.5,1.0,14.0,25.0,-35.8,1+0,256QAM,...,Desconocida,0.0,0.0,7 GHz,G,161.0,,OBLIGACIONES 700,IAG3,Aviat
4,AMA7019.SAN _JORGE 2,AMA7020.PICHUNA_KM18,13027.5,12761.5,1.0,7.0,21.0,-31.0,1+0,256QAM,...,Desconocida,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat


## 5) Mapeos y limpieza especifica por archivo

Mapearemos las columnas estandarizadas a los nombres del esquema y convertiremos tipos.

In [6]:
def transform_df_mw(df):
    # Mapear columnas existentes a las columnas objetivo del esquema
    m = {
        'nombre_estacion_a':'nombre_estacion_a',
        'nombre_estacion_b':'nombre_estacion_b',
        'ancho_de_banda':'ancho_banda',
        'tipo_modulacion':'tipo_modulacion_maxima',
        'capacidad_total_enlace':'capacidad_total_enlace', 
        'tiene_modulacion_adaptativa':'modulacion_adaptativa',
        #'modulacion_maxima':'modulacion_maxima',
        #'modulacion_minima':'modulacion_minima',
        #'frecuencia_tx_a':'frecuencia_tx_a',
        #'frecuencia_tx_b':'frecuencia_tx_b',
        'potencia_rx':'potencia_rx',
        'tipo_redundancia':'tipo_redundancia',
        'cantidad_puertos_ethernet':'cantidad_puertos_eth',
        'capacidad_por_puerto_ethernet_mbps':'capacidad_por_puerto_eth',
        'velocidad_transmision_maxima':'velocidad_tx_max',
        'velocidad_transmision_minima':'velocidad_tx_min',
        'banda':'banda',
        'subbanda':'subbanda',
        'separacionfrecuencias':'separacion_frecuencias',
        'modelo_radio':'modelo_radio',
        'modelo_antena':'modelo_antena_a',
        'modelo_antena_b':'modelo_antena_b',
        'altura_antena_a':'altura_antena_a',
        'altura_antena_b':'altura_antena_b',
        'polarizacion_antena':'polarizacion_antena',
        'odu':'odu'
    }
    # rename only columns that exist
    cols_to_rename = {k:v for k,v in m.items() if k in df.columns}
    df = df.rename(columns=cols_to_rename)
    # aplicar limpieza
    for c in ['nombre_estacion_a','nombre_estacion_b','modelo_radio','modelo_antena_a','modelo_antena_b','polarizacion_antena','odu']:
        if c in df.columns:
            df[c] = df[c].apply(clean_string)
    for c in ['frecuencia_tx_a','frecuencia_tx_b','potencia_rx','altura_antena_a','altura_antena_b', 'capacidad_total_enlace','tipo_modulacion_maxima','ancho_banda']:
        if c in df.columns:
            df[c] = df[c].apply(parse_numeric)
    # normalizar booleanos
    if 'modulacion_adaptativa' in df.columns:
        df['modulacion_adaptativa'] = df['modulacion_adaptativa'].apply(lambda x: True if str(x).strip().lower() in ['si','sí','true','1','yes','y'] else False if pd.notna(x) else None)
    return df

def transform_df_modelos_radios(df):
    df = df.rename(columns={c:normalize_colname(c) for c in df.columns})
    # asegurar columnas necesarias
    df['modelo'] = df.get('modelo', pd.Series([None]*len(df))).apply(clean_string)
    df['fabricante'] = df.get('fabricante', pd.Series([None]*len(df))).apply(clean_string)
    if 'maxima_capacidad' not in df.columns and 'maxima capacidad' in df.columns:
        df['maxima_capacidad'] = df['maxima capacidad']
    df['maxima_capacidad'] = df.get('maxima_capacidad', pd.Series([None]*len(df))).apply(clean_string)
    return df[['modelo','fabricante','maxima_capacidad']]

def transform_df_caracteristicas_radios(df):
    df = df.rename(columns={c:normalize_colname(c) for c in df.columns})
    # normalizar nombres esperados
    mapping = {
        'modelo':'modelo',
        'banda':'banda_radio',
        'modulacion':'modulacion_radio',
        'frecuencia_minima':'frecuencia_minima',
        'frecuencia_maxima':'frecuencia_maxima',
        'tx_min':'tx_min',
        'tx_max':'tx_max',
        'sensibilidad':'sensibilidad',
        'separacion':'separacion',
        'subbanda':'subbanda_radio'
    }
    cols_to_rename = {k:v for k,v in mapping.items() if k in df.columns}
    df = df.rename(columns=cols_to_rename)
    # convertir numericos
    for c in ['frecuencia_minima','frecuencia_maxima','tx_min','tx_max','sensibilidad']:
        if c in df.columns:
            df[c] = df[c].apply(parse_numeric)
    return df[[c for c in ['modelo','banda_radio','modulacion_radio','frecuencia_minima','frecuencia_maxima','tx_min','tx_max','sensibilidad','separacion','subbanda_radio'] if c in df.columns]]

def transform_df_modelos_antenas(df):
    df = df.rename(columns={c:normalize_colname(c) for c in df.columns})
    mapping = {
        'modelo':'modelo',
        'fabricante':'fabricante',
        'diametro':'diametro',
        'ganancia':'ganancia',
        'apertura_lobulo':'apertura_lobulo',
        'frecuencia_minima':'frecuencia_minima',
        'frecuencia_maxima':'frecuencia_maxima',
        'tipo':'tipo',
        'tipo_desempeno':'tipo_desempeo'
    }
    cols_to_rename = {k:v for k,v in mapping.items() if k in df.columns}
    df = df.rename(columns=cols_to_rename)
    for c in ['diametro','ganancia','apertura_lobulo','frecuencia_minima','frecuencia_maxima']:
        if c in df.columns:
            df[c] = df[c].apply(parse_numeric)
    return df[[c for c in ['modelo','fabricante','diametro','ganancia','apertura_lobulo','frecuencia_minima','frecuencia_maxima','tipo','tipo_desempeo'] if c in df.columns]]

def transform_df_estacioness(df):
    df = df.rename(columns={c:normalize_colname(c) for c in df.columns})
    mapping = {
        'nombre_estacion':'nombre_estacion', 
        'direccion':'direccion',
        'departamento':'departamento',
        'municipio':'municipio',
        'longitud':'longitud',
        'latitud':'latitud',
        'altura_del_sitio':'altura_del_sitio',
        'codigosistemaposc':'codigosistemaposc',
        'regional':'regional'
    }
    cols_to_rename = {k:v for k,v in mapping.items() if k in df.columns}
    df = df.rename(columns=cols_to_rename)
    # aplicar limpieza
    for c in ['nombre_estacion','direccion','departamento','municipio','regional']:
        if c in df.columns:
            df[c] = df[c].apply(clean_string)
    for c in ['longitud','latitud','altura_del_sitio','codigosistemaposc']:
        if c in df.columns:
            df[c] = df[c].apply(parse_numeric)
    return df

# Aplicar transformaciones (si los dataframes tienen datos)
df_mw_t = transform_df_mw(df_mw.copy())
df_modelos_radios_t = transform_df_modelos_radios(df_modelos_radios.copy())
df_caracteristicas_radios_t = transform_df_caracteristicas_radios(df_caracteristicas_radios.copy())
df_modelos_antenas_t = transform_df_modelos_antenas(df_modelos_antenas.copy())
df_estaciones_t = transform_df_estacioness(df_estaciones.copy())

print('Transformaciones aplicadas. Filas resultantes:')
print('df_mw_t', len(df_mw_t))
print('df_modelos_radios_t', len(df_modelos_radios_t))
print('df_caracteristicas_radios_t', len(df_caracteristicas_radios_t))
print('df_modelos_antenas_t', len(df_modelos_antenas_t))
print('df_estaciones_t', len(df_estaciones_t))
df_mw_t.head(5)

#df_modelos_radios_t.head(5)
#df_caracteristicas_radios_t.head(5)
#df_modelos_antenas_t.head(5)

#df_mw_t['capacidad_total_enlace']
#df_estaciones_t.head(5)

Transformaciones aplicadas. Filas resultantes:
df_mw_t 8797
df_modelos_radios_t 132
df_caracteristicas_radios_t 281
df_modelos_antenas_t 347
df_estaciones_t 10055


Unnamed: 0,nombre_estacin_a,nombre_estacin_b,frecuencia_tx_a,frecuencia_tx_b,es_frecuencia_principal,ancho_banda,potencia_tx,potencia_rx,tipo_redundancia,tipo_modulacin,...,modulacion_minima,velocidad_tx_max,velocidad_tx_min,banda,subbanda,separacion_frecuencias,indice_diferenciador,capa,odu,fabricante
0,AMA0001.LETICIA,AMA7001.SAN_JORGE,7289.0,7128.0,1.0,7.0,31.0,-25.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat
1,AMA7005.NARANJALES,AMA7006.SAN JUAN DEL SOCO,7296.0,7135.0,1.0,7.0,25.0,-31.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat
2,AMA7011.PUERTO PEREA,AMA7010.PUERTO REYES,13020.5,12754.5,1.0,7.0,21.0,-32.0,1+1 HS,256QAM,...,Desconocida,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat
3,AMA7019.SAN _JORGE 2,AMA0001.LETICIA,7131.5,7292.5,1.0,14.0,25.0,-35.8,1+0,256QAM,...,Desconocida,0.0,0.0,7 GHz,G,161.0,,OBLIGACIONES 700,IAG3,Aviat
4,AMA7019.SAN _JORGE 2,AMA7020.PICHUNA_KM18,13027.5,12761.5,1.0,7.0,21.0,-31.0,1+0,256QAM,...,Desconocida,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat


In [8]:
"""
# --- PASO CLAVE DE LIMPIEZA ---
# Convertir todos los numpy.nan a None para que SQLAlchemy los interprete como NULL.
# Usamos .copy() para evitar SettingWithCopyWarning
df_mw_t = df_mw_t.where(pd.notna(df_mw_t), None).copy()
df_modelos_radios_t = df_modelos_radios_t.where(pd.notna(df_modelos_radios_t), None).copy()
df_caracteristicas_radios_t = df_caracteristicas_radios_t.where(pd.notna(df_caracteristicas_radios_t), None).copy()
df_modelos_antenas_t = df_modelos_antenas_t.where(pd.notna(df_modelos_antenas_t), None).copy()
print('DataFrames limpiados (nan -> None).')
"""



In [7]:
def clean_df(df: pd.DataFrame) -> pd.DataFrame:
        # Asegura que todos los valores nulos sean np.nan primero
        # 1. Crear una copia para evitar advertencias de SettingWithCopyWarning
        df_cleaned = df.copy()

        # 2. Convertir explícitamente cadenas vacías o espacios a np.nan para estandarizar
        df_cleaned.replace({"": np.nan, " ": np.nan}, inplace=True)
        
        # Luego, convierte np.nan a None
        return df_cleaned.where(pd.notna(df_cleaned), None).copy()

df_mw_t = clean_df(df_mw_t)
df_modelos_radios_t = clean_df(df_modelos_radios_t)
df_caracteristicas_radios_t = clean_df(df_caracteristicas_radios_t)
df_modelos_antenas_t = clean_df(df_modelos_antenas_t )
df_estaciones_t = clean_df(df_estaciones_t )

df_estaciones_t.head(5)


Unnamed: 0,nombre_estacion,direccion,departamento,municipio,longitud,latitud,altura_del_sitio,codigosistemaposc,nombre_custodio,celular_custodio,telefono_fijo_custodio,acceso,inforelacionada_url,observaciones,capa,regional
0,#ABB_Onnet,CRA 51 49-59 piso 9 Edificio Bancolombia (Cont...,Antioquia,Medellín,-75.562577,6.270854,10.0,4326.0,,,,,,,COLOMBIAMOVIL,Desconocido
1,14BOG_NewSite14,Sitio papa Bogotá 14,Bogotá,Bogotá D.C.,-74.092022,4.656544,12.0,4326.0,,,,,,,COLOMBIAMOVIL,Desconocido
2,158106.CRUZ_DE_AMARILLO,Cerro Cruz de Amarillo,Nariño,Tangua,-77.315614,1.12622,1500.0,4326.0,,,,SITIO ATC,,,OBLIGACIONES 700,Suroccidente
3,158735_Muzo M,Muzo M,Boyacá,Quipama,-74.18,5.52222,188.0,4326.0,,,,,,,OBLIGACIONES 700,Suroccidente
4,158989.Santa Rosa de Osos,158989.Santa Rosa de Osos,Antioquia,Santa Rosa De Osos,-75.464581,6.642781,2579.25,4326.0,,,,,,,OBLIGACIONES 700,Noroccidente


In [8]:

# Convertir NaN → None en todos los dataframes antes de insertar
df_modelos_radios_t = df_modelos_radios_t.where(df_modelos_radios_t.notna(), None)
df_caracteristicas_radios_t = df_caracteristicas_radios_t.where(df_caracteristicas_radios_t.notna(), None)
df_modelos_antenas_t = df_modelos_antenas_t.where(df_modelos_antenas_t.notna(), None)
df_mw_t = df_mw_t.where(df_mw_t.notna(), None)
df_estaciones_t = df_estaciones_t.where(df_estaciones_t.notna(), None)

#df_mw_t.head(5)
df_estaciones_t.head(5)
#df_mw_t.columns
df_modelos_antenas.columns
df_mw_t.columns


Index(['nombre_estacin_a', 'nombre_estacin_b', 'frecuencia_tx_a',
       'frecuencia_tx_b', 'es_frecuencia_principal', 'ancho_banda',
       'potencia_tx', 'potencia_rx', 'tipo_redundancia', 'tipo_modulacin',
       'fecha_puesta_servicio', 'capacidad_total_enlace',
       'cantidad_puertos_eth', 'capacidad_por_puerto_eth', 'modelo_radio',
       'jerarqua', 'modelo_antena_a', 'modelo_antena_b', 'altura_antena_a',
       'altura_antena_b', 'polarizacin_antena', 'modulacion_adaptativa',
       'modulacion_maxima', 'modulacion_minima', 'velocidad_tx_max',
       'velocidad_tx_min', 'banda', 'subbanda', 'separacion_frecuencias',
       'indice_diferenciador', 'capa', 'odu', 'fabricante'],
      dtype='object')

## 5-b) Cálculo de capacidad propia

A continuación se definen las instrucciones en base a la tabla con el estándar RFC 2544 para calcular la capacidad por enlace y añadirlo al dataframe de enlaces

In [None]:
"""
# ============================
# TABLA NORMAL RFC2544
# ============================

RFC2544_TABLE = {
    56: {
        "2048": 493.7,
        "1024": 445.5,
        "512": 405.9,
        "256": 363.0,
        "128": 316.7,
        "64": 271.6,
        "32": 226.0,
        "16": 180.8,
        "QPSK": 90.2
    },
    40: {
        "2048": 340.5,
        "1024": 307.2,
        "512": 279.9,
        "256": 250.3,
        "128": 218.3,
        "64": 187.2,
        "32": 155.8,
        "16": 124.6,
        "QPSK": 62.0
    },
    28: {
        "2048": 246.1,
        "1024": 222.0,
        "512": 202.3,
        "256": 180.9,
        "128": 157.7,
        "64": 135.2,
        "32": 112.5,
        "16": 90.0,
        "QPSK": 44.7
    },
    14: {
        "2048": 121.2,
        "1024": 109.4,
        "512": 98.6,
        "256": 88.1,
        "128": 76.8,
        "64": 65.7,
        "32": 54.7,
        "16": 43.7,
        "QPSK": 21.5
    },
    7: {
        "1024": 53.0,
        "512": 47.7,
        "256": 42.6,
        "128": 37.0,
        "64": 31.7,
        "32": 26.3,
        "16": 21.0,
        "QPSK": 10.2
    }
}


# ============================
# TABLA XPIC RFC2544 XPIC
# ============================

RFC2544_XPIC = {
    56: {
        "2048": 897.5,
        "1024": 891.1,
        "512": 840.5,
        "256": 726.1,
        "128": 634.9,
        "64": 542.8,
        "32": 451.3,
        "16": 361.7,
        "QPSK": 180.3
    },
    40: {
        "2048": 681.6,
        "1024": 614.5,
        "512": 531.5,
        "256": 500.6,
        "128": 445.7,
        "64": 391.2,
        "32": 336.6,
        "16": 249.7,
        "QPSK": 124.0
    },
    28: {
        "2048": 500.6,
        "1024": 447.7,
        "512": 386.0,
        "256": 361.7,
        "128": 314.5,
        "64": 268.1,
        "32": 221.9,
        "16": 179.9,
        "QPSK": 89.4
    },
    14: {
        "2048": 242.2,
        "1024": 218.9,
        "512": 185.0,
        "256": 173.2,
        "128": 150.0,
        "64": 127.6,
        "32": 105.5,
        "16": 87.4,
        "QPSK": 44.7
    },
    7: {
        "2048": 106.0,
        "1024": 96.6,
        "512": 81.0,
        "256": 75.8,
        "128": 66.2,
        "64": 56.3,
        "32": 46.7,
        "16": 39.4,
        "QPSK": 21.5
    }
}
"""

Funciones que selecciona la capacidad según ancho de banda, la modulacion y la polarizacion

In [9]:
# =======================================
# FUNCION PARA TOMAR EL ANCHO INMEDIATO INFERIOR
# =======================================

def ancho_valido(ancho):
    disponibles = sorted(RFC2544_TABLE.keys())  # [7,14,28,40,56]

    # Si es menor o igual al mínimo
    if ancho <= disponibles[0]:
        return disponibles[0]

    # Buscar inmediato inferior
    for i in range(len(disponibles)):
        if ancho < disponibles[i]:
            return disponibles[i-1]

    # Si supera el máximo → usar el mayor disponible
    return disponibles[-1]


# =======================================
# FUNCION DE CAPACIDAD POR ENLACE (USA XPIC O NO)
# =======================================

def calcular_capacidad_enlace(row):
    ancho_original = row["ancho_banda_total"]
    mod = str(row["tipo_modulacin"]).upper().replace("QAM", "").strip()

    # Selección de tabla según polarizacion_antena
    if row["polarizacin_antena"].lower() == "crosspolarizada":
        tabla = RFC2544_XPIC
    else:
        tabla = RFC2544_TABLE

    # Normalizar modulación (si no es numérica → QPSK)
    if not mod.isdigit():
        mod = "QPSK"

    # Convertir ancho total al inmediatamente inferior permitido
    ancho = ancho_valido(ancho_original)

    # Calcular capacidad
    return tabla.get(ancho, {}).get(mod, None)


"""
# =======================================
# SUMAR ANCHOS DE BANDA POR ENLACE
# =======================================

df_mw_t["ancho_banda_total"] = (
    df_mw_t.groupby(["nombre_estacion_a", "nombre_estacion_b"])["ancho_banda"]
           .transform("sum")
)


# =======================================
# CALCULAR CAPACIDAD FINAL
# =======================================

df_mw_t["capacidad_calculada"] = df_mw_t.apply(
    calcular_capacidad_enlace,
    axis=1
)
"""



In [10]:
# --- 1) Construir un DataFrame agrupado por ENLACE ---
# Asumimos que el enlace se identifica por ambas estaciones:
df_enlaces = (
    df_mw_t
    .groupby(["nombre_estacin_a", "nombre_estacin_b"], as_index=False)
    .agg({
        "ancho_banda": "sum",               # sumar ancho de todos los canales
        "tipo_modulacin": "first",          # tomar una modulación
        "polarizacin_antena": "first"      # tomar polarización
    })
    .rename(columns={"ancho_banda": "ancho_banda_total"})
)


# --- 2) Crear la columna capacidad_total (por ENLACE) ---
df_enlaces["capacidad_calculada"] = df_enlaces.apply(
    calcular_capacidad_enlace,
    axis=1
)


# --- 3) Pasar la capacidad al dataframe original ---
df_mw_t = df_mw_t.merge(
    df_enlaces[
        ["nombre_estacin_a", "nombre_estacin_b", "capacidad_calculada"]
    ],
    on=["nombre_estacin_a", "nombre_estacin_b"],
    how="left"
)

df_mw_t

Unnamed: 0,nombre_estacin_a,nombre_estacin_b,frecuencia_tx_a,frecuencia_tx_b,es_frecuencia_principal,ancho_banda,potencia_tx,potencia_rx,tipo_redundancia,tipo_modulacin,...,velocidad_tx_max,velocidad_tx_min,banda,subbanda,separacion_frecuencias,indice_diferenciador,capa,odu,fabricante,capacidad_calculada
0,AMA0001.LETICIA,AMA7001.SAN_JORGE,7289.0,7128.0,1.0,7.0,31.0,-25.0,1+1 HS,256QAM,...,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
1,AMA7005.NARANJALES,AMA7006.SAN JUAN DEL SOCO,7296.0,7135.0,1.0,7.0,25.0,-31.0,1+1 HS,256QAM,...,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
2,AMA7011.PUERTO PEREA,AMA7010.PUERTO REYES,13020.5,12754.5,1.0,7.0,21.0,-32.0,1+1 HS,256QAM,...,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
3,AMA7019.SAN _JORGE 2,AMA0001.LETICIA,7131.5,7292.5,1.0,14.0,25.0,-35.8,1+0,256QAM,...,0.0,0.0,7 GHz,G,161.0,,OBLIGACIONES 700,IAG3,Aviat,88.1
4,AMA7019.SAN _JORGE 2,AMA7020.PICHUNA_KM18,13027.5,12761.5,1.0,7.0,21.0,-31.0,1+0,256QAM,...,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8792,,,,,,,,,,,...,,,,,,,,,,
8793,,,,,,,,,,,...,,,,,,,,,,
8794,,,,,,,,,,,...,,,,,,,,,,
8795,,,,,,,,,,,...,,,,,,,,,,


In [11]:
df_mw_t.head(5)
#type(df_mw_t["ancho_banda"][0])

Unnamed: 0,nombre_estacin_a,nombre_estacin_b,frecuencia_tx_a,frecuencia_tx_b,es_frecuencia_principal,ancho_banda,potencia_tx,potencia_rx,tipo_redundancia,tipo_modulacin,...,velocidad_tx_max,velocidad_tx_min,banda,subbanda,separacion_frecuencias,indice_diferenciador,capa,odu,fabricante,capacidad_calculada
0,AMA0001.LETICIA,AMA7001.SAN_JORGE,7289.0,7128.0,1.0,7.0,31.0,-25.0,1+1 HS,256QAM,...,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
1,AMA7005.NARANJALES,AMA7006.SAN JUAN DEL SOCO,7296.0,7135.0,1.0,7.0,25.0,-31.0,1+1 HS,256QAM,...,0.0,0.0,7 GHz,A,161.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
2,AMA7011.PUERTO PEREA,AMA7010.PUERTO REYES,13020.5,12754.5,1.0,7.0,21.0,-32.0,1+1 HS,256QAM,...,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat,42.6
3,AMA7019.SAN _JORGE 2,AMA0001.LETICIA,7131.5,7292.5,1.0,14.0,25.0,-35.8,1+0,256QAM,...,0.0,0.0,7 GHz,G,161.0,,OBLIGACIONES 700,IAG3,Aviat,88.1
4,AMA7019.SAN _JORGE 2,AMA7020.PICHUNA_KM18,13027.5,12761.5,1.0,7.0,21.0,-31.0,1+0,256QAM,...,0.0,0.0,13 GHz,S,266.0,,OBLIGACIONES 700,IAG3,Aviat,42.6


In [12]:
df_mw_t['capacidad_calculada']

0       42.6
1       42.6
2       42.6
3       88.1
4       42.6
        ... 
8792     NaN
8793     NaN
8794     NaN
8795     NaN
8796     NaN
Name: capacidad_calculada, Length: 8797, dtype: float64

## 6) Definición DDL (MySQL) — crear tablas

A continuación se definen las instrucciones SQL para crear las tablas propuestas. Se usan tipos adecuados para MySQL.


In [13]:
DDL_RADIOS_MODELOS = '''
CREATE TABLE IF NOT EXISTS radios_modelos (
  id_radio INT AUTO_INCREMENT PRIMARY KEY,
  modelo VARCHAR(150) NOT NULL,
  fabricante VARCHAR(150),
  maxima_capacidad VARCHAR(100),
  UNIQUE KEY uq_modelo (modelo)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
'''

DDL_RADIOS_CARACTERISTICAS = '''
CREATE TABLE IF NOT EXISTS radios_caracteristicas (
  id_caracteristica INT AUTO_INCREMENT PRIMARY KEY,
  modelo_id INT NOT NULL,
  banda_radio VARCHAR(100),
  modulacion_radio VARCHAR(100),
  frecuencia_minima DECIMAL(10,3),
  frecuencia_maxima DECIMAL(10,3),
  tx_min DECIMAL(10,2),
  tx_max DECIMAL(10,2),
  sensibilidad DECIMAL(10,2),
  separacion VARCHAR(100),
  subbanda_radio VARCHAR(100),
  FOREIGN KEY (modelo_id) REFERENCES radios_modelos(id_radio) ON DELETE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
'''

DDL_ANTENAS_MODELOS = '''
CREATE TABLE IF NOT EXISTS antenas_modelos (
  id_antena INT AUTO_INCREMENT PRIMARY KEY,
  modelo VARCHAR(150) NOT NULL,
  fabricante VARCHAR(150),
  diametro DECIMAL(6,2),
  ganancia DECIMAL(6,2),
  apertura_lobulo DECIMAL(6,2),
  frecuencia_minima DECIMAL(10,3),
  frecuencia_maxima DECIMAL(10,3),
  tipo VARCHAR(100),
  tipo_desempeno VARCHAR(100),
  UNIQUE KEY uq_modelo_antena (modelo)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
'''

DDL_ESTACIONES = '''
CREATE TABLE IF NOT EXISTS estaciones (
    id_estacion INT AUTO_INCREMENT PRIMARY KEY,
    nombre_estacion VARCHAR(255) UNIQUE,
    direccion VARCHAR(255),
    departamento VARCHAR(150),
    municipio VARCHAR(150),
    longitud DECIMAL(12,8),
    latitud DECIMAL(12,8),
    altura_del_sitio INT,
    codigosistemaposc VARCHAR(100),
    regional VARCHAR(100)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
'''

DDL_ENLACES_MW = '''
CREATE TABLE IF NOT EXISTS enlaces_mw (
  id_enlace INT AUTO_INCREMENT PRIMARY KEY,

  -- Relaciones a estaciones
  id_estacion_a INT NOT NULL,
  id_estacion_b INT NOT NULL,

  ancho_banda DECIMAL (10,3),
  tipo_modulacion_maxima VARCHAR(100),
  capacidad_total_enlace INT,
  capacidad_calculada DECIMAL (10,1),
  modulacion_adaptativa BOOLEAN,
  frecuencia_tx_a DECIMAL(10,3),
  frecuencia_tx_b DECIMAL(10,3),
  potencia_rx DECIMAL(10,2),
  tipo_redundancia VARCHAR(100),
  cantidad_puertos_eth INT,
  capacidad_por_puerto_eth VARCHAR(100),
  banda VARCHAR(100),
  subbanda VARCHAR(100),
  separacion_frecuencias VARCHAR(100),

  -- Relaciones a modelos de equipos
  modelo_radio_id INT,
  modelo_antena_a_id INT,
  modelo_antena_b_id INT,

  altura_antena_a DECIMAL(6,2),
  altura_antena_b DECIMAL(6,2),
  polarizacion_antena VARCHAR(100),
  odu VARCHAR(100),

  FOREIGN KEY (id_estacion_a) REFERENCES estaciones(id_estacion),
  FOREIGN KEY (id_estacion_b) REFERENCES estaciones(id_estacion),
  FOREIGN KEY (modelo_radio_id) REFERENCES radios_modelos(id_radio),
  FOREIGN KEY (modelo_antena_a_id) REFERENCES antenas_modelos(id_antena),
  FOREIGN KEY (modelo_antena_b_id) REFERENCES antenas_modelos(id_antena)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
'''

print('DDL corregidos y consistentes con relaciones estaciones <-> enlaces_mw.')


DDL corregidos y consistentes con relaciones estaciones <-> enlaces_mw.


## 7) Crear las tablas en MySQL y poblar catálogos (modelos)

La siguiente celda conecta a MySQL, crea las tablas y carga los catálogos (radios y antenas) asegurando unicidad.

In [14]:
def create_and_populate_db(conn_str, df_radios, df_carac, df_antenas, df_mw, df_estac):
    engine = sqlalchemy.create_engine(conn_str)

    counte = 0  # ← Contador real estaciones creadas

    # -- NUEVO: función corregida --
    def get_or_create_estacion(conn, nombre):
        nonlocal counte
        nombre = fix_value(nombre)
        if not nombre:
            return None

        id_est = conn.execute(text(
            "SELECT id_estacion FROM estaciones WHERE nombre_estacion = :n"
        ), {'n': nombre}).scalar()

        if id_est is None:
            conn.execute(text("""
                INSERT INTO estaciones (
                    nombre_estacion, direccion, departamento, municipio,
                    longitud, latitud, altura_del_sitio, codigosistemaposc, regional
                ) VALUES (
                    :n, NULL, NULL, NULL,
                    NULL, NULL, NULL, NULL, NULL
                )
            """), {'n': nombre})

            id_est = conn.execute(text(
                "SELECT id_estacion FROM estaciones WHERE nombre_estacion = :n"
            ), {'n': nombre}).scalar()

            counte += 1
            print(f"➕ Estación creada automáticamente: {nombre}")

        return id_est

    with engine.begin() as conn:

        # Crear tablas
        conn.execute(text(DDL_ESTACIONES))
        conn.execute(text(DDL_RADIOS_MODELOS))
        conn.execute(text(DDL_RADIOS_CARACTERISTICAS))
        conn.execute(text(DDL_ANTENAS_MODELOS))
        conn.execute(text(DDL_ENLACES_MW))
        print('✅ Tablas creadas (si no existían)')

        # Poblar estaciones catálogo
        for _, row in df_estac.iterrows():
            nombre = fix_value(row.get('nombre_estacion'))
            if not nombre:
                continue

            existe = conn.execute(text(
                'SELECT id_estacion FROM estaciones WHERE nombre_estacion = :nombre'
            ), {'nombre': nombre}).scalar()

            if existe is None:
                conn.execute(text('''
                    INSERT INTO estaciones (nombre_estacion, direccion, departamento, municipio, longitud, latitud, altura_del_sitio, codigosistemaposc, regional)
                    VALUES (:nombre, :direccion, :departamento, :municipio, :longitud, :latitud, :altura_del_sitio, :codigosistemaposc, :regional)
                '''), {
                    'nombre': nombre,
                    'direccion': fix_value(row.get('direccion')),
                    'departamento': fix_value(row.get('departamento')),
                    'municipio': fix_value(row.get('municipio')),
                    'longitud': fix_value(row.get('longitud')),
                    'latitud': fix_value(row.get('latitud')),
                    'altura_del_sitio': fix_value(row.get('altura_del_sitio')),
                    'codigosistemaposc': fix_value(row.get('codigosistemaposc')),
                    'regional': fix_value(row.get('regional'))
                })
        print('✅ Catálogo estaciones poblado')

        # Poblar radios_modelos
        for _, row in df_radios.iterrows():
            modelo = fix_value(row.get('modelo'))
            if not modelo:
                continue

            existe = conn.execute(text(
                'SELECT id_radio FROM radios_modelos WHERE modelo = :m'
            ), {'m': modelo}).scalar()

            if existe is None:
                conn.execute(text('''
                    INSERT INTO radios_modelos (modelo, fabricante, maxima_capacidad)
                    VALUES (:modelo, :fabricante, :capacidad)
                '''), {
                    'modelo': modelo,
                    'fabricante': fix_value(row.get('fabricante')),
                    'capacidad': fix_value(row.get('maxima_capacidad'))
                })
        print('✅ Catálogo radios_modelos poblado')

        # Poblar radios_caracteristicas
        for _, row in df_carac.iterrows():
            modelo = fix_value(row.get('modelo'))
            if not modelo:
                continue

            id_radio = conn.execute(text(
                'SELECT id_radio FROM radios_modelos WHERE modelo = :m'
            ), {'m': modelo}).scalar()

            if id_radio is None:
                conn.execute(text('INSERT INTO radios_modelos (modelo) VALUES (:m)'), {'m': modelo})
                id_radio = conn.execute(text('SELECT id_radio FROM radios_modelos WHERE modelo = :m'),
                                        {'m': modelo}).scalar()

            conn.execute(text('''
                INSERT INTO radios_caracteristicas (
                    modelo_id, banda_radio, modulacion_radio, frecuencia_minima, frecuencia_maxima,
                    tx_min, tx_max, sensibilidad, separacion, subbanda_radio
                ) VALUES (
                    :modelo_id, :banda_radio, :modulacion_radio, :f_min, :f_max,
                    :tx_min, :tx_max, :sens, :sep, :sub
                )
            '''), {
                'modelo_id': id_radio,
                'banda_radio': fix_value(row.get('banda_radio')),
                'modulacion_radio': fix_value(row.get('modulacion_radio')),
                'f_min': fix_value(row.get('frecuencia_minima')),
                'f_max': fix_value(row.get('frecuencia_maxima')),
                'tx_min': fix_value(row.get('tx_min')),
                'tx_max': fix_value(row.get('tx_max')),
                'sens': fix_value(row.get('sensibilidad')),
                'sep': fix_value(row.get('separacion')),
                'sub': fix_value(row.get('subbanda_radio'))
            })
        print('✅ Catálogo radios_caracteristicas poblado')

        # Poblar antenas_modelos
        for _, row in df_antenas.iterrows():
            modelo = fix_value(row.get('modelo'))
            if not modelo:
                continue

            existe = conn.execute(text(
                'SELECT id_antena FROM antenas_modelos WHERE modelo = :m'
            ), {'m': modelo}).scalar()

            if existe is None:
                conn.execute(text('''
                    INSERT INTO antenas_modelos (modelo, fabricante, diametro, ganancia, apertura_lobulo,
                        frecuencia_minima, frecuencia_maxima, tipo, tipo_desempeno)
                    VALUES (:modelo, :fabricante, :diametro, :ganancia, :apertura_lobulo,
                        :f_min, :f_max, :tipo, :td)
                '''), {
                    'modelo': modelo,
                    'fabricante': fix_value(row.get('fabricante')),
                    'diametro': fix_value(row.get('diametro')),
                    'ganancia': fix_value(row.get('ganancia')),
                    'apertura_lobulo': fix_value(row.get('apertura_lobulo')),
                    'f_min': fix_value(row.get('frecuencia_minima')),
                    'f_max': fix_value(row.get('frecuencia_maxima')),
                    'tipo': fix_value(row.get('tipo')),
                    'td': fix_value(row.get('tipo_desempeo'))
                })
        print('✅ Catálogo antenas_modelos poblado')

        # Poblar enlaces_mw
        for _, row in df_mw.iterrows():
            est_a = get_or_create_estacion(conn, row.get('nombre_estacin_a'))
            est_b = get_or_create_estacion(conn, row.get('nombre_estacin_b'))

            # Validación clave → evitar IntegrityError
            if est_a is None or est_b is None:
                print(f"⚠️ Enlace omitido por estación faltante → A: {row.get('nombre_estacin_a')} | B: {row.get('nombre_estacin_b')}")
                continue

            mr = conn.execute(text('SELECT id_radio FROM radios_modelos WHERE modelo = :m'),
                              {'m': fix_value(row.get('modelo_radio'))}).scalar()
            ma = conn.execute(text('SELECT id_antena FROM antenas_modelos WHERE modelo = :m'),
                              {'m': fix_value(row.get('modelo_antena_a'))}).scalar()
            mb = conn.execute(text('SELECT id_antena FROM antenas_modelos WHERE modelo = :m'),
                              {'m': fix_value(row.get('modelo_antena_b'))}).scalar()

            conn.execute(text('''
                INSERT INTO enlaces_mw (
                    id_estacion_a, id_estacion_b, ancho_banda, tipo_modulacion_maxima,
                    capacidad_total_enlace, capacidad_calculada, modulacion_adaptativa,
                    frecuencia_tx_a, frecuencia_tx_b, potencia_rx,
                    tipo_redundancia, cantidad_puertos_eth, capacidad_por_puerto_eth,
                    banda, subbanda, separacion_frecuencias,
                    modelo_radio_id, modelo_antena_a_id, modelo_antena_b_id,
                    altura_antena_a, altura_antena_b, polarizacion_antena, odu
                ) VALUES (
                    :id_a, :id_b, :ancho_banda, :modmax,
                    :capacidad, :capcalc, :adapt,
                    :tx_a, :tx_b, :rx,
                    :redund, :puertos, :cap_puerto,
                    :banda, :subbanda, :sep,
                    :mr, :ma, :mb,
                    :alt_a, :alt_b, :pol, :odu
                )
            '''), {
                'id_a': est_a,
                'id_b': est_b,
                'ancho_banda': fix_value(row.get('ancho_banda')),
                'modmax': fix_value(row.get('tipo_modulacin')),
                'capacidad': fix_value(row.get('capacidad_total_enlace')),
                'capcalc': fix_value(row.get('capacidad_calculada')),
                'adapt': fix_value(row.get('modulacion_adaptativa')),
                'tx_a': fix_value(row.get('frecuencia_tx_a')),
                'tx_b': fix_value(row.get('frecuencia_tx_b')),
                'rx': fix_value(row.get('potencia_rx')),
                'redund': fix_value(row.get('tipo_redundancia')),
                'puertos': fix_value(row.get('cantidad_puertos_eth')),
                'cap_puerto': fix_value(row.get('capacidad_por_puerto_eth')),
                'banda': fix_value(row.get('banda')),
                'subbanda': fix_value(row.get('subbanda')),
                'sep': fix_value(row.get('separacion_frecuencias')),
                'mr': mr,
                'ma': ma,
                'mb': mb,
                'alt_a': fix_value(row.get('altura_antena_a')),
                'alt_b': fix_value(row.get('altura_antena_b')),
                'pol': fix_value(row.get('polarizacin_antena')),
                'odu': fix_value(row.get('odu'))
            })

        print('✅ Catálogo enlaces_mw poblado')
        print('➕ Estaciones creadas automáticamente:', counte)

    engine.dispose()
    print('🔌 Conexión cerrada')
    print('🎯 Carga completada correctamente.')


## 8) Ejecución (NO EJECUTAR si no se ha editado la conexión)

Se ejecuta la siguiente celda con `MYSQL_CONN_STR` real para crear tablas y poblar la base con los dataframes como argumentos.

In [15]:
# Ejemplo de ejecución (descomentar y editar la cadena de conexión antes de ejecutar)
create_and_populate_db(MYSQL_CONN_STR, df_modelos_radios_t, df_caracteristicas_radios_t, df_modelos_antenas_t, df_mw_t, df_estaciones_t)
#print('Revisa la celda anterior — descomenta y actualiza la cadena para ejecutar la inserción en MySQL')

✅ Tablas creadas (si no existían)
✅ Catálogo estaciones poblado
✅ Catálogo radios_modelos poblado
✅ Catálogo radios_caracteristicas poblado
✅ Catálogo antenas_modelos poblado
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: None | B: None
⚠️ Enlace omitido por estación faltante → A: 

## 9) Verificaciones y consultas SQL de ejemplo

Consultas útiles para chequear la integridad de los datos en MySQL:

- Listar radios con sus características:
```sql
SELECT r.modelo, r.fabricante, c.banda_radio, c.modulacion_radio, c.frecuencia_minima, c.frecuencia_maxima
FROM radios_modelos r
JOIN radios_caracteristicas c ON c.modelo_id = r.id_radio;
```

- Enlaces con nombres de modelos y antenas:
```sql
SELECT e.id_enlace, e.nombre_estacion_a, e.nombre_estacion_b, r.modelo AS modelo_radio, a1.modelo AS antena_a, a2.modelo AS antena_b
FROM enlaces_mw e
LEFT JOIN radios_modelos r ON r.id_radio = e.modelo_radio_id
LEFT JOIN antenas_modelos a1 ON a1.id_antena = e.modelo_antena_a_id
LEFT JOIN antenas_modelos a2 ON a2.id_antena = e.modelo_antena_b_id;
```

## 10) Diagrama físico (Mermaid)

El siguiente bloque muestra el diagrama ER en sintaxis Mermaid que también puedes pegar en cualquier visor compatible.


```mermaid
erDiagram
    radios_modelos ||--o{ radios_caracteristicas : tiene
    radios_modelos ||--o{ enlaces_mw : se_usa_en
    antenas_modelos ||--o{ enlaces_mw : instalada_en

    radios_modelos {
        int id_radio PK
        string modelo
        string fabricante
        string maxima_capacidad
    }

    radios_caracteristicas {
        int id_caracteristica PK
        int modelo_id FK
        string banda_radio
        string modulacion_radio
        float frecuencia_min
        float frecuencia_max
        float tx_min
        float tx_max
        float sensibilidad
    }

    antenas_modelos {
        int id_antena PK
        string modelo
        string fabricante
        float diametro
        float ganancia
        float apertura_lobulo
    }

    enlaces_mw {
        int id_enlace PK
        string nombre_estacion_a
        string nombre_estacion_b
        string 
        string tipo_modulacion_maxima
        boolean modulacion_adaptativa
        int capacidad_total_enlace
        float frecuencia_tx_a
        float frecuencia_tx_b
        float potencia_rx
        int modelo_radio_id FK
        int modelo_antena_a_id FK
        int modelo_antena_b_id FK
    }
```


[![](https://mermaid.ink/img/pako:eNqtVttu2zAM_RVDQN_SInXqpvFbehlWrJehGPYwBDBoi02E2ZIgy1vWNF-1T9iPTZYdx7GVFMXmN4uHEnlIHmlFEkGRhATVNYO5gmzGZ9wznwLKRB5lxpyK3FtVq-V3-_DFYzSyAO_zp63h6_Tp6uP0yat8-uvPECuWANfo8IElyyBKQELCKNAKse5Ek4CCRKNiuTYbuaLaReyEVyKq0CJGvQ-OwGPgFKrEnFkVqQlO8C7i-ubq9n565z0rTArkCYMoY9ykcxhiM-5D9LL0dq_Dsr-eI89ZzNIta-2oc5QlIyZqh62Iexk3jJdl4nCoASrEP3fAJg_KIEOtHLzOgUNJWd8CEpUuFESpiIv0v5dkE7ZmUrhXI4o5ZhJ5lz7MtWUdXcxtjE7uuMhihQ2mD6DMRLzHVFZbGx65dnVwwVnCpKt1U8HnTBfUYQG9ayhzgNSybooc5Uy7psXICpuL3IwhZiBFnvQhCucmCUi7zHEzZWga76eLOWvsjXWL0wh2RrtrjZ2Db9prISI7DHvq3Jr-bpeURzS6FWmhIa3j7LO5xSWQJmbH9oGXj493N9OHttIYu9SmAj8ON67RhjcBcR8gha7MarknbYW0MKTsTl-VMNc2D1mYETTSjHrh6IImXSlUDXUj93C_kahDwhZt88ydam_lrav5LXslZBG8DYm7kEaIqoHY7PQWIO7nI0UKir3UZbewPsg0Rmdajo68J0xrqdlzd7--Hh-L1b47NPRm5NQDow5mBvIZcShYvUFrMkunCvDnN_empdc7fS63J7nD7XhWVqNwFXzr3b2o3O71ZdVE-i4vGysZkLlilIRaFTggGaoMyl9iVWpG9AIznJHSjYL6XrqsjY8E_k2IbOOmRDFfkPAZ0tz8FZKCxvrl1UCQU1RXouCahMHIbkHCFVmS0PeDE39yHvjBZDIZ-sPzAflFwtPR-GQ49sd-EIxOff_sLFgPyIs9dHgyGo9G_njo-xfB5OLswh8QpEwLdV-9--zzb_0XBEoUCg?type=png)](https://mermaid.live/edit#pako:eNqtVttu2zAM_RVDQN_SInXqpvFbehlWrJehGPYwBDBoi02E2ZIgy1vWNF-1T9iPTZYdx7GVFMXmN4uHEnlIHmlFEkGRhATVNYO5gmzGZ9wznwLKRB5lxpyK3FtVq-V3-_DFYzSyAO_zp63h6_Tp6uP0yat8-uvPECuWANfo8IElyyBKQELCKNAKse5Ek4CCRKNiuTYbuaLaReyEVyKq0CJGvQ-OwGPgFKrEnFkVqQlO8C7i-ubq9n565z0rTArkCYMoY9ykcxhiM-5D9LL0dq_Dsr-eI89ZzNIta-2oc5QlIyZqh62Iexk3jJdl4nCoASrEP3fAJg_KIEOtHLzOgUNJWd8CEpUuFESpiIv0v5dkE7ZmUrhXI4o5ZhJ5lz7MtWUdXcxtjE7uuMhihQ2mD6DMRLzHVFZbGx65dnVwwVnCpKt1U8HnTBfUYQG9ayhzgNSybooc5Uy7psXICpuL3IwhZiBFnvQhCucmCUi7zHEzZWga76eLOWvsjXWL0wh2RrtrjZ2Db9prISI7DHvq3Jr-bpeURzS6FWmhIa3j7LO5xSWQJmbH9oGXj493N9OHttIYu9SmAj8ON67RhjcBcR8gha7MarknbYW0MKTsTl-VMNc2D1mYETTSjHrh6IImXSlUDXUj93C_kahDwhZt88ydam_lrav5LXslZBG8DYm7kEaIqoHY7PQWIO7nI0UKir3UZbewPsg0Rmdajo68J0xrqdlzd7--Hh-L1b47NPRm5NQDow5mBvIZcShYvUFrMkunCvDnN_empdc7fS63J7nD7XhWVqNwFXzr3b2o3O71ZdVE-i4vGysZkLlilIRaFTggGaoMyl9iVWpG9AIznJHSjYL6XrqsjY8E_k2IbOOmRDFfkPAZ0tz8FZKCxvrl1UCQU1RXouCahMHIbkHCFVmS0PeDE39yHvjBZDIZ-sPzAflFwtPR-GQ49sd-EIxOff_sLFgPyIs9dHgyGo9G_njo-xfB5OLswh8QpEwLdV-9--zzb_0XBEoUCg)

----
### Resultado

He creado este notebook con: instrucciones, código de carga, normalización, DDL y funciones para poblar MySQL.
Descarga el archivo `.ipynb`, edítalo (rutas y conexión), y ejecútalo en tu entorno local.
