In [3]:
  # üìå Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')

# üìå Importar librer√≠as necesarias
import pandas as pd
import numpy as np

# üìå Definir la ruta del archivo guardado en el quinto paso
ruta_archivo = "/content/drive/MyDrive/Datos/5_Base_Imputadas_Cuentas.parquet"

# üìå Cargar la base de datos
base_datos = pd.read_parquet(ruta_archivo)

# üìå Mostrar informaci√≥n general de la base
print("üîé Informaci√≥n general de la base de datos:")
print(base_datos.info())

# üìå Vista previa de los primeros registros
print("\nüîé Vista previa de la base de datos:")
print(base_datos.head())

# üîπ **Crear una copia de la base para los indicadores**
base_indicadores = base_datos.copy()

# üìå Ver informaci√≥n general de la base de datos
print("\nüîé **Informaci√≥n general de la base de datos antes de calcular indicadores:**")
print(base_indicadores.info())

# üìå Ver lista de columnas disponibles
print("\nüìã **Lista de columnas disponibles en la base de datos:**")
print(base_indicadores.columns)

# üìå Mostrar los primeros registros para revisar valores
print("\nüîç **Vista previa de los primeros registros:**")
print(base_indicadores.head())

# üìå Verificar si las columnas clave existen antes de empezar los c√°lculos
columnas_necesarias = [
    'EBIT', 'DyA', 'AC', 'PCP', 'I', 'PN', 'AT', 'PT', 'PLP', 'GF', 'GA',
    'CPP', 'CPC', 'FCL', 'V'
]
faltantes = [col for col in columnas_necesarias if col not in base_indicadores.columns]

if faltantes:
    print(f"\nüö® **Columnas faltantes antes de calcular indicadores:** {faltantes}")
else:
    print("\n‚úÖ **Todas las columnas necesarias est√°n presentes en la base de datos.**")

# üìå Revisar tipos de datos de las columnas clave
print("\nüìä **Tipos de datos de las columnas clave:**")
print(base_indicadores[columnas_necesarias].dtypes)


# ==============================================================================
# üìå SECCI√ìN 1: C√ÅLCULO DE INDICADORES DE LIQUIDEZ
# ==============================================================================

# üîπ **C√°lculo de LC (Liquidez Corriente)**
# üìå F√≥rmula: LC = AC / PCP
# üìå Interpretaci√≥n:
#    - Mide la capacidad de la empresa para cubrir sus pasivos corrientes con sus activos corrientes.
#    - Un valor alto sugiere buena liquidez, mientras que un valor bajo puede indicar problemas de solvencia a corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si AC = 0 y PCP = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin activos ni pasivos corrientes. Puede ser una empresa inactiva o con datos inconsistentes.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se quiere revisar manualmente empresas sin estructura financiera clara.
#      - Imputar con **1** en modelos num√©ricos si se asume que la empresa tiene liquidez neutra sin operaciones.
#
# 2Ô∏è‚É£ **Si AC > 0 y PCP = 0 ‚Üí ‚àû**
#    - Empresa sin pasivos corrientes pero con activos corrientes (totalmente l√≠quida).
#
# 3Ô∏è‚É£ **Si PCP > 0 (sin importar AC) ‚Üí Normal**
#    - Se calcula la divisi√≥n directamente, incluyendo el caso AC = 0 (resultado = 0).

base_indicadores['LC'] = np.where(
    (base_indicadores['AC'] == 0) & (base_indicadores['PCP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PCP'] == 0), np.inf,  # Caso 2: ‚àû (cuando PCP = 0)
        base_indicadores['AC'] / base_indicadores['PCP']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en LC**
casos_normales_LC = ((base_indicadores['PCP'] > 0)).sum()  # Casos normales incluyen AC = 0
casos_nan_LC = ((base_indicadores['AC'] == 0) & (base_indicadores['PCP'] == 0)).sum()
casos_inf_LC = ((base_indicadores['PCP'] == 0) & (base_indicadores['AC'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en LC (Liquidez Corriente):**")
print(f"‚úÖ Casos normales (incluye ceros): {casos_normales_LC}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_LC} ‚Üí üìå Puede representar empresas sin operaciones claras. Se recomienda revisar o imputar con 1 en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_LC}")

# üîπ **C√°lculo de PA (Prueba √Åcida)**
# üìå F√≥rmula: PA = (AC - I) / PCP
# üìå Interpretaci√≥n:
#    - Mide la capacidad de la empresa para cubrir sus pasivos corrientes **sin depender de sus inventarios**.
#    - Es una prueba m√°s estricta de liquidez en comparaci√≥n con la raz√≥n corriente (LC).
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si (AC - I) = 0 y PCP = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin activos l√≠quidos ni pasivos corrientes. Puede ser una empresa inactiva o con datos inconsistentes.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se quiere revisar empresas con estructura financiera indefinida.
#      - Imputar con **1** en modelos num√©ricos si se asume que la empresa tiene liquidez neutra sin operaciones.
#
# 2Ô∏è‚É£ **Si (AC - I) > 0 y PCP = 0 ‚Üí ‚àû**
#    - Empresa sin pasivos corrientes pero con activos l√≠quidos, es decir, **totalmente l√≠quida**.
#
# 3Ô∏è‚É£ **Si PCP > 0 (sin importar AC - I) ‚Üí Normal**
#    - Se calcula la divisi√≥n directamente, incluyendo el caso (AC - I) = 0 (resultado = 0).
#
# 4Ô∏è‚É£ **Si (AC - I) < 0 y PCP > 0 ‚Üí Valor negativo**
#    - Indica que la empresa **tiene m√°s inventarios que activos l√≠quidos**, lo que puede ser un problema si necesita efectivo r√°pido.

base_indicadores['PA'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['I']) == 0) & (base_indicadores['PCP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PCP'] == 0), np.inf,  # Caso 2: ‚àû (cuando PCP = 0)
        (base_indicadores['AC'] - base_indicadores['I']) / base_indicadores['PCP']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Resumen de los valores en PA**
casos_normales_PA = ((base_indicadores['PCP'] > 0)).sum()  # Casos normales incluyen (AC - I) = 0 y negativos
casos_nan_PA = (((base_indicadores['AC'] - base_indicadores['I']) == 0) & (base_indicadores['PCP'] == 0)).sum()
casos_inf_PA = ((base_indicadores['PCP'] == 0) & ((base_indicadores['AC'] - base_indicadores['I']) > 0)).sum()
casos_negativos_PA = ((base_indicadores['PCP'] > 0) & ((base_indicadores['AC'] - base_indicadores['I']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PA (Prueba √Åcida):**")
print(f"‚úÖ Casos normales (incluye ceros y negativos): {casos_normales_PA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_PA} ‚Üí üìå Puede representar empresas sin operaciones claras. Se recomienda revisar o imputar con 1 en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_PA}")
print(f"üîª Casos negativos (m√°s inventarios que activos l√≠quidos): {casos_negativos_PA}")

# üîπ **C√°lculo de CTN (Capital de Trabajo Neto)**
# üìå F√≥rmula: CTN = AC - PCP
# üìå Interpretaci√≥n:
#    - Representa la diferencia entre los **activos corrientes (AC)** y los **pasivos corrientes (PCP)**.
#    - Un valor positivo indica que la empresa tiene m√°s activos l√≠quidos que deudas a corto plazo.
#    - Un valor negativo sugiere que la empresa **puede enfrentar problemas de liquidez** para cubrir sus obligaciones inmediatas.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si AC y PCP son NaN ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** No hay datos disponibles para calcular el capital de trabajo neto.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se necesita identificar empresas con datos faltantes.
#      - Imputar con **0** si se asume que no hay diferencia entre activos y pasivos corrientes.
#
# 2Ô∏è‚É£ **Si AC est√° vac√≠o y PCP tiene valor ‚Üí CTN = -PCP**
#    - Empresa sin activos l√≠quidos reportados, pero con pasivos corrientes. Indica un **capital de trabajo neto negativo**.
#
# 3Ô∏è‚É£ **Si PCP est√° vac√≠o y AC tiene valor ‚Üí CTN = AC**
#    - Empresa sin deudas de corto plazo, lo que implica **capital de trabajo neto igual a los activos corrientes**.
#
# 4Ô∏è‚É£ **Si ambos tienen valor ‚Üí CTN = AC - PCP**
#    - Se realiza el c√°lculo normal.

base_indicadores['CTN'] = np.where(
    base_indicadores[['AC', 'PCP']].isna().all(axis=1), np.nan,  # Caso 1: NaN
    np.where(
        base_indicadores['AC'].isna(), -base_indicadores['PCP'],  # Caso 2: -PCP
        np.where(
            base_indicadores['PCP'].isna(), base_indicadores['AC'],  # Caso 3: AC
            base_indicadores['AC'] - base_indicadores['PCP']  # Caso 4: Normal
        )
    )
)

# üîπ **Resumen de los valores en CTN**
casos_normales_CTN = ((~base_indicadores['CTN'].isna()) & (base_indicadores['CTN'] != np.inf)).sum()
casos_nan_CTN = base_indicadores['CTN'].isna().sum()
casos_negativos_CTN = (base_indicadores['CTN'] < 0).sum()
casos_positivos_CTN = (base_indicadores['CTN'] > 0).sum()
casos_cero_CTN = (base_indicadores['CTN'] == 0).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CTN (Capital de Trabajo Neto):**")
print(f"‚úÖ Casos normales (incluye positivos y negativos): {casos_normales_CTN}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CTN} ‚Üí üìå Puede representar empresas con datos faltantes. Se recomienda imputar con 0 si no se quiere perder informaci√≥n en an√°lisis.")
print(f"üîª Casos negativos (pasivo corriente mayor a activos corrientes): {casos_negativos_CTN}")
print(f"‚úÖ Casos positivos (empresa con activos corrientes superiores a pasivos corrientes): {casos_positivos_CTN}")
print(f"üîò Casos en cero: {casos_cero_CTN}")



# üîπ **C√°lculo de LG (Liquidez General)**
# üìå F√≥rmula: LG = (AC + AF) / PCP
# üìå Interpretaci√≥n:
#    - Representa la capacidad de la empresa para cubrir sus **pasivos corrientes (PCP)**
#      utilizando tanto **activos corrientes (AC)** como **activos fijos (AF)**.
#    - Se usa cuando los activos fijos pueden liquidarse para cubrir obligaciones de corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si (AC + AF) = 0 y PCP = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** No hay activos ni pasivos registrados.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se necesita identificar empresas sin datos.
#      - Imputar con **1** si se quiere evitar divisiones problem√°ticas en an√°lisis financieros.
#
# 2Ô∏è‚É£ **Si (AC + AF) > 0 y PCP = 0 ‚Üí ‚àû**
#    - Empresa con activos pero sin pasivos de corto plazo, indicando **solvencia total**.
#
# 3Ô∏è‚É£ **Si (AC + AF) = 0 y PCP > 0 ‚Üí 0**
#    - Empresa sin activos, lo que indica **incapacidad total para pagar deudas a corto plazo**.
#
# 4Ô∏è‚É£ **Si (AC + AF) > 0 y PCP > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['LG'] = np.where(
    ((base_indicadores['AC'] + base_indicadores['AF']) == 0) & (base_indicadores['PCP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PCP'] == 0), np.inf,  # Caso 2: ‚àû (cuando PCP = 0)
        (base_indicadores['AC'] + base_indicadores['AF']) / base_indicadores['PCP']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en LG**
casos_normales_LG = ((base_indicadores['PCP'] > 0)).sum()  # Casos normales incluyen (AC + AF) = 0
casos_nan_LG = (((base_indicadores['AC'] + base_indicadores['AF']) == 0) & (base_indicadores['PCP'] == 0)).sum()
casos_inf_LG = ((base_indicadores['PCP'] == 0) & ((base_indicadores['AC'] + base_indicadores['AF']) > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en LG (Liquidez General):**")
print(f"‚úÖ Casos normales (incluye ceros): {casos_normales_LG}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_LG} ‚Üí üìå Puede representar empresas sin datos. Se recomienda imputar con **1** si se quiere evitar problemas en c√°lculos financieros.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_LG}")


# ==============================================================================
# üìå SECCI√ìN 1: C√ÅLCULO DE INDICADORES DE LIQUIDEZ
# ==============================================================================

# üîπ **C√°lculo de T (Tesorer√≠a)**
# üìå F√≥rmula: T = (AC - I) / PT
# üìå Interpretaci√≥n:
#    - Indica la proporci√≥n de los activos l√≠quidos de la empresa (activos corrientes sin inventarios)
#      en relaci√≥n con el pasivo total.
#    - Se usa para medir **cu√°nto de los pasivos totales pueden cubrirse sin depender de los inventarios**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si (AC - I) = 0 y PT = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** No hay activos l√≠quidos ni pasivos registrados.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** para an√°lisis de calidad de datos.
#      - Imputar con **1** si se quiere evitar problemas en modelos num√©ricos.
#
# 2Ô∏è‚É£ **Si (AC - I) > 0 y PT = 0 ‚Üí ‚àû**
#    - Empresa sin pasivos pero con activos l√≠quidos, lo que sugiere **solvencia total**.
#
# 3Ô∏è‚É£ **Si (AC - I) = 0 y PT > 0 ‚Üí 0**
#    - Empresa sin activos l√≠quidos, lo que indica **fuerte dependencia de pasivos**.
#
# 4Ô∏è‚É£ **Si (AC - I) < 0 y PT > 0 ‚Üí Negativo**
#    - Empresa con **m√°s inventarios que activos l√≠quidos**, indicando un **riesgo financiero alto**.
#
# 5Ô∏è‚É£ **Si (AC - I) > 0 y PT > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['T'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['I']) == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PT'] == 0), np.inf,  # Caso 2: ‚àû (cuando PT = 0)
        (base_indicadores['AC'] - base_indicadores['I']) / base_indicadores['PT']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Resumen de los valores en T**
casos_normales_T = ((base_indicadores['PT'] > 0)).sum()  # Casos normales incluyen (AC - I) = 0 y negativos
casos_nan_T = (((base_indicadores['AC'] - base_indicadores['I']) == 0) & (base_indicadores['PT'] == 0)).sum()
casos_inf_T = ((base_indicadores['PT'] == 0) & ((base_indicadores['AC'] - base_indicadores['I']) > 0)).sum()
casos_negativos_T = ((base_indicadores['PT'] > 0) & ((base_indicadores['AC'] - base_indicadores['I']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en T (Tesorer√≠a):**")
print(f"‚úÖ Casos normales (incluye ceros y negativos): {casos_normales_T}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_T} ‚Üí üìå Puede representar empresas sin datos. Se recomienda imputar con **1** si se quiere evitar problemas en c√°lculos financieros.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_T}")
print(f"üîª Casos negativos (m√°s inventarios que activos l√≠quidos): {casos_negativos_T}")


# ==============================================================================
# üìå SECCI√ìN 1: C√ÅLCULO DE INDICADORES DE LIQUIDEZ
# ==============================================================================

# üîπ **C√°lculo de TN (Tesorer√≠a Neta)**
# üìå F√≥rmula: TN = (AC - I - PCP) / PT
# üìå Interpretaci√≥n:
#    - Muestra cu√°nto de la tesorer√≠a l√≠quida (activos corrientes sin inventarios menos pasivos corrientes)
#      puede cubrir los pasivos totales de la empresa.
#    - Un valor alto indica **capacidad de pago s√≥lida**, mientras que un valor negativo sugiere **riesgo financiero**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si (AC - I - PCP) = 0 y PT = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** No hay tesorer√≠a neta ni pasivos totales registrados.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** para revisi√≥n de datos.
#      - Imputar con **1** en modelos num√©ricos si se quiere evitar problemas de c√°lculo.
#
# 2Ô∏è‚É£ **Si (AC - I - PCP) > 0 y PT = 0 ‚Üí ‚àû**
#    - Empresa sin pasivos totales pero con tesorer√≠a neta, lo que indica **m√°xima solvencia**.
#
# 3Ô∏è‚É£ **Si (AC - I - PCP) = 0 y PT > 0 ‚Üí 0**
#    - La empresa tiene pasivos pero su tesorer√≠a neta es nula, lo que indica **equilibrio exacto**.
#
# 4Ô∏è‚É£ **Si (AC - I - PCP) < 0 y PT > 0 ‚Üí Negativo**
#    - Empresa con **d√©ficit de tesorer√≠a neta**, indicando **problemas de liquidez y riesgo financiero**.
#
# 5Ô∏è‚É£ **Si (AC - I - PCP) > 0 y PT > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['TN'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['I'] - base_indicadores['PCP']) == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PT'] == 0), np.inf,  # Caso 2: ‚àû (cuando PT = 0)
        (base_indicadores['AC'] - base_indicadores['I'] - base_indicadores['PCP']) / base_indicadores['PT']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Resumen de los valores en TN**
casos_normales_TN = ((base_indicadores['PT'] > 0)).sum()  # Casos normales incluyen valores positivos, negativos y cero
casos_nan_TN = (((base_indicadores['AC'] - base_indicadores['I'] - base_indicadores['PCP']) == 0) & (base_indicadores['PT'] == 0)).sum()
casos_inf_TN = ((base_indicadores['PT'] == 0) & ((base_indicadores['AC'] - base_indicadores['I'] - base_indicadores['PCP']) > 0)).sum()
casos_negativos_TN = ((base_indicadores['PT'] > 0) & ((base_indicadores['AC'] - base_indicadores['I'] - base_indicadores['PCP']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en TN (Tesorer√≠a Neta):**")
print(f"‚úÖ Casos normales (incluye positivos, negativos y ceros): {casos_normales_TN}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_TN} ‚Üí üìå Puede representar empresas sin datos. Se recomienda imputar con **1** en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_TN}")
print(f"üîª Casos negativos (d√©ficit de tesorer√≠a neta): {casos_negativos_TN}")



# ==============================================================================
# üìå SECCI√ìN 2: C√ÅLCULO DE INDICADORES DE ENDEUDAMIENTO Y COBERTURA
# ==============================================================================

# üîπ **C√°lculo de RET (Raz√≥n de Endeudamiento Total)**
# üìå F√≥rmula: RET = PT / PN
# üìå Interpretaci√≥n:
#    - Muestra la proporci√≥n de los recursos de la empresa que proviene de deuda.
#    - Un valor alto indica una empresa altamente apalancada, lo que puede implicar
#      mayor riesgo financiero si la deuda es excesiva.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si PT = 0 y PN = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin patrimonio ni pasivos. Puede representar una empresa reci√©n creada, en quiebra o con datos inconsistentes.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se quiere analizar manualmente casos de empresas sin estructura financiera.
#      - Imputar con **0** en modelos num√©ricos si se interpreta que una empresa sin deuda ni patrimonio no tiene riesgo financiero medible.
#
# 2Ô∏è‚É£ **Si PT > 0 y PN = 0 ‚Üí ‚àû**
#    - Empresa con pasivos totales pero sin patrimonio (100% financiada con deuda).
#
# 3Ô∏è‚É£ **Si PT = 0 y PN > 0 ‚Üí 0**
#    - Empresa sin deuda, financiada completamente con patrimonio.
#
# 4Ô∏è‚É£ **Si PT > 0 y PN > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n directamente.

base_indicadores['RET'] = np.where(
    (base_indicadores['PT'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû (cuando PN = 0)
        base_indicadores['PT'] / base_indicadores['PN']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RET**
casos_normales_RET = ((base_indicadores['PN'] > 0)).sum()  # Casos normales incluyen PT = 0
casos_nan_RET = ((base_indicadores['PT'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_RET = ((base_indicadores['PN'] == 0) & (base_indicadores['PT'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RET (Raz√≥n de Endeudamiento Total):**")
print(f"‚úÖ Casos normales: {casos_normales_RET}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RET} ‚Üí üìå Puede representar empresas sin estructura financiera clara. Se recomienda revisar o imputar con 0 en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RET}")


# üîπ **C√°lculo de RECP (Raz√≥n de Endeudamiento Corriente con Patrimonio)**
# üìå F√≥rmula: RECP = PCP / PN
# üìå Interpretaci√≥n:
#    - Mide la proporci√≥n del pasivo corriente (obligaciones a corto plazo) en relaci√≥n con el patrimonio.
#    - Un valor alto sugiere que la empresa depende mucho del financiamiento a corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si PCP = 0 y PN = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin patrimonio ni pasivos corrientes. Puede representar una empresa reci√©n creada, inactiva o con datos incorrectos.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** si se quiere revisar manualmente la situaci√≥n financiera.
#      - Imputar con **0** en modelos num√©ricos para evitar problemas de c√°lculo, ya que **una empresa sin patrimonio ni pasivos corrientes puede interpretarse como una empresa sin obligaciones de deuda en relaci√≥n con su estructura financiera.**
#
# 2Ô∏è‚É£ **Si PCP > 0 y PN = 0 ‚Üí ‚àû**
#    - Empresa con pasivos corrientes pero sin patrimonio (100% financiada con deuda a corto plazo).
#
# 3Ô∏è‚É£ **Si PCP = 0 y PN > 0 ‚Üí 0**
#    - Empresa sin pasivos corrientes, totalmente financiada por patrimonio.
#
# 4Ô∏è‚É£ **Si PCP > 0 y PN > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n directamente.

base_indicadores['RECP'] = np.where(
    (base_indicadores['PCP'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû (cuando PN = 0)
        base_indicadores['PCP'] / base_indicadores['PN']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RECP**
casos_normales_RECP = ((base_indicadores['PN'] > 0)).sum()  # Casos normales incluyen PCP = 0
casos_nan_RECP = ((base_indicadores['PCP'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_RECP = ((base_indicadores['PN'] == 0) & (base_indicadores['PCP'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RECP (Raz√≥n de Endeudamiento Corriente con Patrimonio):**")
print(f"‚úÖ Casos normales: {casos_normales_RECP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RECP} ‚Üí üìå Puede representar empresas sin estructura financiera clara. Se recomienda revisar o imputar con 0 en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RECP}")


# ==============================================================================
# üìå SECCI√ìN 2: C√ÅLCULO DE INDICADORES DE ENDEUDAMIENTO Y COBERTURA DE DEUDA
# ==============================================================================

# üîπ **C√°lculo de RELP (Raz√≥n de Endeudamiento Largo Plazo)**
# üìå F√≥rmula: RELP = PLP / PN
# üìå Interpretaci√≥n:
#    - Mide la proporci√≥n de la deuda a largo plazo en relaci√≥n con el patrimonio.
#    - Un valor alto indica que la empresa **depende m√°s de financiamiento a largo plazo**, lo que puede ser una estrategia
#      para reducir costos financieros a corto plazo, pero tambi√©n aumenta el riesgo si la deuda es elevada.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si PLP = 0 y PN = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin pasivos de largo plazo ni patrimonio registrado.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** para an√°lisis de calidad de datos.
#      - Imputar con **0** si se quiere evitar problemas en c√°lculos financieros.
#
# 2Ô∏è‚É£ **Si PLP > 0 y PN = 0 ‚Üí ‚àû**
#    - Empresa con deuda a largo plazo pero sin patrimonio, lo que indica **dependencia total del endeudamiento**.
#
# 3Ô∏è‚É£ **Si PLP = 0 y PN > 0 ‚Üí 0**
#    - Empresa sin pasivos a largo plazo, lo que sugiere **financiamiento totalmente con patrimonio**.
#
# 4Ô∏è‚É£ **Si PLP > 0 y PN > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RELP'] = np.where(
    (base_indicadores['PLP'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû (cuando PN = 0)
        base_indicadores['PLP'] / base_indicadores['PN']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RELP**
casos_normales_RELP = ((base_indicadores['PN'] > 0)).sum()  # Casos normales incluyen PLP = 0
casos_nan_RELP = ((base_indicadores['PLP'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_RELP = ((base_indicadores['PN'] == 0) & (base_indicadores['PLP'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RELP (Raz√≥n de Endeudamiento Largo Plazo):**")
print(f"‚úÖ Casos normales: {casos_normales_RELP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RELP} ‚Üí üìå Puede representar empresas sin datos. Se recomienda imputar con **0** en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RELP}")

# ==============================================================================
# üìå SECCI√ìN 2: C√ÅLCULO DE INDICADORES DE ENDEUDAMIENTO Y COBERTURA DE DEUDA
# ==============================================================================

# üîπ **C√°lculo de RAF (Raz√≥n de Apalancamiento Financiero)**
# üìå F√≥rmula: RAF = AF / PN
# üìå Interpretaci√≥n:
#    - Mide qu√© porcentaje de los activos fijos est√° respaldado por el patrimonio de la empresa.
#    - Un valor alto indica que la empresa **ha invertido en activos fijos utilizando su propio capital**,
#      mientras que un valor bajo sugiere una mayor dependencia de la deuda para financiar estos activos.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si AF = 0 y PN = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin activos fijos y sin patrimonio registrado.
#    - üîπ **Manejo recomendado:**
#      - Mantener como **NaN** para an√°lisis de calidad de datos.
#      - Imputar con **0** en modelos num√©ricos si se quiere evitar errores en c√°lculos financieros.
#
# 2Ô∏è‚É£ **Si AF > 0 y PN = 0 ‚Üí ‚àû**
#    - Empresa con activos fijos pero sin patrimonio, lo que indica **dependencia total de deuda o financiamiento externo**.
#
# 3Ô∏è‚É£ **Si AF = 0 y PN > 0 ‚Üí 0**
#    - Empresa sin activos fijos, lo que sugiere **capital invertido en otros activos l√≠quidos**.
#
# 4Ô∏è‚É£ **Si AF > 0 y PN > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RAF'] = np.where(
    (base_indicadores['AF'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû (cuando PN = 0)
        base_indicadores['AF'] / base_indicadores['PN']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RAF**
casos_normales_RAF = ((base_indicadores['PN'] > 0)).sum()  # Casos normales incluyen AF = 0
casos_nan_RAF = ((base_indicadores['AF'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_RAF = ((base_indicadores['PN'] == 0) & (base_indicadores['AF'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RAF (Raz√≥n de Apalancamiento Financiero):**")
print(f"‚úÖ Casos normales: {casos_normales_RAF}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RAF} ‚Üí üìå Puede representar empresas sin datos. Se recomienda imputar con **0** en modelos num√©ricos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RAF}")


# üîπ **C√°lculo de RAO (Rentabilidad de la Actividad Operativa)**
# üìå F√≥rmula: RAO = EBIT / UO
# üìå Interpretaci√≥n:
#    - Mide la proporci√≥n de la utilidad operativa (UO) que proviene de la utilidad antes de impuestos e intereses (EBIT).
#    - Un valor alto indica **alta eficiencia en la actividad operativa**, mientras que un valor bajo sugiere que
#      los costos operativos pueden estar afectando significativamente la rentabilidad.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si EBIT = 0 y UO = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin actividad operativa registrada en ese periodo.
#    - üîπ **Manejo recomendado:**
#      - **Imputar con 1** en modelos predictivos para evitar sesgos en la normalizaci√≥n.
#      - **Mantener como NaN** si el an√°lisis busca evaluar periodos de inactividad.
#
# 2Ô∏è‚É£ **Si EBIT > 0 y UO = 0 ‚Üí ‚àû**
#    - Empresa con utilidad antes de impuestos pero sin utilidad operativa registrada, lo que podr√≠a indicar
#      **costos operativos elevados o ingresos extraordinarios sin operaciones directas**.
#
# 3Ô∏è‚É£ **Si EBIT = 0 y UO > 0 ‚Üí 0**
#    - Indica que la empresa tiene **utilidad operativa sin EBIT**, lo cual puede darse si los gastos financieros y
#      extraordinarios han reducido el EBIT a cero.
#
# 4Ô∏è‚É£ **Si EBIT > 0 y UO > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RAO'] = np.where(
    (base_indicadores['EBIT'] == 0) & (base_indicadores['UO'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['UO'] == 0), np.inf,  # Caso 2: ‚àû (cuando UO = 0)
        base_indicadores['EBIT'] / base_indicadores['UO']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RAO**
casos_normales_RAO = ((base_indicadores['UO'] > 0)).sum()  # Casos normales incluyen EBIT = 0
casos_nan_RAO = ((base_indicadores['EBIT'] == 0) & (base_indicadores['UO'] == 0)).sum()
casos_inf_RAO = ((base_indicadores['UO'] == 0) & (base_indicadores['EBIT'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RAO (Rentabilidad de la Actividad Operativa):**")
print(f"‚úÖ Casos normales: {casos_normales_RAO}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RAO} ‚Üí üìå Se recomienda **imputar con 1** para mantener la estabilidad en modelos predictivos.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RAO}")



# üîπ **C√°lculo de RCD (Raz√≥n de Cobertura de Deuda Total)**
# üìå F√≥rmula: RCD = FCL / PT
# üìå Interpretaci√≥n:
#    - Indica la capacidad de la empresa para **cubrir su deuda total (PT)** con su flujo de caja libre (FCL).
#    - Un valor alto sugiere que la empresa tiene suficiente flujo de caja para hacer frente a sus obligaciones.
#    - Un valor bajo indica que la empresa podr√≠a **tener dificultades en el pago de su deuda total**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si FCL = 0 y PT = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin flujo de caja libre ni deuda total.
#    - üîπ **Manejo recomendado:**
#      - **Mantener como NaN** si se busca analizar empresas sin apalancamiento.
#      - **Imputar con 1** en modelos predictivos, ya que la empresa no tiene deuda ni flujo de caja, por lo que
#        su cobertura de deuda ser√≠a neutral.
#
# 2Ô∏è‚É£ **Si FCL > 0 y PT = 0 ‚Üí ‚àû**
#    - La empresa tiene flujo de caja libre pero **no tiene deuda total**, por lo que su capacidad de pago es infinita.
#
# 3Ô∏è‚É£ **Si FCL = 0 y PT > 0 ‚Üí 0**
#    - La empresa tiene deuda total pero **no genera flujo de caja libre**, lo que puede ser una **se√±al de riesgo financiero**.
#
# 4Ô∏è‚É£ **Si FCL > 0 y PT > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RCD'] = np.where(
    (base_indicadores['FCL'] == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PT'] == 0), np.inf,  # Caso 2: ‚àû (cuando PT = 0)
        base_indicadores['FCL'] / base_indicadores['PT']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCD**
casos_normales_RCD = ((base_indicadores['PT'] > 0)).sum()  # Casos normales incluyen FCL = 0
casos_nan_RCD = ((base_indicadores['FCL'] == 0) & (base_indicadores['PT'] == 0)).sum()
casos_inf_RCD = ((base_indicadores['PT'] == 0) & (base_indicadores['FCL'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCD (Raz√≥n de Cobertura de Deuda Total):**")
print(f"‚úÖ Casos normales: {casos_normales_RCD}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCD} ‚Üí üìå Se recomienda **imputar con 1** para modelos predictivos o mantener como NaN para an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCD}")

# üîπ **C√°lculo de RCID (Raz√≥n de Cobertura de Intereses con Deuda)**
# üìå F√≥rmula: RCID = (EBIT + GF) / PT
# üìå Interpretaci√≥n:
#    - Mide la capacidad de la empresa para **cubrir su deuda total (PT)** con su utilidad antes de intereses e impuestos (EBIT) m√°s los gastos financieros (GF).
#    - Un valor alto indica **suficiente capacidad de pago** de la deuda total.
#    - Un valor bajo sugiere que la empresa podr√≠a **tener dificultades en la cobertura de sus obligaciones**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si (EBIT + GF) = 0 y PT = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin deuda y sin resultados operativos.
#    - üîπ **Manejo recomendado:**
#      - **Mantener como NaN** en an√°lisis financiero.
#      - **Imputar con 1** en modelos predictivos, reflejando una situaci√≥n neutral.
#
# 2Ô∏è‚É£ **Si (EBIT + GF) > 0 y PT = 0 ‚Üí ‚àû**
#    - La empresa tiene ganancias antes de intereses e impuestos, pero **no tiene deuda total**, por lo que la cobertura es infinita.
#
# 3Ô∏è‚É£ **Si (EBIT + GF) = 0 y PT > 0 ‚Üí 0**
#    - La empresa tiene deuda total pero **no genera suficientes utilidades antes de intereses para cubrirla**, indicando un **riesgo financiero alto**.
#
# 4Ô∏è‚É£ **Si (EBIT + GF) > 0 y PT > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RCID'] = np.where(
    ((base_indicadores['EBIT'] + base_indicadores['GF']) == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PT'] == 0), np.inf,  # Caso 2: ‚àû (cuando PT = 0)
        (base_indicadores['EBIT'] + base_indicadores['GF']) / base_indicadores['PT']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCID**
casos_normales_RCID = ((base_indicadores['PT'] > 0)).sum()  # Casos normales incluyen EBIT + GF = 0
casos_nan_RCID = (((base_indicadores['EBIT'] + base_indicadores['GF']) == 0) & (base_indicadores['PT'] == 0)).sum()
casos_inf_RCID = ((base_indicadores['PT'] == 0) & ((base_indicadores['EBIT'] + base_indicadores['GF']) > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCID (Raz√≥n de Cobertura de Intereses con Deuda):**")
print(f"‚úÖ Casos normales: {casos_normales_RCID}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCID} ‚Üí üìå Se recomienda **imputar con 1** en modelos predictivos o mantener como NaN para an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCID}")

# üîπ **C√°lculo de RCCP (Raz√≥n de Cobertura de Pasivos Corrientes con Flujo de Caja)**
# üìå F√≥rmula: RCCP = FCL / PCP
# üìå Interpretaci√≥n:
#    - Indica **cu√°ntas veces el flujo de caja libre (FCL) puede cubrir el pasivo corriente (PCP)**.
#    - Un valor alto sugiere que la empresa **tiene suficiente flujo de caja** para cubrir sus pasivos de corto plazo.
#    - Un valor bajo indica posible **riesgo de liquidez**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si FCL = 0 y PCP = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin flujo de caja libre y sin pasivos corrientes.
#    - üîπ **Manejo recomendado:**
#      - **Mantener como NaN** en an√°lisis financiero.
#      - **Imputar con 1** en modelos predictivos para evitar sesgos.
#
# 2Ô∏è‚É£ **Si FCL > 0 y PCP = 0 ‚Üí ‚àû**
#    - La empresa **no tiene pasivos corrientes**, pero s√≠ flujo de caja, por lo que la cobertura es infinita.
#
# 3Ô∏è‚É£ **Si FCL = 0 y PCP > 0 ‚Üí 0**
#    - La empresa **no genera flujo de caja libre** pero tiene pasivos corrientes.
#
# 4Ô∏è‚É£ **Si FCL > 0 y PCP > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RCCP'] = np.where(
    (base_indicadores['FCL'] == 0) & (base_indicadores['PCP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PCP'] == 0), np.inf,  # Caso 2: ‚àû (cuando PCP = 0)
        base_indicadores['FCL'] / base_indicadores['PCP']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCCP**
casos_normales_RCCP = ((base_indicadores['PCP'] > 0)).sum()
casos_nan_RCCP = ((base_indicadores['FCL'] == 0) & (base_indicadores['PCP'] == 0)).sum()
casos_inf_RCCP = ((base_indicadores['PCP'] == 0) & (base_indicadores['FCL'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCCP (Raz√≥n de Cobertura de Pasivos Corrientes con Flujo de Caja):**")
print(f"‚úÖ Casos normales: {casos_normales_RCCP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCCP} ‚Üí üìå Se recomienda **imputar con 1** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCCP}")
# üîπ **C√°lculo de RCLP (Raz√≥n de Cobertura de Pasivos No Corrientes con Flujo de Caja)**
# üìå F√≥rmula: RCLP = FCL / PLP
# üìå Interpretaci√≥n:
#    - Mide cu√°ntas veces el flujo de caja libre (FCL) puede cubrir el pasivo a largo plazo (PLP).
#    - Un valor alto indica **s√≥lida capacidad de pago de deudas a largo plazo**.
#    - Un valor bajo sugiere posibles **dificultades en la sostenibilidad financiera**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si FCL = 0 y PLP = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin flujo de caja libre y sin pasivos a largo plazo.
#    - üîπ **Manejo recomendado:**
#      - **Mantener como NaN** en an√°lisis financiero.
#      - **Imputar con 1** en modelos predictivos para evitar distorsiones.
#
# 2Ô∏è‚É£ **Si FCL > 0 y PLP = 0 ‚Üí ‚àû**
#    - La empresa **no tiene pasivos a largo plazo**, pero s√≠ flujo de caja, por lo que la cobertura es infinita.
#
# 3Ô∏è‚É£ **Si FCL = 0 y PLP > 0 ‚Üí 0**
#    - La empresa tiene pasivos a largo plazo pero **no genera flujo de caja libre**.
#
# 4Ô∏è‚É£ **Si FCL > 0 y PLP > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RCLP'] = np.where(
    (base_indicadores['FCL'] == 0) & (base_indicadores['PLP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PLP'] == 0), np.inf,  # Caso 2: ‚àû (cuando PLP = 0)
        base_indicadores['FCL'] / base_indicadores['PLP']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCLP**
casos_normales_RCLP = ((base_indicadores['PLP'] > 0)).sum()
casos_nan_RCLP = ((base_indicadores['FCL'] == 0) & (base_indicadores['PLP'] == 0)).sum()
casos_inf_RCLP = ((base_indicadores['PLP'] == 0) & (base_indicadores['FCL'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCLP (Raz√≥n de Cobertura de Pasivos No Corrientes con Flujo de Caja):**")
print(f"‚úÖ Casos normales: {casos_normales_RCLP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCLP} ‚Üí üìå Se recomienda **imputar con 1** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCLP}")


# üîπ **C√°lculo de RCDT (Raz√≥n de Cobertura de Deuda Total con Flujo de Caja)**
# üìå F√≥rmula: RCDT = FCL / PT
# üìå Interpretaci√≥n:
#    - Muestra cu√°ntas veces el **flujo de caja libre (FCL)** puede cubrir la **deuda total (PT)**.
#    - Un valor alto indica **s√≥lida capacidad de pago** de las deudas.
#    - Un valor bajo sugiere posibles **problemas de solvencia**.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ **Si FCL = 0 y PT = 0 ‚Üí NaN**
#    - ‚ùì **¬øQu√© significa?** Empresa sin flujo de caja libre y sin deuda total.
#    - üîπ **Manejo recomendado:**
#      - **Mantener como NaN** en an√°lisis financiero.
#      - **Imputar con 1** en modelos predictivos para evitar distorsiones.
#
# 2Ô∏è‚É£ **Si FCL > 0 y PT = 0 ‚Üí ‚àû**
#    - La empresa **no tiene deuda total**, pero s√≠ flujo de caja, por lo que la cobertura es infinita.
#
# 3Ô∏è‚É£ **Si FCL = 0 y PT > 0 ‚Üí 0**
#    - La empresa tiene **deuda total pero no genera flujo de caja libre**, lo que puede ser **riesgoso**.
#
# 4Ô∏è‚É£ **Si FCL > 0 y PT > 0 ‚Üí Normal**
#    - Se calcula la divisi√≥n.

base_indicadores['RCDT'] = np.where(
    (base_indicadores['FCL'] == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PT'] == 0), np.inf,  # Caso 2: ‚àû (cuando PT = 0)
        base_indicadores['FCL'] / base_indicadores['PT']  # Casos 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCDT**
casos_normales_RCDT = ((base_indicadores['PT'] > 0)).sum()
casos_nan_RCDT = ((base_indicadores['FCL'] == 0) & (base_indicadores['PT'] == 0)).sum()
casos_inf_RCDT = ((base_indicadores['PT'] == 0) & (base_indicadores['FCL'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCDT (Raz√≥n de Cobertura de Deuda Total con Flujo de Caja):**")
print(f"‚úÖ Casos normales: {casos_normales_RCDT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCDT} ‚Üí üìå Se recomienda **imputar con 1** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCDT}")


# ==============================================================================
# üìå SECCI√ìN 3: Indicadores de Rentabilidad y M√°rgenes

# ==============================================================================



# üîπ **C√°lculo de EBITDA**
# üìå F√≥rmula: EBITDA = EBIT + DyA
# üìå Interpretaci√≥n:
#    - Representa el beneficio de la empresa antes de intereses, impuestos, depreciaci√≥n y amortizaci√≥n.
#    - Es una m√©trica clave para evaluar la rentabilidad operativa sin los efectos de decisiones de financiamiento o pol√≠ticas fiscales.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si EBIT y DyA son NaN ‚Üí NaN (no se puede calcular)
# 2Ô∏è‚É£ Si EBIT es NaN y DyA tiene valor ‚Üí EBITDA = DyA
# 3Ô∏è‚É£ Si DyA es NaN y EBIT tiene valor ‚Üí EBITDA = EBIT
# 4Ô∏è‚É£ Si ambos tienen valores ‚Üí EBITDA = EBIT + DyA (normal)

base_indicadores['EBITDA'] = np.where(
    base_indicadores[['EBIT', 'DyA']].isna().all(axis=1), np.nan,  # Caso 1: NaN
    np.where(
        base_indicadores['EBIT'].isna(), base_indicadores['DyA'],  # Caso 2: Solo DyA
        np.where(
            base_indicadores['DyA'].isna(), base_indicadores['EBIT'],  # Caso 3: Solo EBIT
            base_indicadores['EBIT'] + base_indicadores['DyA']  # Caso 4: Normal
        )
    )
)

# üîπ **Resumen de los valores en EBITDA**
casos_normales_EBITDA = ((~base_indicadores['EBITDA'].isna())).sum()
casos_nan_EBITDA = base_indicadores['EBITDA'].isna().sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en EBITDA:**")
print(f"‚úÖ Casos normales: {casos_normales_EBITDA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_EBITDA} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")

# üîπ **C√°lculo de MB (Margen Bruto)**
# üìå F√≥rmula: MB = UB / V
# üìå Interpretaci√≥n:
#    - Indica la rentabilidad bruta de la empresa antes de restar los gastos operacionales.
#    - Un margen bruto alto sugiere que la empresa tiene un fuerte control sobre sus costos de ventas.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si UB = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin ingresos ni utilidad bruta)
# 2Ô∏è‚É£ Si UB > 0 y V = 0 ‚Üí ‚àû (empresa con utilidad bruta pero sin ingresos reportados)
# 3Ô∏è‚É£ Si UB = 0 y V > 0 ‚Üí 0 (empresa sin utilidad bruta, ingresos iguales a costos)
# 4Ô∏è‚É£ Si UB < 0 y V > 0 ‚Üí Negativo (empresa con p√©rdidas brutas)
# 5Ô∏è‚É£ Si UB > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['MB'] = np.where(
    (base_indicadores['UB'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['UB'] / base_indicadores['V']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para an√°lisis detallado.
#    - Imputar con **0** si se considera que la empresa no tuvo actividad comercial.
#    - Considerar eliminar si el valor afecta el an√°lisis de rentabilidad.

# üîπ **Resumen de los valores en MB**
casos_normales_MB = ((base_indicadores['V'] > 0)).sum()
casos_nan_MB = ((base_indicadores['UB'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_MB = ((base_indicadores['V'] == 0) & (base_indicadores['UB'] > 0)).sum()
casos_negativos_MB = ((base_indicadores['UB'] < 0) & (base_indicadores['V'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en MB (Margen Bruto):**")
print(f"‚úÖ Casos normales: {casos_normales_MB}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_MB} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos, ya que implica que la empresa no tiene margen bruto.")

print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_MB}")
print(f"üîª Casos negativos (empresa con p√©rdidas brutas): {casos_negativos_MB}")


# üîπ **C√°lculo de MO (Margen Operacional)**
# üìå F√≥rmula: MO = UO / V
# üìå Interpretaci√≥n:
#    - Representa la rentabilidad operativa despu√©s de restar los gastos administrativos y de ventas.
#    - Un margen operativo positivo indica que la empresa genera ganancias despu√©s de cubrir sus costos fijos y variables operacionales.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si UO = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin ingresos ni utilidad operacional)
# 2Ô∏è‚É£ Si UO > 0 y V = 0 ‚Üí ‚àû (empresa con utilidad operacional pero sin ingresos reportados)
# 3Ô∏è‚É£ Si UO = 0 y V > 0 ‚Üí 0 (empresa sin utilidad operacional, ingresos igual a costos operacionales)
# 4Ô∏è‚É£ Si UO < 0 y V > 0 ‚Üí Negativo (empresa con p√©rdidas operacionales)
# 5Ô∏è‚É£ Si UO > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['MO'] = np.where(
    (base_indicadores['UO'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['UO'] / base_indicadores['V']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para an√°lisis detallado.
#    - Imputar con **0** si se considera que la empresa no tuvo actividad comercial.
#    - Considerar eliminar si los valores NaN afectan la interpretaci√≥n de la rentabilidad.

# üîπ **Resumen de los valores en MO**
casos_normales_MO = ((base_indicadores['V'] > 0)).sum()
casos_nan_MO = ((base_indicadores['UO'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_MO = ((base_indicadores['V'] == 0) & (base_indicadores['UO'] > 0)).sum()
casos_negativos_MO = ((base_indicadores['UO'] < 0) & (base_indicadores['V'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en MO (Margen Operacional):**")
print(f"‚úÖ Casos normales: {casos_normales_MO}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_MO} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos, ya que implica que la empresa no tiene margen operacional.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_MO}")
print(f"üîª Casos negativos (empresa con p√©rdidas operacionales): {casos_negativos_MO}")

# üîπ **C√°lculo de ROA (Rentabilidad sobre Activos)**
# üìå F√≥rmula: ROA = UN / AT
# üìå Interpretaci√≥n:
#    - Mide la rentabilidad de la empresa en relaci√≥n con sus activos totales.
#    - Un ROA alto indica una empresa eficiente en la generaci√≥n de beneficios a partir de sus activos.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si UN = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin activos ni utilidad neta)
# 2Ô∏è‚É£ Si UN > 0 y AT = 0 ‚Üí ‚àû (empresa con utilidad neta pero sin activos reportados)
# 3Ô∏è‚É£ Si UN = 0 y AT > 0 ‚Üí 0 (empresa con activos pero sin utilidad neta)
# 4Ô∏è‚É£ Si UN < 0 y AT > 0 ‚Üí Negativo (empresa con p√©rdidas netas, bajo desempe√±o)
# 5Ô∏è‚É£ Si UN > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['ROA'] = np.where(
    (base_indicadores['UN'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0), np.inf,  # Caso 2: ‚àû (cuando AT = 0)
        base_indicadores['UN'] / base_indicadores['AT']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para revisi√≥n detallada.
#    - Imputar con **0** si se considera que la empresa no gener√≥ utilidad y ten√≠a activos.
#    - **Eliminar registros NaN si afectan el an√°lisis de rentabilidad.**

# üîπ **Resumen de los valores en ROA**
casos_normales_ROA = ((base_indicadores['AT'] > 0)).sum()
casos_nan_ROA = ((base_indicadores['UN'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_ROA = ((base_indicadores['AT'] == 0) & (base_indicadores['UN'] > 0)).sum()
casos_negativos_ROA = ((base_indicadores['UN'] < 0) & (base_indicadores['AT'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en ROA (Rentabilidad sobre Activos):**")
print(f"‚úÖ Casos normales: {casos_normales_ROA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_ROA} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos, pues significa que la empresa no gener√≥ utilidad neta o no ten√≠a activos reportados.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_ROA}")
print(f"üîª Casos negativos (empresa con p√©rdidas): {casos_negativos_ROA}")


# üîπ **C√°lculo de ROE (Rentabilidad sobre Patrimonio)**
# üìå F√≥rmula: ROE = UN / PN
# üìå Interpretaci√≥n:
#    - Mide la rentabilidad obtenida en relaci√≥n con el patrimonio de los accionistas.
#    - Un ROE alto indica que la empresa est√° generando buenos rendimientos sobre el capital invertido.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si UN = 0 y PN = 0 ‚Üí NaN (indeterminado, empresa sin patrimonio ni utilidad neta)
# 2Ô∏è‚É£ Si UN > 0 y PN = 0 ‚Üí ‚àû (empresa con utilidad neta pero sin patrimonio)
# 3Ô∏è‚É£ Si UN = 0 y PN > 0 ‚Üí 0 (empresa sin utilidad neta, solo con patrimonio)
# 4Ô∏è‚É£ Si UN < 0 y PN > 0 ‚Üí Negativo (empresa con p√©rdidas, impacto en los accionistas)
# 5Ô∏è‚É£ Si UN > 0 y PN > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['ROE'] = np.where(
    (base_indicadores['UN'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû (cuando PN = 0)
        base_indicadores['UN'] / base_indicadores['PN']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para revisi√≥n detallada.
#    - Imputar con **0** si se considera que la empresa no gener√≥ utilidad pero ten√≠a patrimonio.
#    - **Eliminar registros NaN si afectan el an√°lisis financiero.**

# üîπ **Resumen de los valores en ROE**
casos_normales_ROE = ((base_indicadores['PN'] > 0)).sum()
casos_nan_ROE = ((base_indicadores['UN'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_ROE = ((base_indicadores['PN'] == 0) & (base_indicadores['UN'] > 0)).sum()
casos_negativos_ROE = ((base_indicadores['UN'] < 0) & (base_indicadores['PN'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en ROE (Rentabilidad sobre Patrimonio):**")
print(f"‚úÖ Casos normales: {casos_normales_ROE}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_ROE} ‚Üí üìå Se recomienda **mantener como NaN** si se quiere reflejar la falta de patrimonio, o **imputar con 0** en modelos predictivos para evitar errores.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_ROE}")
print(f"üîª Casos negativos (empresa con p√©rdidas): {casos_negativos_ROE}")

# üîπ **C√°lculo de RSV (Rentabilidad sobre Ventas)**
# üìå F√≥rmula: RSV = UN / V
# üìå Interpretaci√≥n:
#    - Indica qu√© porcentaje de cada unidad monetaria de ingresos se convierte en utilidad neta.
#    - Un RSV alto sugiere que la empresa es eficiente en la conversi√≥n de ingresos en beneficios.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si UN = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin ingresos ni utilidad)
# 2Ô∏è‚É£ Si UN > 0 y V = 0 ‚Üí ‚àû (empresa con utilidad neta pero sin ingresos reportados)
# 3Ô∏è‚É£ Si UN = 0 y V > 0 ‚Üí 0 (empresa con ingresos pero sin utilidad neta)
# 4Ô∏è‚É£ Si UN < 0 y V > 0 ‚Üí Negativo (empresa con p√©rdidas netas, bajo desempe√±o)
# 5Ô∏è‚É£ Si UN > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['RSV'] = np.where(
    (base_indicadores['UN'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['UN'] / base_indicadores['V']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para revisi√≥n detallada.
#    - Imputar con **0** si se considera que la empresa no tuvo utilidad pero s√≠ ventas.
#    - **Eliminar registros NaN si afectan el an√°lisis de rentabilidad.**

# üîπ **Resumen de los valores en RSV**
casos_normales_RSV = ((base_indicadores['V'] > 0)).sum()
casos_nan_RSV = ((base_indicadores['UN'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_RSV = ((base_indicadores['V'] == 0) & (base_indicadores['UN'] > 0)).sum()
casos_negativos_RSV = ((base_indicadores['UN'] < 0) & (base_indicadores['V'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en RSV (Rentabilidad sobre Ventas):**")
print(f"‚úÖ Casos normales: {casos_normales_RSV}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RSV} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos, ya que indica que la empresa no tuvo rentabilidad sobre ventas.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RSV}")
print(f"üîª Casos negativos (empresa con p√©rdidas): {casos_negativos_RSV}")



# üîπ **C√°lculo de ROI (Retorno sobre la Inversi√≥n)**
# üìå F√≥rmula: ROI = (UN + GF + Imp) / AF
# üìå Interpretaci√≥n:
#    - Mide la rentabilidad generada en relaci√≥n con los activos fijos de la empresa.
#    - Un ROI alto indica que la empresa es eficiente en el uso de sus activos fijos.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si (UN + GF + Imp) = 0 y AF = 0 ‚Üí NaN (indeterminado, empresa sin inversi√≥n ni rentabilidad)
# 2Ô∏è‚É£ Si (UN + GF + Imp) > 0 y AF = 0 ‚Üí ‚àû (empresa con rentabilidad pero sin inversi√≥n reportada)
# 3Ô∏è‚É£ Si (UN + GF + Imp) = 0 y AF > 0 ‚Üí 0 (empresa con inversi√≥n pero sin rentabilidad)
# 4Ô∏è‚É£ Si (UN + GF + Imp) < 0 y AF > 0 ‚Üí Negativo (empresa con p√©rdidas netas en relaci√≥n con la inversi√≥n)
# 5Ô∏è‚É£ Si (UN + GF + Imp) > 0 y AF > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['ROI'] = np.where(
    ((base_indicadores['UN'] + base_indicadores['GF'] + base_indicadores['Imp']) == 0) & (base_indicadores['AF'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AF'] == 0), np.inf,  # Caso 2: ‚àû (cuando AF = 0)
        (base_indicadores['UN'] + base_indicadores['GF'] + base_indicadores['Imp']) / base_indicadores['AF']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para revisi√≥n detallada.
#    - Imputar con **0** si se considera que la empresa no tuvo rentabilidad pero s√≠ inversi√≥n.
#    - **Eliminar registros NaN si afectan el an√°lisis financiero.**

# üîπ **Resumen de los valores en ROI**
casos_normales_ROI = ((base_indicadores['AF'] > 0)).sum()
casos_nan_ROI = (((base_indicadores['UN'] + base_indicadores['GF'] + base_indicadores['Imp']) == 0) & (base_indicadores['AF'] == 0)).sum()
casos_inf_ROI = ((base_indicadores['AF'] == 0) & ((base_indicadores['UN'] + base_indicadores['GF'] + base_indicadores['Imp']) > 0)).sum()
casos_negativos_ROI = (((base_indicadores['UN'] + base_indicadores['GF'] + base_indicadores['Imp']) < 0) & (base_indicadores['AF'] > 0)).sum()

print("\nüìä **Distribuci√≥n de casos en ROI (Retorno sobre la Inversi√≥n):**")
print(f"‚úÖ Casos normales: {casos_normales_ROI}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_ROI} ‚Üí üìå Se recomienda **mantener como NaN** si se quiere reflejar la falta de inversi√≥n, o **imputar con 0** en modelos predictivos para evitar errores.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_ROI}")
print(f"üîª Casos negativos (empresa con p√©rdidas en relaci√≥n con la inversi√≥n): {casos_negativos_ROI}")


# üîπ **C√°lculo de ME (Margen EBITDA)**
# üìå F√≥rmula: ME = EBITDA / V
# üìå Interpretaci√≥n:
#    - Indica qu√© porcentaje de los ingresos de la empresa se convierte en EBITDA.
#    - Un ME alto sugiere que la empresa tiene un modelo de negocio eficiente con menores costos operativos.
#    - Es un indicador clave en la valoraci√≥n de empresas y su capacidad de generaci√≥n de flujo de caja.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si EBITDA = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin ingresos ni EBITDA)
# 2Ô∏è‚É£ Si EBITDA > 0 y V = 0 ‚Üí ‚àû (empresa con EBITDA positivo pero sin ingresos reportados)
# 3Ô∏è‚É£ Si EBITDA = 0 y V > 0 ‚Üí 0 (empresa con ingresos pero sin EBITDA)
# 4Ô∏è‚É£ Si EBITDA < 0 y V > 0 ‚Üí Negativo (empresa con p√©rdidas operativas)
# 5Ô∏è‚É£ Si EBITDA > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['ME'] = np.where(
    (base_indicadores['EBITDA'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['EBITDA'] / base_indicadores['V']  # Casos 3, 4 y 5 juntos
    )
)

# üîπ **Manejo recomendado:**
#    - Mantener como **NaN** para revisi√≥n detallada.
#    - Imputar con **0** si se considera que la empresa no gener√≥ EBITDA pero s√≠ tuvo ingresos.
#    - **Eliminar registros NaN si afectan la interpretaci√≥n de la rentabilidad operativa.**

# üîπ **Resumen de los valores en ME**
casos_normales_ME = ((base_indicadores['V'] > 0)).sum()
casos_nan_ME = ((base_indicadores['EBITDA'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_ME = ((base_indicadores['V'] == 0) & (base_indicadores['EBITDA'] > 0)).sum()
casos_negativos_ME = ((base_indicadores['EBITDA'] < 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en ME (Margen EBITDA):**")
print(f"‚úÖ Casos normales: {casos_normales_ME}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_ME} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos, pues indica que la empresa no gener√≥ EBITDA.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_ME}")
print(f"üîª Casos negativos (empresa con EBITDA negativo): {casos_negativos_ME}")




# ==============================================================================
# üìå SECCI√ìN 4: C√ÅLCULO DE Indicadores de Rotaci√≥n y Eficiencia
# ==============================================================================


# üîπ **C√°lculo de RA (Rotaci√≥n de Activos)**
# üìå F√≥rmula: RA = V / AT
# üìå Interpretaci√≥n:
#    - Indica la eficiencia con la que una empresa utiliza sus activos para generar ingresos.
#    - Un valor m√°s alto sugiere una mejor utilizaci√≥n de los activos para generar ventas.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si V = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin ingresos ni activos)
# 2Ô∏è‚É£ Si V > 0 y AT = 0 ‚Üí ‚àû (empresa con ventas pero sin activos reportados)
# 3Ô∏è‚É£ Si V = 0 y AT > 0 ‚Üí 0 (empresa con activos pero sin ingresos)
# 4Ô∏è‚É£ Si V > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['RA'] = np.where(
    (base_indicadores['V'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0), np.inf,  # Caso 2: ‚àû (cuando AT = 0)
        base_indicadores['V'] / base_indicadores['AT']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RA**
casos_normales_RA = ((base_indicadores['AT'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_RA = ((base_indicadores['V'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_RA = ((base_indicadores['AT'] == 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RA (Rotaci√≥n de Activos):**")
print(f"‚úÖ Casos normales: {casos_normales_RA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RA} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RA} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica ventas sin activos reportados.")

# üîπ **C√°lculo de RI (Rotaci√≥n de Inventarios)**
# üìå F√≥rmula: RI = V / I
# üìå Interpretaci√≥n:
#    - Indica cu√°ntas veces la empresa vende y reemplaza su inventario en un per√≠odo determinado.
#    - Un valor alto sugiere que el inventario se mueve r√°pido, mientras que un valor bajo puede indicar acumulaci√≥n.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si V = 0 y I = 0 ‚Üí NaN (indeterminado, empresa sin ventas ni inventarios)
# 2Ô∏è‚É£ Si V > 0 y I = 0 ‚Üí ‚àû (empresa con ventas pero sin inventario reportado)
# 3Ô∏è‚É£ Si V = 0 y I > 0 ‚Üí 0 (empresa con inventario pero sin ventas)
# 4Ô∏è‚É£ Si V > 0 y I > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['RI'] = np.where(
    (base_indicadores['V'] == 0) & (base_indicadores['I'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['I'] == 0), np.inf,  # Caso 2: ‚àû (cuando I = 0)
        base_indicadores['V'] / base_indicadores['I']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RI**
casos_normales_RI = ((base_indicadores['I'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_RI = ((base_indicadores['V'] == 0) & (base_indicadores['I'] == 0)).sum()
casos_inf_RI = ((base_indicadores['I'] == 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RI (Rotaci√≥n de Inventarios):**")
print(f"‚úÖ Casos normales: {casos_normales_RI}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RI} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RI} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica ventas sin inventario registrado.")

# üîπ **C√°lculo de RCC (Rotaci√≥n de Cuentas por Cobrar)**
# üìå F√≥rmula: RCC = V / CPC
# üìå Interpretaci√≥n:
#    - Indica cu√°ntas veces la empresa convierte sus cuentas por cobrar en efectivo durante un per√≠odo.
#    - Un valor alto sugiere que la empresa cobra r√°pidamente a sus clientes, mientras que un valor bajo puede indicar problemas de liquidez.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si V = 0 y CPC = 0 ‚Üí NaN (indeterminado, empresa sin ventas ni cuentas por cobrar)
# 2Ô∏è‚É£ Si V > 0 y CPC = 0 ‚Üí ‚àû (empresa con ventas pero sin cuentas por cobrar registradas)
# 3Ô∏è‚É£ Si V = 0 y CPC > 0 ‚Üí 0 (empresa con cuentas por cobrar pero sin ventas)
# 4Ô∏è‚É£ Si V > 0 y CPC > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['RCC'] = np.where(
    (base_indicadores['V'] == 0) & (base_indicadores['CPC'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['CPC'] == 0), np.inf,  # Caso 2: ‚àû (cuando CPC = 0)
        base_indicadores['V'] / base_indicadores['CPC']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCC**
casos_normales_RCC = ((base_indicadores['CPC'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_RCC = ((base_indicadores['V'] == 0) & (base_indicadores['CPC'] == 0)).sum()
casos_inf_RCC = ((base_indicadores['CPC'] == 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCC (Rotaci√≥n de Cuentas por Cobrar):**")
print(f"‚úÖ Casos normales: {casos_normales_RCC}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCC} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCC} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica ventas sin cuentas por cobrar registradas.")


# üîπ **C√°lculo de RCP (Rotaci√≥n de Cuentas por Pagar)**
# üìå F√≥rmula: RCP = V / CPP
# üìå Interpretaci√≥n:
#    - Indica cu√°ntas veces la empresa paga sus cuentas a proveedores en un per√≠odo determinado.
#    - Un valor alto sugiere que la empresa paga r√°pidamente a sus proveedores, mientras que un valor bajo puede indicar dependencia del cr√©dito.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si V = 0 y CPP = 0 ‚Üí NaN (indeterminado, empresa sin ventas ni cuentas por pagar)
# 2Ô∏è‚É£ Si V > 0 y CPP = 0 ‚Üí ‚àû (empresa con ventas pero sin cuentas por pagar registradas)
# 3Ô∏è‚É£ Si V = 0 y CPP > 0 ‚Üí 0 (empresa con cuentas por pagar pero sin ventas)
# 4Ô∏è‚É£ Si V > 0 y CPP > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['RCP'] = np.where(
    (base_indicadores['V'] == 0) & (base_indicadores['CPP'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['CPP'] == 0), np.inf,  # Caso 2: ‚àû (cuando CPP = 0)
        base_indicadores['V'] / base_indicadores['CPP']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en RCP**
casos_normales_RCP = ((base_indicadores['CPP'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_RCP = ((base_indicadores['V'] == 0) & (base_indicadores['CPP'] == 0)).sum()
casos_inf_RCP = ((base_indicadores['CPP'] == 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en RCP (Rotaci√≥n de Cuentas por Pagar):**")
print(f"‚úÖ Casos normales: {casos_normales_RCP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_RCP} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_RCP} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica ventas sin cuentas por pagar registradas.")
# üîπ **C√°lculo de PPC (Per√≠odo Promedio de Cobro)**
# üìå F√≥rmula: PPC = CPC / (V / 365)
# üìå Interpretaci√≥n:
#    - Indica cu√°ntos d√≠as, en promedio, tarda la empresa en cobrar sus cuentas por cobrar.
#    - Un valor alto sugiere que la empresa tarda en recibir el dinero de sus clientes.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si CPC = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin cuentas por cobrar ni ventas)
# 2Ô∏è‚É£ Si CPC > 0 y V = 0 ‚Üí ‚àû (empresa con cuentas por cobrar pero sin ventas registradas)
# 3Ô∏è‚É£ Si CPC = 0 y V > 0 ‚Üí 0 (empresa sin cuentas por cobrar, solo ventas de contado)
# 4Ô∏è‚É£ Si CPC > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['PPC'] = np.where(
    (base_indicadores['CPC'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['CPC'] / (base_indicadores['V'] / 365)  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en PPC**
casos_normales_PPC = ((base_indicadores['CPC'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_PPC = ((base_indicadores['CPC'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_PPC = ((base_indicadores['V'] == 0) & (base_indicadores['CPC'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PPC (Per√≠odo Promedio de Cobro):**")
print(f"‚úÖ Casos normales: {casos_normales_PPC}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_PPC} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_PPC} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica cuentas por cobrar sin ventas registradas.")

# üîπ **C√°lculo de PPP (Per√≠odo Promedio de Pago)**
# üìå F√≥rmula: PPP = CPP / (V / 365)
# üìå Interpretaci√≥n:
#    - Indica cu√°ntos d√≠as, en promedio, tarda la empresa en pagar sus cuentas por pagar.
#    - Un valor alto sugiere que la empresa est√° retrasando sus pagos, lo cual puede ser indicativo de problemas de liquidez.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si CPP = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin cuentas por pagar ni ventas)
# 2Ô∏è‚É£ Si CPP > 0 y V = 0 ‚Üí ‚àû (empresa con cuentas por pagar pero sin ventas registradas)
# 3Ô∏è‚É£ Si CPP = 0 y V > 0 ‚Üí 0 (empresa sin cuentas por pagar, solo ventas de contado)
# 4Ô∏è‚É£ Si CPP > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['PPP'] = np.where(
    (base_indicadores['CPP'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['CPP'] / (base_indicadores['V'] / 365)  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en PPP**
casos_normales_PPP = ((base_indicadores['CPP'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_PPP = ((base_indicadores['CPP'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_PPP = ((base_indicadores['V'] == 0) & (base_indicadores['CPP'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PPP (Per√≠odo Promedio de Pago):**")
print(f"‚úÖ Casos normales: {casos_normales_PPP}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_PPP} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_PPP} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica cuentas por pagar sin ventas registradas.")
# üîπ **C√°lculo de PPI (Per√≠odo Promedio de Inventarios)**
# üìå F√≥rmula: PPI = I / (V / 365)
# üìå Interpretaci√≥n:
#    - Indica cu√°ntos d√≠as, en promedio, la empresa tarda en vender su inventario.
#    - Un valor alto sugiere que la empresa tiene problemas para rotar su inventario, lo cual puede afectar su liquidez.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si I = 0 y V = 0 ‚Üí NaN (indeterminado, empresa sin inventario ni ventas)
# 2Ô∏è‚É£ Si I > 0 y V = 0 ‚Üí ‚àû (empresa con inventario pero sin ventas registradas)
# 3Ô∏è‚É£ Si I = 0 y V > 0 ‚Üí 0 (empresa sin inventario, solo ventas de servicios o productos de terceros)
# 4Ô∏è‚É£ Si I > 0 y V > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['PPI'] = np.where(
    (base_indicadores['I'] == 0) & (base_indicadores['V'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['V'] == 0), np.inf,  # Caso 2: ‚àû (cuando V = 0)
        base_indicadores['I'] / (base_indicadores['V'] / 365)  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en PPI**
casos_normales_PPI = ((base_indicadores['I'] > 0)).sum()  # Casos normales incluyen V=0
casos_nan_PPI = ((base_indicadores['I'] == 0) & (base_indicadores['V'] == 0)).sum()
casos_inf_PPI = ((base_indicadores['V'] == 0) & (base_indicadores['I'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PPI (Per√≠odo Promedio de Inventarios):**")
print(f"‚úÖ Casos normales: {casos_normales_PPI}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_PPI} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_PPI} ‚Üí üìå Se recomienda **mantener como ‚àû**, pues indica inventario sin ventas registradas.")


# ==============================================================================
# üìå SECCI√ìN 5: C√ÅLCULO DE Indicadores de Productividad y Generaci√≥n de Valor
# ==============================================================================

# üîπ **C√°lculo de KTNO (Capital de Trabajo Neto Operativo)**
# üìå F√≥rmula: KTNO = CPC + I - CPP
# üìå Interpretaci√≥n:
#    - Representa la liquidez operativa de la empresa considerando cuentas por cobrar, inventarios y cuentas por pagar.
#    - Un valor alto indica que la empresa tiene m√°s recursos disponibles a corto plazo, mientras que un valor negativo sugiere problemas de liquidez.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si CPC, I y CPP son NaN ‚Üí NaN (no se puede calcular)
# 2Ô∏è‚É£ Si solo CPC e I son NaN, pero CPP tiene valor ‚Üí KTNO = -CPP
# 3Ô∏è‚É£ Si solo CPP es NaN, pero CPC e I tienen valores ‚Üí KTNO = CPC + I
# 4Ô∏è‚É£ Si hay valores en los tres ‚Üí KTNO = CPC + I - CPP (normal)

base_indicadores['KTNO'] = np.where(
    base_indicadores[['CPC', 'I', 'CPP']].isna().all(axis=1), np.nan,  # Caso 1: NaN
    np.where(
        base_indicadores[['CPC', 'I']].isna().all(axis=1), -base_indicadores['CPP'],  # Caso 2: Solo CPP
        np.where(
            base_indicadores['CPP'].isna(), base_indicadores['CPC'] + base_indicadores['I'],  # Caso 3: Sin CPP
            base_indicadores['CPC'] + base_indicadores['I'] - base_indicadores['CPP']  # Caso 4: Normal
        )
    )
)

# üîπ **Resumen de los valores en KTNO**
casos_normales_KTNO = ((~base_indicadores['KTNO'].isna())).sum()
casos_nan_KTNO = base_indicadores['KTNO'].isna().sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en KTNO (Capital de Trabajo Neto Operativo):**")
print(f"‚úÖ Casos normales: {casos_normales_KTNO}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_KTNO} ‚Üí üìå Se recomienda **imputar con 0** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
# üîπ **C√°lculo de PKT (Productividad del Capital de Trabajo)**
# üìå F√≥rmula: PKT = V / KTNO
# üìå Interpretaci√≥n:
#    - Mide cu√°ntas veces las ventas cubren el capital de trabajo neto operativo.
#    - Un valor alto sugiere que la empresa genera muchas ventas con su capital de trabajo.
#    - Un valor bajo indica que la empresa necesita m√°s capital de trabajo para generar ventas.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si V = 0 y KTNO = 0 ‚Üí NaN (indeterminado)
# 2Ô∏è‚É£ Si V > 0 y KTNO = 0 ‚Üí ‚àû (empresa con ingresos pero sin capital de trabajo)
# 3Ô∏è‚É£ Si V = 0 y KTNO > 0 ‚Üí 0 (empresa sin ingresos, pero con capital de trabajo)
# 4Ô∏è‚É£ Si V > 0 y KTNO > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['PKT'] = np.where(
    (base_indicadores['V'] == 0) & (base_indicadores['KTNO'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['KTNO'] == 0), np.inf,  # Caso 2: ‚àû (cuando KTNO = 0)
        base_indicadores['V'] / base_indicadores['KTNO']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en PKT**
casos_normales_PKT = ((base_indicadores['KTNO'] > 0)).sum()  # Casos normales incluyen V = 0
casos_nan_PKT = ((base_indicadores['V'] == 0) & (base_indicadores['KTNO'] == 0)).sum()
casos_inf_PKT = ((base_indicadores['KTNO'] == 0) & (base_indicadores['V'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PKT (Productividad del Capital de Trabajo):**")
print(f"‚úÖ Casos normales: {casos_normales_PKT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_PKT} ‚Üí üìå Se recomienda **imputar con 1** en modelos predictivos o mantener como NaN en an√°lisis financiero.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_PKT}")
# üîπ **C√°lculo de PCD (Palanca de Crecimiento)**
# üìå F√≥rmula: PCD = ME / PKT
# üìå Interpretaci√≥n:
#    - Mide qu√© tan eficiente es la empresa en transformar su margen EBITDA en crecimiento.
#    - Un valor alto sugiere que la empresa genera altos m√°rgenes con una baja inversi√≥n en capital de trabajo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si ME = 0 y PKT = 0 ‚Üí NaN (indeterminado, no hay margen ni productividad)
# 2Ô∏è‚É£ Si ME > 0 y PKT = 0 ‚Üí 0 (empresa con margen pero sin productividad ‚Üí no hay palanca real)
# 3Ô∏è‚É£ Si ME = 0 y PKT > 0 ‚Üí 0 (empresa sin margen, pero con capital productivo no aprovechado)
# 4Ô∏è‚É£ Si ME > 0 y PKT > 0 ‚Üí Normal (se calcula la eficiencia real del capital)

base_indicadores['PCD'] = np.where(
    (base_indicadores['ME'] == 0) & (base_indicadores['PKT'] == 0), np.nan,  # Caso 1: indeterminado
    np.where(
        (base_indicadores['PKT'] == 0), 0,  # Caso 2: sin productividad, sin eficiencia transformadora
        base_indicadores['ME'] / base_indicadores['PKT']  # Casos 3 y 4: c√°lculo normal
    )
)

# üîπ **Resumen de los valores en PCD**
casos_normales_PCD = ((base_indicadores['PKT'] > 0)).sum()
casos_nan_PCD = ((base_indicadores['ME'] == 0) & (base_indicadores['PKT'] == 0)).sum()
casos_cero_por_productividad = ((base_indicadores['PKT'] == 0) & (base_indicadores['ME'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en PCD (Palanca de Crecimiento):**")
print(f"‚úÖ Casos normales (PKT > 0): {casos_normales_PCD}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado: ME = 0 y PKT = 0): {casos_nan_PCD} ‚Üí üìå Se recomienda imputar con 0 en modelos predictivos.")
print(f"üîª Casos con PCD = 0 por falta de productividad (PKT = 0 y ME > 0): {casos_cero_por_productividad} ‚Üí üìå Se interpreta como sin eficiencia transformadora.")


# üîπ **C√°lculo de EVA (Valor Econ√≥mico Agregado)**
# üìå F√≥rmula: EVA = EBITDA - (EBITDA * PCD)
# üìå Interpretaci√≥n:
#    - Representa la generaci√≥n de valor econ√≥mico despu√©s de considerar el costo del capital.
#    - Un valor positivo indica que la empresa est√° generando m√°s retorno del requerido.
#    - Un valor negativo sugiere que la empresa no est√° cubriendo su costo de capital.
#
# üìå Ajuste para modelos predictivos:
#    - Si PCD es NaN (empresa sin margen ni productividad), se asume como 0.
#    - Esto evita distorsiones y mantiene la coherencia del indicador.

# ‚úÖ Reemplazar NaN de PCD por 0 SOLO para el c√°lculo de EVA (sin modificar el original)
PCD_ajustada = base_indicadores['PCD'].fillna(0)

# üîß Calcular EVA usando la versi√≥n ajustada
base_indicadores['EVA'] = base_indicadores['EBITDA'] - (base_indicadores['EBITDA'] * PCD_ajustada)

# üîπ **Resumen de los valores en EVA**
casos_normales_EVA = (base_indicadores['EBITDA'] > 0).sum()
casos_cero_EVA = ((base_indicadores['EBITDA'] == 0) & (PCD_ajustada > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en EVA (Valor Econ√≥mico Agregado):**")
print(f"‚úÖ Casos normales (EBITDA > 0): {casos_normales_EVA}")
print(f"üîò Casos en cero (sin EBITDA pero con PCD): {casos_cero_EVA} ‚Üí üìå En modelos predictivos, se mantiene como 0 para evitar distorsiones.")



# ==============================================================================
# üìå SECCI√ìN 6: C√ÅLCULO DE Indicadores de Estructura Financiera
# ==============================================================================

# üîπ **C√°lculo de DCA (Deuda Total sobre Activos)**
# üìå F√≥rmula: DCA = PT / AT
# üìå Interpretaci√≥n:
#    - Muestra qu√© porcentaje de los activos est√° financiado con deuda.
#    - Un valor alto indica una mayor dependencia del endeudamiento.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si PT = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin deuda ni activos)
# 2Ô∏è‚É£ Si PT > 0 y AT = 0 ‚Üí ‚àû (empresa con deuda pero sin activos reportados)
# 3Ô∏è‚É£ Si PT = 0 y AT > 0 ‚Üí 0 (empresa sin deuda, totalmente financiada por capital propio)
# 4Ô∏è‚É£ Si PT > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['DCA'] = np.where(
    (base_indicadores['PT'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0), np.inf,  # Caso 2: ‚àû (cuando AT = 0)
        base_indicadores['PT'] / base_indicadores['AT']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en DCA**
casos_normales_DCA = ((base_indicadores['AT'] > 0)).sum()  # Casos normales incluyen PT = 0
casos_nan_DCA = ((base_indicadores['PT'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_DCA = ((base_indicadores['AT'] == 0) & (base_indicadores['PT'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en DCA (Deuda Total sobre Activos):**")
print(f"‚úÖ Casos normales: {casos_normales_DCA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_DCA} ‚Üí üìå En modelos predictivos, **se recomienda imputar con 0**, ya que indica una empresa sin activos ni deuda.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_DCA} ‚Üí üìå Se recomienda **eliminar estos casos** en an√°lisis financiero, ya que reflejan datos inconsistentes (deuda sin activos).")
# üîπ **C√°lculo de CPA (Capital Propio sobre Activos)**
# üìå F√≥rmula: CPA = PN / AT
# üìå Interpretaci√≥n:
#    - Indica qu√© proporci√≥n de los activos est√° financiada con capital propio.
#    - Un valor alto significa mayor solidez financiera y menor dependencia del endeudamiento.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si PN = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin capital ni activos)
# 2Ô∏è‚É£ Si PN > 0 y AT = 0 ‚Üí ‚àû (empresa con patrimonio pero sin activos reportados)
# 3Ô∏è‚É£ Si PN = 0 y AT > 0 ‚Üí 0 (empresa sin capital propio, totalmente financiada con deuda)
# 4Ô∏è‚É£ Si PN > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n)

base_indicadores['CPA'] = np.where(
    (base_indicadores['PN'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0), np.inf,  # Caso 2: ‚àû (cuando AT = 0)
        base_indicadores['PN'] / base_indicadores['AT']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en CPA**
casos_normales_CPA = ((base_indicadores['AT'] > 0)).sum()  # Casos normales incluyen PN = 0
casos_nan_CPA = ((base_indicadores['PN'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_CPA = ((base_indicadores['AT'] == 0) & (base_indicadores['PN'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CPA (Capital Propio sobre Activos):**")
print(f"‚úÖ Casos normales: {casos_normales_CPA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CPA} ‚Üí üìå En modelos predictivos, **se recomienda imputar con 0**, ya que representa una empresa sin activos ni patrimonio.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_CPA} ‚Üí üìå Se recomienda **eliminar estos casos** en an√°lisis financiero, ya que indican inconsistencia en los datos (capital sin activos).")

# üîπ **C√°lculo de DATA (Deuda Total sobre Activos)**
# üìå F√≥rmula: DATA = PT / AT
# üìå Interpretaci√≥n:
#    - Indica qu√© porcentaje de los activos de la empresa est√°n financiados con deuda.
#    - Un valor alto sugiere una alta dependencia del financiamiento externo.
#    - Empresas con DATA elevado pueden enfrentar mayor riesgo financiero.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si PT = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin activos ni pasivos).
# 2Ô∏è‚É£ Si PT > 0 y AT = 0 ‚Üí ‚àû (empresa con deuda pero sin activos reportados, lo cual no tiene sentido financiero).
# 3Ô∏è‚É£ Si PT = 0 y AT > 0 ‚Üí 0 (empresa sin deuda, solo con activos propios).
# 4Ô∏è‚É£ Si PT > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n).

base_indicadores['DATA'] = np.where(
    (base_indicadores['PT'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0), np.inf,  # Caso 2: ‚àû
        base_indicadores['PT'] / base_indicadores['AT']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en DATA**
casos_normales_DATA = ((base_indicadores['AT'] > 0)).sum()
casos_nan_DATA = ((base_indicadores['PT'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_DATA = ((base_indicadores['AT'] == 0) & (base_indicadores['PT'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en DATA (Deuda Total sobre Activos):**")
print(f"‚úÖ Casos normales: {casos_normales_DATA}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_DATA} ‚Üí üìå **Manejo recomendado:** **Imputar con 0** en modelos predictivos, ya que significa empresa sin activos ni deuda.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_DATA} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, pues una empresa con deuda pero sin activos no es financieramente consistente.")

# ==============================================================================

# üîπ **C√°lculo de DLPC (Deuda de Largo Plazo sobre Capital)**
# üìå F√≥rmula: DLPC = PLP / PN
# üìå Interpretaci√≥n:
#    - Indica qu√© proporci√≥n del patrimonio de la empresa est√° comprometida con deuda a largo plazo.
#    - Un valor alto indica un mayor apalancamiento en el largo plazo.
#    - Empresas con DLPC alto pueden enfrentar dificultades de liquidez futura.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si PLP = 0 y PN = 0 ‚Üí NaN (indeterminado, empresa sin patrimonio ni pasivos de largo plazo).
# 2Ô∏è‚É£ Si PLP > 0 y PN = 0 ‚Üí ‚àû (empresa con deuda de largo plazo pero sin patrimonio, indicativo de alto riesgo financiero).
# 3Ô∏è‚É£ Si PLP = 0 y PN > 0 ‚Üí 0 (empresa sin deuda de largo plazo, solo con patrimonio).
# 4Ô∏è‚É£ Si PLP > 0 y PN > 0 ‚Üí Normal (se calcula la divisi√≥n).

base_indicadores['DLPC'] = np.where(
    (base_indicadores['PLP'] == 0) & (base_indicadores['PN'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['PN'] == 0), np.inf,  # Caso 2: ‚àû
        base_indicadores['PLP'] / base_indicadores['PN']  # Caso 3 y 4 juntos
    )
)

# üîπ **Resumen de los valores en DLPC**
casos_normales_DLPC = ((base_indicadores['PN'] > 0)).sum()
casos_nan_DLPC = ((base_indicadores['PLP'] == 0) & (base_indicadores['PN'] == 0)).sum()
casos_inf_DLPC = ((base_indicadores['PN'] == 0) & (base_indicadores['PLP'] > 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en DLPC (Deuda de Largo Plazo sobre Capital):**")
print(f"‚úÖ Casos normales: {casos_normales_DLPC}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_DLPC} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que representa una empresa sin deuda de largo plazo ni patrimonio.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_DLPC} ‚Üí üìå **Manejo recomendado:** **Mantener en infinito o imputar con un valor alto (ej. 10)** para modelos predictivos.")


# üîπ **C√°lculo de CCNAT (Capital de Trabajo Neto sobre Activos Totales)**
# üìå F√≥rmula: CCNAT = (AC - PCP) / AT
# üìå Interpretaci√≥n:
#    - Indica la proporci√≥n de los activos totales que representan el capital de trabajo neto.
#    - Un valor positivo sugiere que la empresa tiene m√°s activos corrientes que pasivos corrientes, lo que es una se√±al de liquidez.
#    - Un valor negativo indica que la empresa depende demasiado del financiamiento de corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si (AC - PCP) = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin activos ni capital de trabajo).
# 2Ô∏è‚É£ Si (AC - PCP) > 0 y AT = 0 ‚Üí ‚àû (empresa con capital de trabajo positivo pero sin activos totales, inconsistente).
# 3Ô∏è‚É£ Si (AC - PCP) < 0 y AT = 0 ‚Üí -‚àû (empresa con capital de trabajo negativo pero sin activos totales, inconsistente).
# 4Ô∏è‚É£ Si (AC - PCP) = 0 y AT > 0 ‚Üí 0 (empresa con capital de trabajo neto neutro).
# 5Ô∏è‚É£ Si (AC - PCP) > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n).
# 6Ô∏è‚É£ Si (AC - PCP) < 0 y AT > 0 ‚Üí Negativo (empresa con mayor pasivo corriente que activos corrientes).

base_indicadores['CCNAT'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0), np.inf,  # Caso 2: ‚àû
        np.where(
            (base_indicadores['AT'] == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0), -np.inf,  # Caso 3: -‚àû
            (base_indicadores['AC'] - base_indicadores['PCP']) / base_indicadores['AT']  # Casos 4, 5 y 6 juntos
        )
    )
)

# üîπ **Resumen de los valores en CCNAT**
casos_normales_CCNAT = ((base_indicadores['AT'] > 0)).sum()
casos_nan_CCNAT = (((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_CCNAT = ((base_indicadores['AT'] == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0)).sum()
casos_neginf_CCNAT = ((base_indicadores['AT'] == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CCNAT (Capital de Trabajo Neto sobre Activos Totales):**")
print(f"‚úÖ Casos normales: {casos_normales_CCNAT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CCNAT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que indica empresa sin activos ni capital de trabajo.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_CCNAT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")
print(f"‚ôæÔ∏è Casos Infinito negativo: {casos_neginf_CCNAT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")

# ==============================================================================

# üîπ **C√°lculo de CTNAT (Capital de Trabajo Neto sobre Activos Totales)**
# üìå F√≥rmula: CTNAT = CTN / AT
# üìå Interpretaci√≥n:
#    - Similar a CCNAT, pero usa el capital de trabajo neto (CTN) previamente calculado.
#    - Muestra qu√© parte de los activos totales est√° comprometida con el capital de trabajo neto.
#    - Un valor positivo es se√±al de estabilidad financiera.
#    - Un valor negativo indica posible insolvencia a corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si CTN = 0 y AT = 0 ‚Üí NaN (indeterminado, empresa sin activos ni capital de trabajo).
# 2Ô∏è‚É£ Si CTN > 0 y AT = 0 ‚Üí ‚àû (empresa con capital de trabajo positivo pero sin activos totales, inconsistente).
# 3Ô∏è‚É£ Si CTN < 0 y AT = 0 ‚Üí -‚àû (empresa con capital de trabajo negativo pero sin activos totales, inconsistente).
# 4Ô∏è‚É£ Si CTN = 0 y AT > 0 ‚Üí 0 (empresa con capital de trabajo neutro).
# 5Ô∏è‚É£ Si CTN > 0 y AT > 0 ‚Üí Normal (se calcula la divisi√≥n).
# 6Ô∏è‚É£ Si CTN < 0 y AT > 0 ‚Üí Negativo (empresa con mayor pasivo corriente que activos corrientes).

base_indicadores['CTNAT'] = np.where(
    (base_indicadores['CTN'] == 0) & (base_indicadores['AT'] == 0), np.nan,  # Caso 1: NaN
    np.where(
        (base_indicadores['AT'] == 0) & (base_indicadores['CTN'] > 0), np.inf,  # Caso 2: ‚àû
        np.where(
            (base_indicadores['AT'] == 0) & (base_indicadores['CTN'] < 0), -np.inf,  # Caso 3: -‚àû
            base_indicadores['CTN'] / base_indicadores['AT']  # Casos 4, 5 y 6 juntos
        )
    )
)

# üîπ **Resumen de los valores en CTNAT**
casos_normales_CTNAT = ((base_indicadores['AT'] > 0)).sum()
casos_nan_CTNAT = ((base_indicadores['CTN'] == 0) & (base_indicadores['AT'] == 0)).sum()
casos_inf_CTNAT = ((base_indicadores['AT'] == 0) & (base_indicadores['CTN'] > 0)).sum()
casos_neginf_CTNAT = ((base_indicadores['AT'] == 0) & (base_indicadores['CTN'] < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CTNAT (Capital de Trabajo Neto sobre Activos Totales):**")
print(f"‚úÖ Casos normales: {casos_normales_CTNAT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CTNAT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que indica empresa sin activos ni capital de trabajo.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_CTNAT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")
print(f"‚ôæÔ∏è Casos Infinito negativo: {casos_neginf_CTNAT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")

  # üîπ **C√°lculo de CCT (Capital Contable sobre Pasivos Totales)**
  # üìå F√≥rmula: CCT = PN / (PN + PT)
  # üìå Interpretaci√≥n:
  #    - Indica la proporci√≥n del capital contable (patrimonio) en relaci√≥n con la estructura de financiamiento total.
  #    - Un valor alto significa menor dependencia del endeudamiento y mayor estabilidad financiera.
  #
  # üìå Manejo de casos:
  # 1Ô∏è‚É£ Si PN = 0 y PT = 0 ‚Üí NaN (indeterminado, empresa sin patrimonio ni pasivos).
  # 2Ô∏è‚É£ Si PN > 0 y PT = 0 ‚Üí 1 (empresa sin pasivos, totalmente financiada por capital propio).
  # 3Ô∏è‚É£ Si PN = 0 y PT > 0 ‚Üí 0 (empresa sin capital propio, totalmente financiada con deuda).
  # 4Ô∏è‚É£ Si PN > 0 y PT > 0 ‚Üí Normal (se calcula la divisi√≥n).

  base_indicadores['CCT'] = np.where(
      (base_indicadores['PN'] == 0) & (base_indicadores['PT'] == 0), np.nan,  # Caso 1: NaN
      np.where(
          (base_indicadores['PT'] == 0), 1,  # Caso 2: 1 (empresa sin pasivos)
          np.where(
              (base_indicadores['PN'] == 0), 0,  # Caso 3: 0 (empresa sin capital propio)
              base_indicadores['PN'] / (base_indicadores['PN'] + base_indicadores['PT'])  # Caso 4: Normal
          )
      )
  )

  # üîπ **Resumen de los valores en CCT**
  casos_normales_CCT = ((base_indicadores['PN'] > 0) & (base_indicadores['PT'] > 0)).sum()
  casos_nan_CCT = ((base_indicadores['PN'] == 0) & (base_indicadores['PT'] == 0)).sum()
  casos_1_CCT = ((base_indicadores['PT'] == 0) & (base_indicadores['PN'] > 0)).sum()
  casos_0_CCT = ((base_indicadores['PN'] == 0) & (base_indicadores['PT'] > 0)).sum()

  # üìå Imprimir los resultados para verificar
  print("\nüìä **Distribuci√≥n de casos en CCT (Capital Contable sobre Pasivos Totales):**")
  print(f"‚úÖ Casos normales: {casos_normales_CCT}")
  print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CCT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0.5**, para reflejar una estructura de financiamiento balanceada en ausencia de informaci√≥n.")
  print(f"üîπ Casos con valor 1: {casos_1_CCT} ‚Üí üìå Empresas sin pasivos, totalmente financiadas con patrimonio.")
  print(f"üîπ Casos con valor 0: {casos_0_CCT} ‚Üí üìå Empresas sin capital propio, financiadas √∫nicamente con deuda.")

# ==============================================================================

# üîπ **C√°lculo de CCNCT (Capital de Trabajo Neto sobre Capital Total)**
# üìå F√≥rmula: CCNCT = (AC - PCP) / (PN + PT)
# üìå Interpretaci√≥n:
#    - Mide la proporci√≥n del capital total que est√° comprometida con el capital de trabajo neto.
#    - Un valor positivo indica mayor liquidez y capacidad de cubrir pasivos a corto plazo con activos corrientes.
#    - Un valor negativo indica que la empresa depende demasiado del financiamiento externo a corto plazo.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si (AC - PCP) = 0 y (PN + PT) = 0 ‚Üí NaN (indeterminado, empresa sin capital total ni capital de trabajo).
# 2Ô∏è‚É£ Si (AC - PCP) > 0 y (PN + PT) = 0 ‚Üí ‚àû (empresa con capital de trabajo positivo pero sin capital total, inconsistente).
# 3Ô∏è‚É£ Si (AC - PCP) < 0 y (PN + PT) = 0 ‚Üí -‚àû (empresa con capital de trabajo negativo pero sin capital total, inconsistente).
# 4Ô∏è‚É£ Si (AC - PCP) = 0 y (PN + PT) > 0 ‚Üí 0 (empresa con capital de trabajo neutro).
# 5Ô∏è‚É£ Si (AC - PCP) > 0 y (PN + PT) > 0 ‚Üí Normal (se calcula la divisi√≥n).
# 6Ô∏è‚É£ Si (AC - PCP) < 0 y (PN + PT) > 0 ‚Üí Negativo (empresa con mayor pasivo corriente que activos corrientes).

base_indicadores['CCNCT'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & ((base_indicadores['PN'] + base_indicadores['PT']) == 0), np.nan,  # Caso 1: NaN
    np.where(
        ((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0), np.inf,  # Caso 2: ‚àû
        np.where(
            ((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0), -np.inf,  # Caso 3: -‚àû
            (base_indicadores['AC'] - base_indicadores['PCP']) / (base_indicadores['PN'] + base_indicadores['PT'])  # Casos 4, 5 y 6 juntos
        )
    )
)

# üîπ **Resumen de los valores en CCNCT**
casos_normales_CCNCT = ((base_indicadores['PN'] + base_indicadores['PT'] > 0)).sum()
casos_nan_CCNCT = (((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & ((base_indicadores['PN'] + base_indicadores['PT']) == 0)).sum()
casos_inf_CCNCT = (((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0)).sum()
casos_neginf_CCNCT = (((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CCNCT (Capital de Trabajo Neto sobre Capital Total):**")
print(f"‚úÖ Casos normales: {casos_normales_CCNCT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CCNCT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que representa ausencia de capital total y capital de trabajo neto.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_CCNCT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")
print(f"‚ôæÔ∏è Casos Infinito negativo: {casos_neginf_CCNCT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")

# üîπ **C√°lculo de CTNCT (Capital de Trabajo Neto sobre Capital Total)**
# üìå F√≥rmula: CTNCT = (AC - PCP) / (PN + PT)
# üìå Interpretaci√≥n:
#    - Muestra qu√© proporci√≥n del capital total est√° destinada al capital de trabajo neto.
#    - Un valor alto indica mayor capacidad de la empresa para operar sin depender del financiamiento externo a corto plazo.
#    - Un valor negativo sugiere que los pasivos corrientes superan los activos corrientes, lo que indica problemas de liquidez.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si (AC - PCP) = 0 y (PN + PT) = 0 ‚Üí NaN (indeterminado, empresa sin capital total ni capital de trabajo).
# 2Ô∏è‚É£ Si (AC - PCP) > 0 y (PN + PT) = 0 ‚Üí ‚àû (empresa con capital de trabajo pero sin capital total, inconsistente).
# 3Ô∏è‚É£ Si (AC - PCP) < 0 y (PN + PT) = 0 ‚Üí -‚àû (empresa con capital de trabajo negativo pero sin capital total, inconsistente).
# 4Ô∏è‚É£ Si (AC - PCP) = 0 y (PN + PT) > 0 ‚Üí 0 (empresa con capital de trabajo neutro).
# 5Ô∏è‚É£ Si (AC - PCP) > 0 y (PN + PT) > 0 ‚Üí Normal (se calcula la divisi√≥n).
# 6Ô∏è‚É£ Si (AC - PCP) < 0 y (PN + PT) > 0 ‚Üí Negativo (empresa con pasivos corrientes superiores a activos corrientes).

base_indicadores['CTNCT'] = np.where(
    ((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & ((base_indicadores['PN'] + base_indicadores['PT']) == 0), np.nan,  # Caso 1: NaN
    np.where(
        ((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0), np.inf,  # Caso 2: ‚àû
        np.where(
            ((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0), -np.inf,  # Caso 3: -‚àû
            (base_indicadores['AC'] - base_indicadores['PCP']) / (base_indicadores['PN'] + base_indicadores['PT'])  # Casos 4, 5 y 6 juntos
        )
    )
)

# üîπ **Resumen de los valores en CTNCT**
casos_normales_CTNCT = ((base_indicadores['PN'] + base_indicadores['PT'] > 0)).sum()
casos_nan_CTNCT = (((base_indicadores['AC'] - base_indicadores['PCP']) == 0) & ((base_indicadores['PN'] + base_indicadores['PT']) == 0)).sum()
casos_inf_CTNCT = (((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) > 0)).sum()
casos_neginf_CTNCT = (((base_indicadores['PN'] + base_indicadores['PT']) == 0) & ((base_indicadores['AC'] - base_indicadores['PCP']) < 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en CTNCT (Capital de Trabajo Neto sobre Capital Total):**")
print(f"‚úÖ Casos normales: {casos_normales_CTNCT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_CTNCT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que representa ausencia de capital total y capital de trabajo neto.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_CTNCT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")
print(f"‚ôæÔ∏è Casos Infinito negativo: {casos_neginf_CTNCT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")

# ==============================================================================

# üîπ **C√°lculo de AFT (Activos Fijos sobre Total Financiamiento)**
# üìå F√≥rmula: AFT = (AF + PT) / (AF + PN)
# üìå Interpretaci√≥n:
#    - Mide qu√© proporci√≥n del total de activos fijos est√° financiada por pasivos en lugar de patrimonio.
#    - Un valor mayor a 1 sugiere que los activos fijos dependen m√°s del endeudamiento que del capital propio.
#    - Un valor menor a 1 indica que la empresa financia sus activos fijos mayormente con su patrimonio.
#
# üìå Manejo de casos:
# 1Ô∏è‚É£ Si (AF + PT) = 0 y (AF + PN) = 0 ‚Üí NaN (indeterminado, empresa sin activos fijos ni financiamiento).
# 2Ô∏è‚É£ Si (AF + PN) = 0 ‚Üí ‚àû (empresa con activos fijos pero sin patrimonio ni financiamiento, inconsistente).
# 3Ô∏è‚É£ Si (AF + PT) = 0 ‚Üí 0 (empresa sin pasivos ni activos fijos, solo con patrimonio).
# 4Ô∏è‚É£ Si (AF + PT) > 0 y (AF + PN) > 0 ‚Üí Normal (se calcula la divisi√≥n).

base_indicadores['AFT'] = np.where(
    ((base_indicadores['AF'] + base_indicadores['PT']) == 0) & ((base_indicadores['AF'] + base_indicadores['PN']) == 0), np.nan,  # Caso 1: NaN
    np.where(
        ((base_indicadores['AF'] + base_indicadores['PN']) == 0), np.inf,  # Caso 2: ‚àû
        np.where(
            ((base_indicadores['AF'] + base_indicadores['PT']) == 0), 0,  # Caso 3: 0
            (base_indicadores['AF'] + base_indicadores['PT']) / (base_indicadores['AF'] + base_indicadores['PN'])  # Caso 4: Normal
        )
    )
)

# üîπ **Resumen de los valores en AFT**
casos_normales_AFT = ((base_indicadores['AF'] + base_indicadores['PN'] > 0)).sum()
casos_nan_AFT = (((base_indicadores['AF'] + base_indicadores['PT']) == 0) & ((base_indicadores['AF'] + base_indicadores['PN']) == 0)).sum()
casos_inf_AFT = (((base_indicadores['AF'] + base_indicadores['PN']) == 0)).sum()
casos_cero_AFT = (((base_indicadores['AF'] + base_indicadores['PT']) == 0)).sum()

# üìå Imprimir los resultados para verificar
print("\nüìä **Distribuci√≥n de casos en AFT (Activos Fijos sobre Total Financiamiento):**")
print(f"‚úÖ Casos normales: {casos_normales_AFT}")
print(f"‚ö†Ô∏è Casos NaN (indeterminado): {casos_nan_AFT} ‚Üí üìå **Manejo recomendado:** **Imputar con 0**, ya que representa una empresa sin activos fijos ni financiamiento.")
print(f"‚ôæÔ∏è Casos Infinito positivo: {casos_inf_AFT} ‚Üí üìå **Manejo recomendado:** **Eliminar estos casos**, ya que son inconsistentes.")
print(f"üîπ Casos con valor 0: {casos_cero_AFT} ‚Üí üìå Empresa sin pasivos ni activos fijos, financiada √∫nicamente con patrimonio.")




# ==============================================================================
# üìå RESUMEN GENERAL DE INDICADORES CALCULADOS
# ==============================================================================

# üîπ Obtener lista de columnas nuevas (indicadores calculados)
indicadores_calculados = base_indicadores.columns.difference(base_datos.columns).tolist()

print(f"\nüìä üîé Se han calculado {len(indicadores_calculados)} indicadores financieros.")
print("üìã Lista de indicadores calculados:")
print(indicadores_calculados)

# üîπ Crear resumen de NaN, inf, valores v√°lidos por cada indicador
resumen_indicadores = []

for col in indicadores_calculados:
    total = len(base_indicadores)
    nan_count = base_indicadores[col].isna().sum()
    inf_count = np.isinf(base_indicadores[col]).sum()
    validos = total - nan_count - inf_count
    resumen_indicadores.append({
        'Indicador': col,
        'Total': total,
        'NaN': nan_count,
        '‚àû': inf_count,
        'V√°lidos': validos
    })

# üîπ Mostrar el resumen en tabla ordenada
df_resumen = pd.DataFrame(resumen_indicadores).sort_values(by='Indicador')
print("\nüìä **Resumen general de calidad de datos por indicador:**")
import pandas as pd
from IPython.display import display
display(df_resumen)


# ====================================================
# üìå Imputaci√≥n de valores NaN seg√∫n recomendaciones
# ====================================================


# üîπ Diccionarios con el valor recomendado de imputaci√≥n para cada indicador
imputar_con_1 = {
    'LC', 'PA', 'LG', 'T', 'TN', 'RAO', 'RCD', 'RCID', 'RCCP', 'RCLP', 'RCDT', 'PKT'
}

imputar_con_0 = {
    'RET', 'RECP', 'RELP', 'RAF', 'EBITDA', 'MB', 'MO', 'ROA', 'ROE', 'RSV', 'ROI',
    'ME', 'RA', 'RI', 'RCC', 'RCP', 'PPC', 'PPP', 'PPI', 'KTNO', 'DCA', 'CPA', 'DATA',
    'DLPC', 'CCNAT', 'CTNAT', 'CCNCT', 'CTNCT', 'AFT', 'PCD'
}

imputar_con_05 = {
    'CCT'  # Se propone 0.5 como valor neutral para balance patrimonio/pasivo
}

# üîπ Aplicar imputaciones al DataFrame de indicadores
for col in base_indicadores.columns:
    if col in imputar_con_1:
        base_indicadores[col] = base_indicadores[col].fillna(1)
    elif col in imputar_con_0:
        base_indicadores[col] = base_indicadores[col].fillna(0)
    elif col in imputar_con_05:
        base_indicadores[col] = base_indicadores[col].fillna(0.5)

# üìå Nota:
# Esta imputaci√≥n es √∫til para modelos predictivos.
# Si el an√°lisis fuera estrictamente financiero, puede ser preferible mantener los NaN.

# üìä RESUMEN ACTUALIZADO DE CALIDAD DE DATOS POR INDICADOR (CON ‚àû POSITIVO Y NEGATIVO DISTINTOS)

resumen_post_imputacion = []

for col in indicadores_calculados:
    total = len(base_indicadores)
    nan_count = base_indicadores[col].isna().sum()
    pos_inf = np.isposinf(base_indicadores[col]).sum()   # ‚àû positivo
    neg_inf = np.isneginf(base_indicadores[col]).sum()   # ‚àû negativo
    validos = total - nan_count - pos_inf - neg_inf

    resumen_post_imputacion.append({
        'Indicador': col,
        'Total': total,
        'NaN': nan_count,
        '+‚àû': pos_inf,
        '-‚àû': neg_inf,
        'V√°lidos': validos
    })

# Crear DataFrame ordenado
df_resumen_post = pd.DataFrame(resumen_post_imputacion).sort_values(by='Indicador').reset_index(drop=True)
# Mostrar el resumen actualizado
print("\nüìä **Resumen actualizado de calidad de datos por indicador despu√©s de las imputaciones sugeridas (con ‚àû positivo y negativo separados):**")
from IPython.display import display
display(df_resumen_post)




# üìå Crear base para empresas tur√≠sticas
# Usamos la base con columna Turismo antes de eliminarla
columnas_cuentas = [
    'AC', 'I', 'AF', 'AT', 'PN', 'PLP', 'PCP', 'PT', 'CPC', 'CPP',
    'UN', 'V', 'UB', 'EBIT', 'UO', 'GF', 'GV', 'GA', 'Imp', 'DyA', 'FCL'
]
columnas_ciiu_quitar = ['CIIU', 'CIIU_Codigo', 'CIIU_Sector', 'Ciudad']
columnas_a_quitar = columnas_cuentas + columnas_ciiu_quitar

base_modelos_turismo = base_indicadores[base_indicadores["Turismo"] == 1].copy()
base_modelos_turismo = base_modelos_turismo.drop(columns=columnas_a_quitar + ['Turismo'])  # Quitamos todo

# üìå Guardar solo la base de turismo
ruta_final = "/content/drive/MyDrive/Datos/6_Base_Modelos_Predictivos.parquet"
base_modelos_turismo.to_parquet(ruta_final, index=False)
print(f"‚úÖ Base final para modelos del sector tur√≠stico guardada en:\n{ruta_final}")

# üìÑ Crear resumen .txt del paso
resumen_txt = f"""
üìÑ Script: 6_Creacion_Indicadores_Financieros.ipynb
üìÖ Fecha: {pd.Timestamp.today().strftime('%Y-%m-%d')}
üß© Objetivo: Calcular indicadores financieros a partir de cuentas imputadas y construir la base final para modelos del sector turismo.

üîÅ Pasos realizados:
- C√°lculo detallado de m√°s de 50 indicadores financieros.
- Revisi√≥n y tratamiento expl√≠cito de NaNs, ‚àû y casos especiales.
- Imputaci√≥n guiada por criterios contables para uso en modelos.
- Eliminaci√≥n de columnas contables y variables administrativas.
- Filtrado de registros con Turismo = 1.
- Construcci√≥n final de base para modelos predictivos.

üì¶ Archivo generado:
- 6_Base_Modelos_Predictivos.parquet

üìä Estad√≠sticas:
- Registros finales: {len(base_modelos_turismo):,}
- NITs √∫nicos: {base_modelos_turismo['NIT'].nunique():,}
- Columnas finales: {len(base_modelos_turismo.columns)}

üìã Lista de columnas:
{chr(10).join(['   ‚Ä¢ ' + col for col in base_modelos_turismo.columns])}
"""

ruta_resumen = "/content/drive/MyDrive/Datos/6_resumen.txt"
with open(ruta_resumen, "w", encoding="utf-8") as f:
    f.write(resumen_txt.strip())

print(f"\nüìù Resumen guardado en: {ruta_resumen}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
üîé Informaci√≥n general de la base de datos:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 539318 entries, 0 to 539317
Data columns (total 31 columns):
 #   Column       Non-Null Count   Dtype  
---  ------       --------------   -----  
 0   NIT          539318 non-null  float64
 1   A√±o          539318 non-null  int64  
 2   Ciudad       539318 non-null  object 
 3   CIIU         539318 non-null  object 
 4   DEP          539318 non-null  object 
 5   AC           539318 non-null  float64
 6   I            539318 non-null  float64
 7   AF           539318 non-null  float64
 8   AT           539318 non-null  float64
 9   PN           539318 non-null  float64
 10  PLP          539318 non-null  float64
 11  PCP          539318 non-null  float64
 12  PT           539318 non-null  float64
 13  CPC          539318 non-null  float64
 14  CPP          539318

Unnamed: 0,Indicador,Total,NaN,‚àû,V√°lidos
0,AFT,539318,18,19,539281
1,CCNAT,539318,21,13,539284
2,CCNCT,539318,21,14,539283
3,CCT,539318,20,15,539283
4,CPA,539318,19,15,539284
5,CTN,539318,0,0,539318
6,CTNAT,539318,21,13,539284
7,CTNCT,539318,21,14,539283
8,DATA,539318,19,15,539284
9,DCA,539318,19,15,539284



üìä **Resumen actualizado de calidad de datos por indicador despu√©s de las imputaciones sugeridas (con ‚àû positivo y negativo separados):**


Unnamed: 0,Indicador,Total,NaN,+‚àû,-‚àû,V√°lidos
0,AFT,539318,0,19,0,539299
1,CCNAT,539318,0,1,12,539305
2,CCNCT,539318,0,2,12,539304
3,CCT,539318,0,0,15,539303
4,CPA,539318,0,15,0,539303
5,CTN,539318,0,0,0,539318
6,CTNAT,539318,0,1,12,539305
7,CTNCT,539318,0,2,12,539304
8,DATA,539318,0,15,0,539303
9,DCA,539318,0,15,0,539303


‚úÖ Base final para modelos del sector tur√≠stico guardada en:
/content/drive/MyDrive/Datos/6_Base_Modelos_Predictivos.parquet

üìù Resumen guardado en: /content/drive/MyDrive/Datos/6_resumen.txt
