# **Distribución de créditos por segmento**

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()

# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, '../../db/datos_json')

# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

# Cargar los archivos JSON y crear DataFrames
for archivo in archivos_json:
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())

# Filtrar los nombres que comienzan con "df_", contienen "alfa_q" y "pachuca"
nombres_df_filtrados = [
    nombre for nombre in nombres_variables_globales 
    # Caso de cuando no son las alfa q
    if nombre.startswith("df_") and "financiamientos" in nombre and "puebla" in nombre

    #if nombre.startswith("df_") and "tulancingo" in nombre    
    #and ("alfa_q" in nombre or "jul_2023" in nombre or "sep_2023" in nombre or "feb_2024" in nombre or "mar_2024" in nombre or "may_2024" in nombre)
]

# Imprimir la lista de DataFrames filtrados
print("Lista de DataFrames filtrados:")
nombres_df_filtrados

Lista de DataFrames filtrados:


['df_financiamientos_2019_puebla',
 'df_financiamientos_2020_puebla',
 'df_financiamientos_2021_puebla',
 'df_financiamientos_2022_puebla',
 'df_financiamientos_2023_puebla',
 'df_financiamientos_2024_puebla']

In [2]:
# Crear una lista de DataFrames seleccionados con las columnas específicas
dataframes_list = []
for nombre_df in nombres_df_filtrados:
    # Seleccionar las columnas 'id' y 'categoria'
    segment_df = globals()[nombre_df][['id','monto']]
    # Añadir el DataFrame a la lista
    dataframes_list.append(segment_df)

## 2022

In [3]:
df_financiamientos_2022_puebla= df_financiamientos_2022_puebla[['id','monto']]

In [4]:
# Definir los rangos de monto de cada segmento
segmentos = {
    'E': (0.00, 1000000.00),
    'D': (1000001.00, 1600000.00),
    'C': (1600001.00, 2300000.00),
    'B': (2300001.00, 3000000.00),
    'A': (3000001.00, 3900000.00),
    'S': (3900000.00, 20000000.00)
}

# Crear el DataFrame de segmentos
df_segmentos = pd.DataFrame(segmentos.items(), columns=['segmento', 'rango'])

# Función para asignar segmento
def asignar_segmento(monto):
    for segmento, (limite_inf, limite_sup) in segmentos.items():
        if limite_inf <= monto <= limite_sup:
            return segmento
    return None

# Aplicar la función para asignar segmento a cada fila
df_financiamientos_2022_puebla['segmento'] = df_financiamientos_2022_puebla['monto'].apply(asignar_segmento)
df_financiamientos_2022_puebla.head()


Unnamed: 0,id,monto,segmento
0,1,21093.0,E
1,2,34318.0,E
2,3,43431.0,E
3,4,51998.0,E
4,5,94648.96,E


In [5]:
# Calcular cantidad de registros por segmento
creditos_por_segmento = df_financiamientos_2022_puebla['segmento'].value_counts()
# Calcular el porcentaje de cada segmento
porcentaje_por_segmento = (creditos_por_segmento / len(df_financiamientos_2022_puebla)) * 100

# Crear DataFrame con los resultados
creditos_segmentos_2022 = pd.DataFrame({
    'Segmento': creditos_por_segmento.index,
    'Cantidad': creditos_por_segmento.values,
    'Porcentaje': porcentaje_por_segmento.values
})

# Ordenar por segmento
creditos_segmentos_2022.sort_values(by='Segmento', inplace=True)
creditos_segmentos_2022

Unnamed: 0,Segmento,Cantidad,Porcentaje
5,A,112,3.608247
3,B,219,7.055412
2,C,316,10.180412
1,D,546,17.590206
0,E,1705,54.929124
4,S,203,6.539948


In [6]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6']

porcentajes = creditos_segmentos_2022['Porcentaje']
labels = creditos_segmentos_2022['Segmento']

fig = go.Figure(data=[go.Pie(labels=labels, values=porcentajes, marker=dict(colors=colores))])
fig.update_traces(textinfo='percent', textposition='inside')
fig.update_layout(
    #title='Distribución de créditos por segmento 2022', # Agregar título
    #showlegend=False  # Ocultar leyenda
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo,  carpeta='assets/graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_pie_dist_creditos_segmento_2022',  carpeta='assets/graficas')

fig.show()

## 2023

In [8]:
df_financiamientos_2023_puebla= df_financiamientos_2023_puebla[['id','monto']]

In [9]:
# Definir los rangos de monto de cada segmento
segmentos = {
    'E': (0.00, 1000000.00),
    'D': (1000001.00, 1600000.00),
    'C': (1600001.00, 2300000.00),
    'B': (2300001.00, 3000000.00),
    'A': (3000001.00, 3900000.00),
    'S': (3900000.00, 20000000.00)
}

# Crear el DataFrame de segmentos
df_segmentos = pd.DataFrame(segmentos.items(), columns=['segmento', 'rango'])

# Función para asignar segmento
def asignar_segmento(monto):
    for segmento, (limite_inf, limite_sup) in segmentos.items():
        if limite_inf <= monto <= limite_sup:
            return segmento
    return None

# Aplicar la función para asignar segmento a cada fila
df_financiamientos_2023_puebla['segmento'] = df_financiamientos_2023_puebla['monto'].apply(asignar_segmento)
df_financiamientos_2023_puebla.head()


Unnamed: 0,id,monto,segmento
0,1,19817.75,E
1,2,0.0,E
2,3,0.0,E
3,4,33908.0,E
4,5,277298.0,E


In [10]:
# Calcular cantidad de registros por segmento
creditos_por_segmento = df_financiamientos_2023_puebla['segmento'].value_counts()
# Calcular el porcentaje de cada segmento
porcentaje_por_segmento = (creditos_por_segmento / len(df_financiamientos_2023_puebla)) * 100

# Crear DataFrame con los resultados
creditos_segmentos_2023 = pd.DataFrame({
    'Segmento': creditos_por_segmento.index,
    'Cantidad': creditos_por_segmento.values,
    'Porcentaje': porcentaje_por_segmento.values
})

# Ordenar por segmento
creditos_segmentos_2023.sort_values(by='Segmento', inplace=True)
creditos_segmentos_2023

Unnamed: 0,Segmento,Cantidad,Porcentaje
5,A,330,3.045123
4,B,544,5.019839
2,C,1023,9.439882
1,D,1800,16.609763
0,E,6481,59.804374
3,S,640,5.905693


In [11]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6']

porcentajes = creditos_segmentos_2023['Porcentaje']
labels = creditos_segmentos_2023['Segmento']

fig = go.Figure(data=[go.Pie(labels=labels, values=porcentajes, marker=dict(colors=colores))])
fig.update_traces(textinfo='percent', textposition='inside')
fig.update_layout(
    #title='Distribución de créditos por segmento 2022', # Agregar título
    #showlegend=False  # Ocultar leyenda
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo,  carpeta='assets/graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_pie_dist_creditos_segmento_2023',  carpeta='assets/graficas')

fig.show()

## 2024

In [12]:
df_financiamientos_2024_puebla= df_financiamientos_2024_puebla[['id','monto']]

In [14]:
# Definir los rangos de monto de cada segmento
segmentos = {
    'E': (0.00, 1000000.00),
    'D': (1000001.00, 1600000.00),
    'C': (1600001.00, 2300000.00),
    'B': (2300001.00, 3000000.00),
    'A': (3000001.00, 3900000.00),
    'S': (3900000.00, 20000000.00)
}

# Crear el DataFrame de segmentos
df_segmentos = pd.DataFrame(segmentos.items(), columns=['segmento', 'rango'])

# Función para asignar segmento
def asignar_segmento(monto):
    for segmento, (limite_inf, limite_sup) in segmentos.items():
        if limite_inf <= monto <= limite_sup:
            return segmento
    return None

# Aplicar la función para asignar segmento a cada fila
df_financiamientos_2024_puebla['segmento'] = df_financiamientos_2024_puebla['monto'].apply(asignar_segmento)
df_financiamientos_2024_puebla.head()


Unnamed: 0,id,monto,segmento
0,1,8574319.0,S
1,2,1633800.0,C
2,3,0.0,E
3,4,0.0,E
4,5,0.0,E


In [15]:
# Calcular cantidad de registros por segmento
creditos_por_segmento = df_financiamientos_2024_puebla['segmento'].value_counts()
# Calcular el porcentaje de cada segmento
porcentaje_por_segmento = (creditos_por_segmento / len(df_financiamientos_2024_puebla)) * 100

# Crear DataFrame con los resultados
creditos_segmentos_2024 = pd.DataFrame({
    'Segmento': creditos_por_segmento.index,
    'Cantidad': creditos_por_segmento.values,
    'Porcentaje': porcentaje_por_segmento.values
})

# Ordenar por segmento
creditos_segmentos_2024.sort_values(by='Segmento', inplace=True)
creditos_segmentos_2024

Unnamed: 0,Segmento,Cantidad,Porcentaje
5,A,70,2.803364
4,B,142,5.686824
2,C,230,9.211053
1,D,423,16.940328
0,E,1478,59.191029
3,S,153,6.127353


In [16]:
colores = ['#2962ff', '#9500ff', '#ff0059', '#ff8c00', '#b4e600', '#2EC2A2','#E50CB6']

porcentajes = creditos_segmentos_2024['Porcentaje']
labels = creditos_segmentos_2024['Segmento']

fig = go.Figure(data=[go.Pie(labels=labels, values=porcentajes, marker=dict(colors=colores))])
fig.update_traces(textinfo='percent', textposition='inside')
fig.update_layout(
    #title='Distribución de créditos por segmento 2022', # Agregar título
    #showlegend=False  # Ocultar leyenda
    margin=dict(l=10, r=10, t=10, b=10),  # Ajusta los márgenes (left, right, top, bottom)        
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo,  carpeta='assets/graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

guardar_grafico_como_html(fig, 'g_pie_dist_creditos_segmento_2024',  carpeta='assets/graficas')

fig.show()