# ***3. CRÉDITOS***

In [1]:
# Manejo de datos
import os # Directorios
import pandas as pd # Manipulación df
# Gráficas
import plotly.graph_objects as go #Para obtener librería usar: pip install plotly
from plotly.subplots import make_subplots
import plotly.io as pio # Exportar gráfica

# Obtener el directorio actual de trabajo
directorio_actual = os.getcwd()
# Directorio donde se encuentran los archivos JSON (ruta relativa)
directorio_json = os.path.join(directorio_actual, 'datos_json')
#print("Directorio JSON relativo:", directorio_json) # Imprimir la ruta relativa
# Obtener la lista de archivos JSON en el directorio
archivos_json = os.listdir(directorio_json)

dataframes = {} # Crear un diccionario para almacenar los DataFrames
# Iterar sobre cada archivo JSON y crear un DataFrame
for archivo in archivos_json:
    # Obtener el nombre de la tabla del nombre del archivo
    nombre_tabla = archivo.replace('datos_', '').replace('.json', '')    
    # Cargar el archivo JSON en un DataFrame y asignarlo a una variable con un nombre dinámico
    ruta_json = os.path.join(directorio_json, archivo)
    globals()[f"df_{nombre_tabla}"] = pd.read_json(ruta_json)

# Obtener todos los nombres de las variables globales
nombres_variables_globales = list(globals().keys())
# Filtrar los nombres para obtener solo aquellos que comienzan con "df_"
nombres_df = [nombre for nombre in nombres_variables_globales if nombre.startswith("df_")]
# Imprimir la lista de nombres de los DataFrames creados
print("Lista de DataFrames creados:")
print(nombres_df)
dfs_list = nombres_df

Lista de DataFrames creados:
['df_alfa_q_feb_2023_pachuca', 'df_alfa_q_jul_2022_tulancingo', 'df_alfa_q_jul_2023_pachuca', 'df_alfa_q_jul_2023_tulancingo', 'df_alfa_q_jun_2023_pachuca', 'df_alfa_q_jun_2023_tulancingo', 'df_alfa_q_mar_2023_pachuca', 'df_alfa_q_mar_2023_tulancingo', 'df_alfa_q_may_2022_tulancingo', 'df_alfa_q_may_2023_tulancingo', 'df_alfa_q_nov_2022_pachuca', 'df_alfa_q_oct_2022_pachuca', 'df_alfa_q_oct_2022_tulancingo', 'df_alfa_q_oct_2023_tulancingo', 'df_alfa_q_puebla', 'df_alfa_q_sep_2023_pachuca', 'df_alfa_q_sep_2023_tulancingo', 'df_enero_2024_querertaro', 'df_financiamientos_2019_pachuca', 'df_financiamientos_2019_puebla', 'df_financiamientos_2019_tulancingo', 'df_financiamientos_2020_pachuca', 'df_financiamientos_2020_puebla', 'df_financiamientos_2020_tulancingo', 'df_financiamientos_2021_pachuca', 'df_financiamientos_2021_puebla', 'df_financiamientos_2021_tulancingo', 'df_financiamientos_2022_pachuca', 'df_financiamientos_2022_puebla', 'df_financiamientos_2022_

____
# *3.1 Distribución de créditos por género*

* Hombre: 1
* Mujer: 2

## *PACHUCA*

In [5]:
# Crea los DataFrames para cada archivo con las columnas necesarias
credit_df_financiamientos_2022_pachuca = df_financiamientos_2022_pachuca[['id','sexo']]
credit_df_financiamientos_2023_pachuca = df_financiamientos_2023_pachuca[['id','sexo']]

In [6]:
# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    credit_df_financiamientos_2022_pachuca,
    credit_df_financiamientos_2023_pachuca,    
]
conteo_total = {}
# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el conteo de valores únicos de 'sexo' en el DataFrame actual
    conteo_actual = df['sexo'].value_counts().to_dict()
    # Agregar el conteo actual al conteo total
    for sexo, conteo in conteo_actual.items():
        conteo_total[sexo] = conteo_total.get(sexo, 0) + conteo

# Convertir el diccionario a un DataFrame
conteo_total_df = pd.DataFrame(list(conteo_total.items()), columns=['sexo', 'conteo_total'])
conteo_total_df

Unnamed: 0,sexo,conteo_total
0,1,1125
1,2,944


In [7]:
conteo_total_df['sexo'] = conteo_total_df['sexo'].replace({
    1: 'Hombre', 2:'Mujer'
})
conteo_total_df['sexo'].unique()

array(['Hombre', 'Mujer'], dtype=object)

sex = pd.DataFrame
sex['sexo_label'] = ['Hombre', 'Mujer']
sex = pd.Series(sex)
sex
conteo = pd.DataFrame()
conteo = pd.concat([conteo_total_df,sex.reindex(conteo_total_df.index) ], axis=0) #En columna
conteo

In [8]:
# Calcular el total de registros
sex = conteo_total_df['sexo']
conteo_totall = conteo_total_df['conteo_total']
total_registros = conteo_totall.sum()
print("Total de registros: ", total_registros)

# Calcular el porcentaje que representa cada número de baños único del total
porcentajes = (conteo_totall / total_registros) * 100

# Crear el gráfico de pastel
colores_personalizados = ['#3d45c0','#ff4853'] 
fig = go.Figure(data=[go.Pie(
    labels=sex, 
    values=porcentajes, 
    sort=False, marker=dict(colors=colores_personalizados,))])
fig.update_layout(title="Porcentaje de créditos")


# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_pie_creditosgenero_pachuca', carpeta='graficas')

fig.show()

Total de registros:  2069


## *TULANCINGO*

In [5]:
# Crea los DataFrames para cada archivo con las columnas necesarias
credit_df_financiamientos_2023_tulgo = df_financiamientos_2023_tulancingo[['id','sexo']]
credit_df_financiamientos_2022_tulgo = df_financiamientos_2022_tulancingo[['id','sexo']]
credit_df_financiamientos_2019_tulgo = df_financiamientos_2019_tulancingo[['id','sexo']]
credit_df_financiamientos_2021_tulgo = df_financiamientos_2021_tulancingo[['id','sexo']]
credit_df_financiamientos_2020_tulgo = df_financiamientos_2020_tulancingo[['id','sexo']]

In [9]:
# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    credit_df_financiamientos_2019_tulgo,
    credit_df_financiamientos_2020_tulgo,    
    credit_df_financiamientos_2021_tulgo,
    credit_df_financiamientos_2022_tulgo,
    credit_df_financiamientos_2023_tulgo
]
conteo_total = {}
# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el conteo de valores únicos de 'sexo' en el DataFrame actual
    conteo_actual = df['sexo'].value_counts().to_dict()
    # Agregar el conteo actual al conteo total
    for sexo, conteo in conteo_actual.items():
        conteo_total[sexo] = conteo_total.get(sexo, 0) + conteo

# Convertir el diccionario a un DataFrame
conteo_total_df = pd.DataFrame(list(conteo_total.items()), columns=['sexo', 'conteo_total'])
conteo_total_df = conteo_total_df[conteo_total_df['sexo'] != 0]

conteo_total_df

Unnamed: 0,sexo,conteo_total
0,1,835
1,2,678


In [10]:
conteo_total_df['sexo'] = conteo_total_df['sexo'].replace({
    1: 'Hombre', 2:'Mujer'
})
conteo_total_df['sexo'].unique()

array(['Hombre', 'Mujer'], dtype=object)

sex = pd.DataFrame
sex['sexo_label'] = ['Hombre', 'Mujer']
sex = pd.Series(sex)
sex
conteo = pd.DataFrame()
conteo = pd.concat([conteo_total_df,sex.reindex(conteo_total_df.index) ], axis=0) #En columna
conteo

In [12]:
# Calcular el total de registros
sex = conteo_total_df['sexo']
conteo_totall = conteo_total_df['conteo_total']
total_registros = conteo_totall.sum()
print("Total de registros: ", total_registros)

# Calcular el porcentaje que representa cada número de baños único del total
porcentajes = (conteo_totall / total_registros) * 100

# Crear el gráfico de pastel
colores_personalizados = ['#3d45c0','#ff4853'] 
fig = go.Figure(data=[go.Pie(
    labels=sex, 
    values=porcentajes, 
    sort=False, marker=dict(colors=colores_personalizados,))])
fig.update_layout(title="Porcentaje de créditos")


# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_pie_creditosgenero_tulancingo', carpeta='graficas')

fig.show()

Total de registros:  1513


## *PUEBLA*

In [14]:
# Crea los DataFrames para cada archivo con las columnas necesarias
credit_df_financiamientos_2019_puebla = df_financiamientos_2019_puebla[['id','sexo']]
credit_df_financiamientos_2020_puebla = df_financiamientos_2020_puebla[['id','sexo']]
credit_df_financiamientos_2021_puebla = df_financiamientos_2021_puebla[['id','sexo']]
credit_df_financiamientos_2022_puebla = df_financiamientos_2022_puebla[['id','sexo']]
credit_df_financiamientos_2023_puebla = df_financiamientos_2023_puebla[['id','sexo']]

In [15]:
# Lista de DataFrames y sus nombres correspondientes
dataframes_list = [
    credit_df_financiamientos_2019_puebla,
    credit_df_financiamientos_2020_puebla,    
    credit_df_financiamientos_2021_puebla,
    credit_df_financiamientos_2022_puebla,
    credit_df_financiamientos_2023_puebla
]
conteo_total = {}
# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    # Calcular el conteo de valores únicos de 'sexo' en el DataFrame actual
    conteo_actual = df['sexo'].value_counts().to_dict()
    # Agregar el conteo actual al conteo total
    for sexo, conteo in conteo_actual.items():
        conteo_total[sexo] = conteo_total.get(sexo, 0) + conteo

# Convertir el diccionario a un DataFrame
conteo_total_df = pd.DataFrame(list(conteo_total.items()), columns=['sexo', 'conteo_total'])
conteo_total_df = conteo_total_df[conteo_total_df['sexo'] != 0]

conteo_total_df

Unnamed: 0,sexo,conteo_total
0,1,8433
1,2,6782


In [16]:
conteo_total_df['sexo'] = conteo_total_df['sexo'].replace({
    1: 'Hombre', 2:'Mujer'
})
conteo_total_df['sexo'].unique()

array(['Hombre', 'Mujer'], dtype=object)

sex = pd.DataFrame
sex['sexo_label'] = ['Hombre', 'Mujer']
sex = pd.Series(sex)
sex
conteo = pd.DataFrame()
conteo = pd.concat([conteo_total_df,sex.reindex(conteo_total_df.index) ], axis=0) #En columna
conteo

In [17]:
# Calcular el total de registros
sex = conteo_total_df['sexo']
conteo_totall = conteo_total_df['conteo_total']
total_registros = conteo_totall.sum()
print("Total de registros: ", total_registros)

# Calcular el porcentaje que representa cada número de baños único del total
porcentajes = (conteo_totall / total_registros) * 100

# Crear el gráfico de pastel
colores_personalizados = ['#3d45c0','#ff4853'] 
fig = go.Figure(data=[go.Pie(
    labels=sex, 
    values=porcentajes, 
    sort=False, marker=dict(colors=colores_personalizados,))])
fig.update_layout(title="Porcentaje de créditos")


# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_pie_creditosgenero_puebla', carpeta='graficas')

fig.show()

Total de registros:  15215


____
____
___
# *3.2 Destino del crédito*
## *Selección de datos*

In [9]:
# Crea los DataFrames para cada archivo con las columnas necesarias
credit_df_financiamientos_2022_pachuca = df_financiamientos_2022_pachuca[['modalidad']]
credit_df_financiamientos_2023_pachuca = df_financiamientos_2023_pachuca[['modalidad']]

MODALIDAD
- 1: Nueva
- 2: Mejoramientos
- 3: Usada
- 4: Otros programas

## **Créditos por la antigüedad de la vivienda**

In [10]:
# Lista de DataFrames
dataframes_list = [
    credit_df_financiamientos_2022_pachuca,
    credit_df_financiamientos_2023_pachuca,    
]
# Diccionario para conteo total de valores únicos
conteo_total = {}

# Iterar sobre la lista de DataFrames
for df in dataframes_list:
    df = df.copy() # Usando copia de df
    df['modalidad'] = df['modalidad'].replace({
            1: 'Nueva',
            2: 'Mejoramientos',
            3: 'Usada',
            4: 'Otros programas'
        })
    # Calcular el conteo de valores únicos de 'modalidad' en el DataFrame actual
    conteo_actual = df['modalidad'].value_counts().to_dict()
    # Agregar el conteo actual al conteo total
    for modalidad, conteo in conteo_actual.items():
        conteo_total[modalidad] = conteo_total.get(modalidad, 0) + conteo

# Convertir el diccionario a un DataFrame
conteo_total_df = pd.DataFrame(list(conteo_total.items()), columns=['modalidad', 'conteo_total'])
# Imprimir el DataFrame con el conteo total
conteo_total_df

Unnamed: 0,modalidad,conteo_total
0,Nueva,888
1,Usada,772
2,Mejoramientos,255
3,Otros programas,154


In [11]:
# Rectificar resultados
d1 = credit_df_financiamientos_2022_pachuca['modalidad'].value_counts().to_dict()
d2 = credit_df_financiamientos_2023_pachuca['modalidad'].value_counts().to_dict()
print(d1)
print(d2)

{1: 624, 3: 517, 2: 152, 4: 95}
{1: 264, 3: 255, 2: 103, 4: 59}


In [12]:
# Calcular el total de registros
total_registros = conteo_total_df['conteo_total'].sum()
# Calcular el porcentaje que representa cada modalidad del total
conteo_total_df['porcentaje'] = (conteo_total_df['conteo_total'] / total_registros) * 100
print("Total de registros: ", total_registros)

# Crear un diccionario con el orden deseado
orden_modalidades = {
    1: 'Nueva',
    2: 'Mejoramientos',
    3: 'Usada',
    4: 'Otros programas'
}
# Reindexar el DataFrame según el orden deseado
conteo_total_df = conteo_total_df.set_index('modalidad').reindex(orden_modalidades.values()).reset_index()
conteo_total_df

Total de registros:  2069


Unnamed: 0,modalidad,conteo_total,porcentaje
0,Nueva,888,42.919285
1,Mejoramientos,255,12.324795
2,Usada,772,37.312711
3,Otros programas,154,7.443209


### *Gráfica*

In [14]:
fig = go.Figure()
colores = ['#3d45c0', '#ff4853', '#ffb038', '#7cc668']
porcentajes = conteo_total_df['porcentaje']
# Agregar los datos como barras
fig.add_trace(go.Bar(
    x=conteo_total_df['modalidad'],  # Eje x: Modalidades
    y=conteo_total_df['porcentaje'],  # Eje y: Porcentajes
    marker_color=colores,  # Especifica los colores de las barras
    text=porcentajes,  # Texto que se mostrará en las barras (porcentaje)
    textposition='inside',  # Posición del texto (puede ser 'inside' o 'outside')
    texttemplate='%{text:.1f}%',  # Formato del texto (porcentaje con un decimal)
))

# Personalizar el diseño de la gráfica
fig.update_layout(
    title='Créditos por la antigüedad de la vivienda',  # Título de la gráfica
    xaxis=dict(title='Modalidad'),  # Título del eje x
    yaxis=dict(
        title='Porcentaje', # Título del eje y
        gridcolor='#dddcda', # Color de las líneas que dividen los rangos del eje Y
         gridwidth=1,
    ),  
    plot_bgcolor='rgba(0,0,0,0)',  # Color de fondo del gráfico
)

# Exportar gráfica como archivo HTML
def guardar_grafico_como_html(fig, nombre_archivo, carpeta='graficas'):
    # Crear la carpeta si no existe
    if not os.path.exists(carpeta):
        os.makedirs(carpeta)
    
    # Gráfica como archivo HTML en la carpeta especificada
    pio.write_html(fig, f'{carpeta}/{nombre_archivo}.html')

# Exportar
guardar_grafico_como_html(fig, 'g_bar_creditosdestino_pachuca', carpeta='graficas')

fig.show()