In [5]:
import pandas as pd
import json
import os

# Ruta para el archivo JSON (modificar si es necesario)
json_folder = os.path.join(os.getcwd(), '..', 'json')
json_file_path = os.path.join(json_folder, 'series_enero_2024.json')

# Leer el archivo JSON
with open(json_file_path, 'r') as file:
    data = json.load(file)

# Convertir los datos JSON a un DataFrame
df = pd.json_normalize(data)

# Crear carpeta para guardar los resultados del análisis
profiling_folder = os.path.join(os.getcwd(), '..', 'profiling')
os.makedirs(profiling_folder, exist_ok=True)

# 1. Guardar el análisis en un archivo de texto
analysis_file_path = os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.txt')
with open(analysis_file_path, 'w') as analysis_file:
    analysis_file.write("Análisis del Perfil de las Series de Enero 2024\n")
    analysis_file.write("--------------------------------------------------\n")
    analysis_file.write(f"Resumen de estadísticas:\n{df.describe()}\n")  # Agregar estadísticas descriptivas

    # Filtrar solo las columnas numéricas para la correlación
    numeric_df = df.select_dtypes(include=['number'])
    
    analysis_file.write(f"Correlación entre columnas numéricas:\n{numeric_df.corr()}\n")  # Agregar matriz de correlación
    analysis_file.write("Distribución de valores nulos:\n")
    analysis_file.write(f"{df.isnull().sum()}\n")  # Resumen de valores nulos

# 2. Guardar estadísticas descriptivas en un archivo CSV
desc_stats = df.describe().transpose()  # Estadísticas descriptivas
desc_stats.to_csv(os.path.join(profiling_folder, 'estadisticas_descriptivas.csv'))

# 3. Guardar análisis en un archivo JSON
analysis_dict = {
    'estadisticas_descriptivas': df.describe().to_dict(),
    'matriz_correlacion': numeric_df.corr().to_dict(),
    'valores_nulos': df.isnull().sum().to_dict()
}

json_analysis_path = os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.json')
with open(json_analysis_path, 'w') as json_file:
    json.dump(analysis_dict, json_file, indent=4)

# 4. Guardar análisis en un archivo Excel
with pd.ExcelWriter(os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.xlsx')) as writer:
    df.describe().transpose().to_excel(writer, sheet_name='Estadísticas Descriptivas')
    numeric_df.corr().to_excel(writer, sheet_name='Matriz de Correlación')
    df.isnull().sum().to_frame('Valores Nulos').to_excel(writer, sheet_name='Valores Nulos')

# 5. Guardar análisis como un archivo HTML
html_report = df.describe().to_html()  # Convertir estadísticas descriptivas a HTML
html_report += numeric_df.corr().to_html()  # Agregar la matriz de correlación al reporte

with open(os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.html'), 'w') as html_file:
    html_file.write(html_report)

print("Análisis guardado en los siguientes formatos:")
print(f"- Texto: {analysis_file_path}")
print(f"- CSV: {os.path.join(profiling_folder, 'estadisticas_descriptivas.csv')}")
print(f"- JSON: {json_analysis_path}")
print(f"- Excel: {os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.xlsx')}")
print(f"- HTML: {os.path.join(profiling_folder, 'analisis_perfil_series_enero_2024.html')}")


Análisis guardado en los siguientes formatos:
- Texto: c:\Projects\lulo_bank_test\src\..\profiling\analisis_perfil_series_enero_2024.txt
- CSV: c:\Projects\lulo_bank_test\src\..\profiling\estadisticas_descriptivas.csv
- JSON: c:\Projects\lulo_bank_test\src\..\profiling\analisis_perfil_series_enero_2024.json
- Excel: c:\Projects\lulo_bank_test\src\..\profiling\analisis_perfil_series_enero_2024.xlsx
- HTML: c:\Projects\lulo_bank_test\src\..\profiling\analisis_perfil_series_enero_2024.html
