In [3]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

def polizas():
    # Leer los datos
    df = pd.read_excel("./data/polizas.xlsx")

    # Procesamiento de datos
    ingreso_por_tipo_vivienda = df.groupby('Tipo de vivienda')['Ingreso'].mean().reset_index()
    ingreso_por_tipo_vivienda = ingreso_por_tipo_vivienda.round(2)
    json_data = ingreso_por_tipo_vivienda.to_json(orient='records', indent=4)
    ingreso_por_tipo_vivienda.rename(columns={'Ingreso': 'Ingreso Promedio'}, inplace=True)

    llm_prompt = {
        "instrucciones": "Realiza un análisis financiero avanzado de los tipos de vivienda asegurados con los siguientes datos:",
        "analisis_requerido": [
            "Distribución de riesgo (proporción de cada tipo en el portfolio)",
            "Rentabilidad por tipología (ingreso promedio)",
            "Segmentación estratégica (oportunidades y alertas)",
            "Recomendaciones accionables de pricing y diversificación"
        ],
        "formato_salida": {
            "resumen_ejecutivo": "3-5 líneas",
            "analisis_detallado": "por sección con visualizaciones sugeridas",
            "tabla_comparativa": "KPIs clave"
        },
        "contexto": "Datos de un insurer europeo con exposición residencial en zonas urbanas/suburbanas",
        "datos": json_data
    }

    # Ordenar los datos
    df_plot = ingreso_por_tipo_vivienda.sort_values('Ingreso Promedio', ascending=True)  # Orden ascendente para mejor visualización

    # Configuración del estilo
    plt.style.use('seaborn-v0_8-whitegrid')
    plt.figure(figsize=(10, 6))

    # Crear el gráfico de barras horizontales
    bars = plt.barh(
        df_plot['Tipo de vivienda'],
        df_plot['Ingreso Promedio'],
        color=plt.cm.viridis(np.linspace(0.2, 0.8, len(df_plot))),
        edgecolor='gray',
        linewidth=0.5
    )

    # Añadir etiquetas de valor
    for bar in bars:
        width = bar.get_width()
        plt.text(
            width + max(df_plot['Ingreso Promedio']) * 0.01,  # Pequeño margen a la derecha
            bar.get_y() + bar.get_height()/2,
            f'{width:.2f}',
            va='center',
            ha='left',
            fontsize=9
        )

    # Personalizar el gráfico
    plt.title('Ingreso Promedio por Tipo de Vivienda', pad=20, fontsize=14, fontweight='bold')
    plt.xlabel('Ingreso Promedio (€)', labelpad=10)
    plt.ylabel('Tipo de Vivienda', labelpad=10)
    plt.xlim(0, max(df_plot['Ingreso Promedio']) * 1.15)  # Dejar espacio para las etiquetas
    plt.tight_layout()

    # Guardar el gráfico como PNG
    plt.savefig('./data/image.png', dpi=300, bbox_inches='tight')
    
    # Cerrar la figura para liberar memoria
    plt.close()

    return llm_prompt

print(polizas())

{'instrucciones': 'Realiza un análisis financiero avanzado de los tipos de vivienda asegurados con los siguientes datos:', 'analisis_requerido': ['Distribución de riesgo (proporción de cada tipo en el portfolio)', 'Rentabilidad por tipología (ingreso promedio)', 'Segmentación estratégica (oportunidades y alertas)', 'Recomendaciones accionables de pricing y diversificación'], 'formato_salida': {'resumen_ejecutivo': '3-5 líneas', 'analisis_detallado': 'por sección con visualizaciones sugeridas', 'tabla_comparativa': 'KPIs clave'}, 'contexto': 'Datos de un insurer europeo con exposición residencial en zonas urbanas/suburbanas', 'datos': '[\n    {\n        "Tipo de vivienda":"ATICO",\n        "Ingreso":152.14\n    },\n    {\n        "Tipo de vivienda":"PISO",\n        "Ingreso":121.02\n    },\n    {\n        "Tipo de vivienda":"PLANTA BAJA",\n        "Ingreso":98.4\n    },\n    {\n        "Tipo de vivienda":"RURAL",\n        "Ingreso":134.2\n    },\n    {\n        "Tipo de vivienda":"UNIFA

In [4]:
import pandas as pd
import matplotlib.pyplot as plt

def siniestros():
    # 1. Cargar datos
    df = pd.read_excel("./data/siniestros.xlsx")
    
    # 2. Calcular coste total por provincia (Top 10)
    top_provincias = (
        df.groupby('Provincia')['Coste Total']
        .sum()
        .nlargest(10)
        .reset_index()
        .sort_values('Coste Total', ascending=True)  # Orden ascendente para mejor visualización
    )
    
    # 3. Convertir a JSON
    json_data = top_provincias.to_json(orient='records', indent=4)

    llm_prompt = {
        "instrucciones": "Genera un informe actuarial avanzado sobre siniestralidad geográfica con los siguientes datos:",
        "analisis_requerido": [
            "Heatmap de riesgo (clasificación provincias por coste total y promedio)",
            "Identificación de hotspots de siniestralidad",
            "Análisis de patrones geográficos",
            "Simulación de escenarios de riesgo",
            "Recomendaciones técnicas de pricing y límites de exposición"
        ],
        "formato_salida": {
            "mapa_calor": "descripción textual",
            "top_insights": "3 hallazgos contraintuitivos",
            "matriz_riesgo": "clasificación provincia por riesgo/rentabilidad"
        },
        "contexto": "Portfolio expuesto principalmente a riesgos climáticos y daños por agua en España",
        "datos": json_data
    }

    # 4. Crear gráfico
    plt.figure(figsize=(10, 6))
    bars = plt.barh(
        top_provincias['Provincia'],
        top_provincias['Coste Total'],
        color='#1f77b4',  # Azul estándar
        alpha=0.7
    )
    
    # Añadir etiquetas de valor
    for bar in bars:
        width = bar.get_width()
        plt.text(
            width + (max(top_provincias['Coste Total']) * 0.01),
            bar.get_y() + bar.get_height()/2,
            f'€{width:,.0f}',
            va='center',
            ha='left',
            fontsize=9
        )
    
    # Personalización
    plt.title('Top 10 Provincias con Mayor Coste de Siniestros', pad=15, fontweight='bold')
    plt.xlabel('Coste Total (€)')
    plt.grid(axis='x', alpha=0.3)
    plt.tight_layout()
    
    # 5. Guardar gráfico
    plt.savefig('./data/image.png', dpi=120, bbox_inches='tight')
    plt.close()
    
    return llm_prompt

print(siniestros())

{'instrucciones': 'Genera un informe actuarial avanzado sobre siniestralidad geográfica con los siguientes datos:', 'analisis_requerido': ['Heatmap de riesgo (clasificación provincias por coste total y promedio)', 'Identificación de hotspots de siniestralidad', 'Análisis de patrones geográficos', 'Simulación de escenarios de riesgo', 'Recomendaciones técnicas de pricing y límites de exposición'], 'formato_salida': {'mapa_calor': 'descripción textual', 'top_insights': '3 hallazgos contraintuitivos', 'matriz_riesgo': 'clasificación provincia por riesgo/rentabilidad'}, 'contexto': 'Portfolio expuesto principalmente a riesgos climáticos y daños por agua en España', 'datos': '[\n    {\n        "Provincia":"CORDOBA",\n        "Coste Total":281038.8\n    },\n    {\n        "Provincia":"CASTELLON",\n        "Coste Total":293146.63\n    },\n    {\n        "Provincia":"GUIPUZCOA",\n        "Coste Total":383457.32\n    },\n    {\n        "Provincia":"MALAGA",\n        "Coste Total":394818.93\n   