# Ejercicio 5. Creación de un triangulo run-off de pagos

El primer paso consiste en importar los datos (10.000 siniestros ficticios desde 2018 al 2023) y mostramos los primeros registros:

In [1]:
import pandas as pd
import numpy as np

data = pd.read_csv('Siniestros.csv',sep=';')
data.head()

Unnamed: 0,Siniestro,Poliza,Fec_ocu,Fec_com,Fec_pago,Importe
0,1,31082,12-09-2021,21-09-2021,03-07-2022,83
1,2,61275,20-11-2022,03-01-2023,02-02-2023,71
2,3,72257,10-06-2018,25-06-2018,15-07-2018,115
3,4,73111,17-09-2018,05-10-2018,20-09-2023,67
4,5,84755,30-06-2022,12-07-2022,30-09-2022,122


Una vez importados los datos, modificamos los campos de fecha con el formato de fecha adecuado.

*Si formato original no fuera YYYY-MM-DD utilizar pd.to_datetime(data['Accident_Date'], format='%d-%m-%Y')*

In [2]:
data['Fec_ocu'] = pd.to_datetime(data['Fec_ocu'], format='%d-%m-%Y')
data['Fec_pago'] = pd.to_datetime(data['Fec_pago'], format='%d-%m-%Y')
data.head()

Unnamed: 0,Siniestro,Poliza,Fec_ocu,Fec_com,Fec_pago,Importe
0,1,31082,2021-09-12,21-09-2021,2022-07-03,83
1,2,61275,2022-11-20,03-01-2023,2023-02-02,71
2,3,72257,2018-06-10,25-06-2018,2018-07-15,115
3,4,73111,2018-09-17,05-10-2018,2023-09-20,67
4,5,84755,2022-06-30,12-07-2022,2022-09-30,122


Acto seguido, bien creamos nuevos campos con el año (ejemplo *Accident_Year*) o, como en este caso, modificamos dichos campos convertiendolos a una periocidad anual.

In [3]:
data['Fec_ocu'] = data['Fec_ocu'].dt.year
data['Fec_pago'] = data['Fec_pago'].dt.year
data.head()

Unnamed: 0,Siniestro,Poliza,Fec_ocu,Fec_com,Fec_pago,Importe
0,1,31082,2021,21-09-2021,2022,83
1,2,61275,2022,03-01-2023,2023,71
2,3,72257,2018,25-06-2018,2018,115
3,4,73111,2018,05-10-2018,2023,67
4,5,84755,2022,12-07-2022,2022,122


Calculamos un nuevo campo llamado ‘Dev’ con el periodo de tiempo transcurrido (o desarrollo) como la diferencia entre ambos periodos (en este caso años) restandolos como números enteros: En este caso, no habría que convertirlo a entero, en versiones antiguas a pandas habría que usar .astype(int) o .view(int).

In [4]:
data['Dev'] = (data['Fec_pago'] - data['Fec_ocu'])
data.head()

Unnamed: 0,Siniestro,Poliza,Fec_ocu,Fec_com,Fec_pago,Importe,Dev
0,1,31082,2021,21-09-2021,2022,83,1
1,2,61275,2022,03-01-2023,2023,71,1
2,3,72257,2018,25-06-2018,2018,115,0
3,4,73111,2018,05-10-2018,2023,67,5
4,5,84755,2022,12-07-2022,2022,122,0


Agrupamos por año de accidente y año de desarrollo usando groupby(), y sumamos las cantidades de los siniestros:

In [5]:
datagg = data.groupby(['Fec_ocu','Dev']).agg({'Importe':'sum'}).reset_index()
datagg.head()

Unnamed: 0,Fec_ocu,Dev,Importe
0,2018,0,118066
1,2018,1,25877
2,2018,2,12392
3,2018,3,9743
4,2018,4,8599


Y una vez agrupados, guardamos los datos en una tabla 2-D (pivot table) basada en estas dos variables:

In [6]:
triangle = datagg.pivot(index='Fec_ocu',columns='Dev',values='Importe')
triangle

Dev,0,1,2,3,4,5
Fec_ocu,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2018,118066.0,25877.0,12392.0,9743.0,8599.0,8977.0
2019,119961.0,26543.0,13813.0,11509.0,10339.0,
2020,108140.0,27975.0,18551.0,14250.0,,
2021,107660.0,34826.0,19814.0,,,
2022,112042.0,51641.0,,,,
2023,133511.0,,,,,


In [7]:
accumulate = triangle.cumsum(axis=1)
accumulate

Dev,0,1,2,3,4,5
Fec_ocu,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2018,118066.0,143943.0,156335.0,166078.0,174677.0,183654.0
2019,119961.0,146504.0,160317.0,171826.0,182165.0,
2020,108140.0,136115.0,154666.0,168916.0,,
2021,107660.0,142486.0,162300.0,,,
2022,112042.0,163683.0,,,,
2023,133511.0,,,,,


Exportamos a excel:

In [8]:
#accumulate.to_excel('triangulo_acumulado.xlsx')