<div align="center">

# **Vigentes**

</div>

## Librerias

In [60]:
source("../src/data/vigentes_diarias.R")

In [61]:
library(readxl)
library(dplyr)

## Data

In [62]:
vigentes <- read_excel("../data/input/Grupo_P11.xlsx")
head(vigentes)

FECINICIO,FECFIN,VLRPRISUSCR,VLRASEGU,VLRASEGURC,PTD,PPD,PH,PPH,RC
<dttm>,<dttm>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
2019-01-08,2020-01-08,1379000,46490000,2000000000.0,1,1,1,1,1
2019-01-08,2020-01-08,1414000,62590000,2000000000.0,1,1,1,1,1
2019-01-08,2020-01-08,1369000,36490000,2000000000.0,1,1,1,1,1
2019-01-08,2020-01-08,1379000,41990000,2000000000.0,1,1,1,1,1
2019-01-08,2020-01-08,1379000,45390000,2000000000.0,1,1,1,1,1
2019-01-08,2019-09-01,661678,23500000,3000000000.0,1,1,1,1,1


In [63]:
names(vigentes)

In [64]:
vigentes$PTD <- NULL

In [65]:
vigentes <- vigentes %>%
  rename(
    "inicio" = "FECINICIO",                 # Fecha de inicio
    "fin" = "FECFIN",                       # Fecha de fin  
    "prima" = "VLRPRISUSCR",                # Prima
    "valor_asegurado" = "VLRASEGU",         # Valor asegurado general
    "valor_asegurado_rc" = "VLRASEGURC",    # Valor asegurado RC
    "ppd" = "PPD",                          # Pérdida parcial daños
    "pth" = "PH",                           # Pérdida total hurto
    "pph" = "PPH",                          # Pérdida parcial hurto
    "rc" = "RC"                             # Responsabilidad civil
  )

In [66]:
vigentes <- vigentes %>%
  mutate(
    valor_asegurado = valor_asegurado + valor_asegurado_rc  # Suma los valores asegurados
  )

## Nulos y duplicados

In [67]:
sum(is.na(vigentes))

In [68]:
unique(duplicated(vigentes))

In [69]:
nrow(vigentes)

In [70]:
nrow(unique(vigentes))

Eliminamos los 6 duplicados

In [71]:
vigentes <- unique(vigentes)

## Fechas y duracion

In [72]:
min(vigentes$inicio)
max(vigentes$inicio)

[1] "2019-01-08 UTC"

[1] "2019-01-09 UTC"

In [73]:
min(vigentes$fin)
max(vigentes$fin)

[1] "2019-01-08 UTC"

[1] "2020-12-29 UTC"

In [74]:
vigentes$duracion <- as.numeric(difftime(vigentes$fin, vigentes$inicio, units = "days")) + 1

In [75]:
sort(unique(vigentes$duracion))

In [76]:
nrow(vigentes[vigentes$duracion == 366, ])*100/nrow(vigentes)

In [77]:
nrow(vigentes[vigentes$duracion <= 1, ])*100/nrow(vigentes)

Vamos a considerar como una anomalia y vamos a corregirla. Es probable que todas estas polizas que duran un dia en realidad tengan una cobertura de 1 año y fueron mal digitadas.

In [78]:
vigentes$duracion[vigentes$duracion == 1] <- 366

## Primas

In [79]:
sort(unique(vigentes$prima))

In [80]:
nrow(vigentes[vigentes$prima <100000,])/nrow(vigentes)

No vamos a considerar esto como una anomalia pues podrian ser seguros que pagan mensualmente y hasta ahora han pagado la primer cuota

Nos quedamos solo con las 294 polizas tras eliminar duplicados

## Separacion por cobertura

In [81]:
ppd <- vigentes[vigentes$ppd == 1,]
ppd <- ppd %>% select(-ppd, -pth, -pph, -rc)

In [82]:
pth <- vigentes[vigentes$pth == 1,]
pth <- pth %>% select(-ppd, -pth, -pph, -rc)

In [83]:
pph <- vigentes[vigentes$pph == 1,]
pph <- pph %>% select(-ppd, -pth, -pph, -rc)

In [84]:
rc <- vigentes[vigentes$rc == 1,]
rc <- rc %>% select(-ppd, -pth, -pph, -rc)

## Agrupacion por dia

In [85]:
mean(vigentes_diarias(ppd)$polizas_activas)

In [86]:
mean(vigentes_diarias(pph)$polizas_activas)

In [87]:
mean(vigentes_diarias(pth)$polizas_activas)

In [88]:
mean(vigentes_diarias(rc)$polizas_activas)