### Análisis Exploratorio de Datos para Business Payments

**Informe EDA:**

Elaborar un informe detallado en formato markdown que resuma los hallazgos más importantes del EDA. Este informe debe incluir visualizaciones relevantes y conclusiones clave para facilitar la comprensión del conjunto de datos y sus principales características.

## 1.   Carga y exploración inicial del dataset **Cash Request**

Distruimos las transacciones por estado

![image.png](attachment:image.png)

## Insigths:
Observamos un **estado dominante: "money_back"** (con 16,397 transacciones) que representa la mayoría de las operaciones. Esto puede indicar un alto volumen de devoluciones o reembolsos procesados por el sistema.

El segundo estado más observado es el "rejected" (6,568 transacciones), lo que sugiere una notable cantidad de rechazos de solicitudes o intentos de pago.

El resto de los estados muestran números considerablemente más bajos.


Por lo tanto tenemos:
* Altas tasas de "money_back" y "rejected":
Estos estados sugieren posibles problemas operativos relacionados con devoluciones y rechazos de transacciones, que podría deberse a errores del usuario, fallos técnicos o políticas restrictivas del servicio.

* Los estados menos frecuentes:
Los estados menos representados como "canceled" o "active" pueden corresponder a acciones más específicas o etapas avanzadas del ciclo de transacción.

* Vamos a investigar patrones en "money_back" y "rejected": cohortes, temporalidad, o condiciones que expliquen estos valores dominantes. Asi como profundizar en las causas de las devoluciones y rechazos.
Además de evaluar si estos estados afectan ingresos, frecuencia de uso o tasas de incidentes.

## Ahora analizamos la distribución temporal de transacciones

![image.png](attachment:image.png)

## Insights:

Observamos un **crecimiento cradual durante los primeros meses** (de noviembre de 2020 a mayo), se observa un crecimiento moderado en el número de transacciones, quizás un puede reflejar un período de adopción inicial por parte de los usuarios.

**Incremento acelerado desde junio hasta septiembre**, indicando un posible crecimiento en la base de usuarios, campañas exitosas o mejoras en los servicios.

El **punto más alto ocurre en octubre**, con un número significativamente mayor de transacciones (~8,000). Esto podría estar relacionado con eventos promocionales, estacionalidad o un cambio significativo en las políticas de la empresa.


En noviembre, el número de transacciones cae drásticamente,  podría deberse a falta de datos completos para el mes de noviembre o factores internos como problemas técnicos o externos como estacionalidad negativa. O salida del Covid?


## Por lo tanto, tenemos:

* Crecimiento General: La tendencia global muestra un crecimiento continuo en el #transacciones, lo cual es positivo y puede reflejar una mayor adopción o confianza de los usuarios en el servicio.

* Pico de Octubre: Este punto requiere análisis adicional para identificar las razones detrás del aumento abrupto: ¿Hubo promociones especiales o lanzamientos de productos? ¿Se expandieron los servicios a nuevos mercados?
Identificar las causas puede ser clave para replicar este éxito en el futuro.

* Caída en Noviembre: Si los datos son completos, podría reflejar una caída preocupante en la actividad y requerir un análisis adicional para determinar si hubo problemas operativos o cambios en el comportamiento de los usuarios.

## Ahora creamos cohortes mensuales


![image.png](attachment:image.png)

## Métricas Iniciales para el Proyecto

Las métricas iniciales a calcular y analizar para comenzar el proyecto son las siguientes:


* **Frecuencia de Uso del Servicio:** 
Analizar con qué frecuencia los usuarios de cada cohorte utilizan los servicios de adelanto de efectivo de Business Payments a lo largo del tiempo.

![image.png](attachment:image.png)

---
## 2.   Carga y exploración inicial del dataset **Fees**

Distruimos las transacciones por tipo de tarifa

![image.png](attachment:image.png)

* Distribución de tipos de tarifas (type):

instant_payment es el tipo más común, representando aproximadamente el 53% del total de tarifas.
Esto nos podría sugerir que los usuarios prefieren opciones de pago inmediato sobre otras modalidades.


* Estadísticas Generales del Dataset:

El cohorte más destacado es Octubre 2020, dado que es el mes con mayor frecuencia de uso, mayores ingresos y mayor tasa de incidentes:
    Transacciones: 10,766
    Ingresos: $53,835 (51.1% del total acumulado).
    Tasa de incidentes: 6.51%, que es alta comparativamente.
    Ingresos acumulados: $105,310.



* También observamos es que hay columnas con datos nulos significativos, tales como category, to_date y from_date, paid_at(entre 26% y 89% de valores nulos), lo que podria indicar un problema de integridad, analizaremos si es relevante para el modelo o negocio, y comentaremos la relación entre category y las incidencias por ejemplo. 
Analizaremos estos puntos con más detalle en el punto **3. Análisis de Calidad de Datos**


*  Fechas importantes (from_date, to_date, paid_at):

    Las estadísticas revelan períodos y valores coherentes:

    from_date:  Rango: 27 de mayo de 2020 a 2 de enero de 2021.
                Mediana: 25 de septiembre de 2020.

    to_date:    Rango: 9 de junio de 2020 a 17 de enero de 2021.
                Mediana: 29 de octubre de 2020.

    paid_at:    Rango: 23 de junio de 2020 a 12 de febrero de 2021.
                Mediana: 2 de noviembre de 2020.


    * ¿Qué nos dicen estos datos?
        - **Temporalidad estratégica**: Todo gira en torno al segundo semestre de 2020. Esto podría indicar que el sistema operó con mayor intensidad en este período.
        - **Armonía operativa**: Las fechas medianas caen dentro de un margen coherente, lo que sugiere procesos bien alineados y predecibles.

* Posibles próximos pasos considerados:

    - Investigar la relevancia de las columnas con alta cantidad de nulos.
    - Imputar valores o eliminar columnas dependiendo del análisis.
    - Comparar el desempeño de distintas cohortes más allá de octubre de 2020.
    - Identificar patrones de crecimiento o estancamiento.
    - Gráfico temporal para ver evolución de ingresos por mes.
    - Tasa de incidentes o pagos no completados por tipo y cohorte.


---
**INSIGHTS RELEVANTES**:
- Cohorte con mayor frecuencia de uso: 2020-10 (10766 transacciones)
- Cohorte con mayor tasa de incidentes: 2020-10 (6.51%)
- Cohorte con mayores ingresos: 2020-10 ($53,835.00)
- Total de ingresos acumulados: $105,310.00
---

**Iniciamos el análisis avanzado de datos para Business Payments, centrandonos en insights accionables y cohortes, con el objetivo de mejorar la comprensión del comportamiento de las transacciones y optimizar los servicios financieros ofrecidos.**

* Definimos y analizamos cohortes:

Agrupamos según el período en que realizaron los primeros adelanto de efectivo.
Estudiamos la evolución temporal de métricas dentro de estas cohortes.

Calculamos y analizamos las métricas clave solicitadas:

---

* **Frecuencia de Uso del Servicio**: Analizar con qué frecuencia los usuarios de cada cohorte utilizan los servicios de adelanto de efectivo de Business Payments a lo largo del tiempo.

![image.png](attachment:image.png)

## Insights:
    - Rango de Cohortes: Desde noviembre de 2019 hasta noviembre de 2020.
    - Promedio Global de Transacciones: Aprox 1.15 transacciones por usuario.

* Las cohortes de verano (junio-agosto de 2020) muestran un incremento sostenido en el promedio de transacciones, alcanzando un pico en julio con 1.31 transacciones por usuario.
* Las cohortes iniciales (noviembre de 2019 a febrero de 2020) tienen un promedio más bajo, rondando 1.1 transacciones.

* Interpretando el gráfico se deduce:
    - Una tendencia creciente. La frecuencia promedio aumenta gradualmente desde inicios de 2020, alcanzando su punto máximo en julio de 2020.
    - Una disminución posterior. A partir de septiembre, se observa un descenso leve pero constante.


* Observaciones Clave
    - Usuarios recientes vs. antiguos: Los usuarios de cohortes más recientes (noviembre de 2020) tienen frecuencias similares a las cohortes más antiguas, indicando estabilidad en el uso inicial del servicio.
    - Factores estacionales: Deducimos que los picos de transacciones en verano pueden deberse a factores externos como mayor tiempo libre o campañas promocionales.

    - Aumento en transacciones durante junio-agosto de 2020, ver para replicar estrategias exitosas.
    - Optimizar cohortes recientes: Identificar barreras que limitan el incremento de transacciones en cohortes recientes (noviembre de 2020).
    - Campañas personalizadas: Implementar incentivos específicos para retener y aumentar el uso en cohortes que muestran menor frecuencia promedio.


### **Conclusión: El análisis sugiere patrones estacionales y una tendencia creciente en las transacciones por cohorte hasta mediados de 2020, de aquí podriamos usar estos insights pueden ser utilizados para mejorar estrategias de retención y captación de usuarios.**

---

* **Tasa de Incidentes**: Identificar problemas de pago u otros incidentes dentro de cada cohorte.

Vamos a identificar variaciones significativas en el comportamiento entre cohortes.

![image.png](attachment:image.png)

Se identificaron **1,194 transacciones rechazadas** entre las cohortes analizadas. 

    Cohorte     Tasa de Incidentes (%)
    2020-05	    -
    2020-06	    0.26
    2020-07	    1.61
    2020-08	    5.57
    2020-09	    6.23
    2020-10	    6.51
    2020-11	    3.75


Primeras observaciones:

- Incremento progresivo: La tasa de incidentes aumenta significativamente desde junio de 2020 (0.26%) hasta alcanzar su pico en octubre de 2020 (6.51%).
- Disminución posterior: En noviembre, la tasa de incidentes baja al 3.75%.

- Como ya mencionamos antes, la cohorte 2020-10 destaca con la mayor proporción de incidentes.

## ** Conclusión: 

Tendencia al alza: 
La tasa de incidentes creció de manera constante desde junio hasta octubre de 2020, lo que podría estar relacionado con factores externos como
- Cambios en políticas de pago o validación.
- Aumento en el volumen de transacciones rechazadas por problemas técnicos.

Cohortes críticas: 
Las cohortes de agosto a octubre de 2020 requieren mayor análisis para identificar causas específicas de su alta tasa de incidentes.

Reducción en noviembre: 
La disminución en noviembre podría sugerir ajustes efectivos en los procesos de pago o menor volumen de transacciones.


---
* **Ingresos por Cohorte**: Evaluar los ingresos acumulados por cohorte en el tiempo.


* **Métricas acumuladas**: Proponer indicadores adicionales para enriquecer el análisis.
