# An√°lisis de Transacciones y Detecci√≥n de Alertas Sospechosas

**1. Introducci√≥n**

Este an√°lisis tiene como objetivo examinar un conjunto de datos sobre transacciones financieras, prestando especial atenci√≥n a la variable *flagged_alert*, que se√±ala si una transacci√≥n ha sido considerada sospechosa (1) o no sospechosa (0). La idea es identificar posibles falsos positivos y evaluar c√≥mo el monto (amount) y el tipo de transacci√≥n (transaction_type) influyen en la generaci√≥n de alertas.

 *üìå Nota:Este an√°lisis se realiz√≥ sobre un dataset ficticio con fines educativos y anal√≠ticos. No se est√° manejando informaci√≥n real ni confidencial.*

**2. Descripci√≥n General del Dataset**

Se utiliz√≥ el archivo transaction_data.csv que contiene 5000 transacciones. La variable principal de inter√©s es el monto de la transacci√≥n *(amount)*, acompa√±ado de indicadores como el tipo de transacci√≥n *(transaction_type)* y si fue marcada como sospechosa *(flagged_alert)*.

   Estad√≠sticas del Monto
   - Monto m√≠nimo: 10.06
   - Monto m√°ximo: 4997.79
   - Media: 2474.55
   - Desviaci√≥n est√°ndar: 1435.00
   - Rango intercuart√≠lico:
      - 25% ‚â§ 1236.74
      - 75% ‚â§ 3710.84
   Debido a la desviaci√≥n est√°ndar y la media observamos que hay una alta variabilidad en los montos.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt 
import seaborn as sns

f = pd.read_csv("transaction_data.csv")
print(f.describe())


**An√°lisis de Alertas Sospechosas**

Observamos que :
- El *68.28%* de las transacciones fueron marcadas como *no sospechosas*.
- El *31.72%* de las transacciones fueron marcadads como *sospechosas* . 

Esto nos indica que hay una cantidad considerable de *'alertas'* , esto lo confirmamos mediante un gr√°fico de barras donde se observa un mayor n√∫mero de transacciones no marcadas como sospechosas.


In [None]:

print(f['flagged_alert'].value_counts(normalize=True))
f['flagged_alert'].value_counts().plot(kind='bar', figsize=(10, 6),color='salmon')
plt.xlabel('Flagged Alert')
plt.ylabel('Cantidad de Transacciones')
plt.title('Detecci√≥n de falsos positivos')
plt.show()


**Comparaci√≥n de los montos seg√∫n alertas**

Un an√°lisis de caja nos revel√≥ lo siguiente
- la mediana de los montos en transacciones sospechosas es mayor que la de las no sospechosas.
- Tienen rango de valores similares y alcanzan montos maximos parecidos.

Con lo anterior podemos afirmar que
- Se tiendne a marcar montos m√°s altos como sospechosos
- Hay transacciones grandes que pueden ser no marcadas como sospechosas y algunas peque√±as que si lo son

Entonces si hay muchas transacciones con montos bajos marcados como transacci√≥n sospechosa podr√≠a ser se√±al de Falsos Positivos



In [None]:
plt.figure(figsize=(10,6))
sns.boxplot(x=f['flagged_alert'],y=f['amount'],color='salmon')
plt.xlabel('Flagged Alert')
plt.ylabel('Monto de la Transacci√≥n')
plt.title('Distribuci√≥n de Montos en Transacciones Marcadas y No Marcadas')
plt.show()

**Posibles Falsos Positivos (FP)**

Para identificar posibles falsos positivos,inicialmente se analizaron transacciones marcadas como sospechosas con montos inferiores a la mediana (2474.55) , es decir, se respondi√≥ a la pregunta *¬øCuant√°s transacciones de bajo monto fueron marcadas como sospechosas?*.

Se obtuvieron 547 transacciones sospechosas con montos bajos,lo cu√°l nos sugiere que se podr√≠a estar marcando incorrectamente algunas transacciones normales.

Ahora nos hacemos la pregunta, *¬øSolo se detectan montos altos?*

Al analizar las estad√≠sticas de los montos seg√∫n la clasificaci√≥n de *alerta*, observamos lo siguiente:
- Las transacciones de mayor monto tienen m√°s probabilidades de ser marcadas como sospechosas.
- Sin embargo, tambi√©n hay transacciones peque√±as que fueron clasificadas como sospechosas.
- El m√≠nimo de ambas categor√≠as es similar (10.06 y 10.15), lo cu√°l nos indica que existen montos bajos dentro de las transacciones sospechosas.
- El 25% de las transacciones sospechosas tienen un monto igual o inferior a 1720.60, lo cual confirma que no todas las transacciones marcadas como sospechosas son de montos altos.

Esto nos sugiere que, *aunque el monto es un factor clave en la clasificaci√≥n de alertas, existen otros criterios que pueden llevar a que transacciones de bajo monto sean se√±aladas como sospechosas*.

Al comparar la distribuci√≥n de los montos para transacciones sospechosas y no sospechosas mediante un An√°lisis de Distribuci√≥n (KDE Plot) se observa una diferencia notable en la forma de las curvas.Esto nos confirma que el monto tiene un impacto importante en la probabilidad de que una transacci√≥n sea marcada como sospechosa.

Al finalizar se analizaron los *montos por tipo de transacci√≥n*,observamos lo siguiente

- Algunos tipos de transacci√≥n presentan mayores tasas de sospecha que otros y se presentan variaciones en el monto promedio seg√∫n el tipo de transacci√≥n.
- Esto nos llega a indicar que el tipo de transacci√≥n tambi√©n influye en la clasificaci√≥n y podr√≠a ser una fuente de falsos positivos.


In [None]:
transacciones_bajo_monto = f[(f['amount'] < f['amount'].median()) & (f['flagged_alert'] == 1)]
print(f"Cantidad de transacciones sospechosas con monto bajo: {len(transacciones_bajo_monto)}")
#si hay muchas transacciones con montos bajos con f['flagged_alert'] == 1 podr√≠a ser se√±al de FP

#solo se detectan montos bajos?
print(f.groupby('flagged_alert')['amount'].describe())

#el monto tiene un impacto en las alertas?
sns.kdeplot(f[f['flagged_alert'] == 0]['amount'], label="No sospechosa", fill=True)
sns.kdeplot(f[f['flagged_alert'] == 1]['amount'], label="Sospechosa", fill=True)
plt.xlabel("Monto de la Transacci√≥n")
plt.ylabel("Densidad")
plt.title("Distribuci√≥n de Montos en Transacciones Marcadas y No Marcadas")
plt.legend()
plt.show()


# Contamos alertas por tipo de transacci√≥n
print(f.groupby("transaction_type")["flagged_alert"].mean() * 100)
print(f.groupby("transaction_type")["amount"].mean())

**Conclusiones**
- El monto de la transacci√≥n influye significativamente en la clasificaci√≥n de alertas.
- Existen indicios de falsos positivos, especialmente en montos bajos.
- El tipo de transacci√≥n tambi√©n parece tener un impacto en la probabilidad de ser marcada como sospechosa.
- Se recomienda un an√°lisis m√°s profundo para ajustar los par√°metros del sistema de detecci√≥n y reducir errores de clasificaci√≥n.

*üìå Nota final: Este an√°lisis se basa en datos simulados y no representa informaci√≥n financiera real.*