<a href="https://colab.research.google.com/github/WellcomePeujio/Probabilidad-Condicional-para-Deteccion-de-Fraude/blob/main/Probabilidad_Condicional_para_Detecci%C3%B3n_de_Fraude.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Probabilidad Condicional para Detección de Fraude

**Problema**: En un dataset de transacciones, se sabe que el **1%** de las transacciones son fraudulentas.
 Además:

- El **80%** de las transacciones fraudulentas involucran compras superiores a $1,000.

- Solo el **5%** de las transacciones no fraudulentas cumplen esta condición.

**Preguntas**:

1. Utiliza la fórmula de **probabilidad condicional** para calcular la probabilidad de que una transacción superior a $1,000 sea fraudulenta.

2. ¿Cómo podría este cálculo ayudar en la detección automática de fraudes?


# Resolución del Problema de Probabilidad Condicional para Detección de Fraude

## Paso 1: Definir los Eventos

Definimos los eventos relevantes:
- $F$: la transacción es fraudulenta.

- $N$: la transacción no es fraudulenta.

- $A$: la transacción es superior a $1,000.

## Paso 2: Datos del Problema

- $P(F) = 0.01$: Probabilidad de que una transacción sea fraudulenta.

- $P(N) = 0.99$: Probabilidad de que una transacción no sea fraudulenta.

- $P(A \mid F) = 0.80$: Probabilidad de que una transacción fraudulenta sea superior a $1,000.

- $P(A \mid N) = 0.05$: Probabilidad de que una transacción no fraudulenta sea superior a $1,000.

## Paso 3: Aplicar la Fórmula de Probabilidad Condicional

Queremos encontrar $P(F \mid A)$, es decir, la probabilidad de que una transacción superior a $1,000 sea fraudulenta. Usamos el **teorema de Bayes**:

$$
P(F \mid A) = \frac{P(A \mid F) \cdot P(F)}{P(A)}
$$

Donde $P(A)$, la probabilidad de que una transacción sea superior a $1,000$, se calcula como:

$$
P(A) = P(A \mid F) \cdot P(F) + P(A \mid N) \cdot P(N)
$$

Sustituyendo los valores:

$$
P(A) = (0.80 \cdot 0.01) + (0.05 \cdot 0.99)
$$

$$
P(A) = 0.008 + 0.0495 = 0.0575
$$

## Paso 4: Calcular $P(F \mid A)$

Sustituimos $P(A)$ en la fórmula del teorema de Bayes:

$$
P(F \mid A) = \frac{0.80 \cdot 0.01}{0.0575}
$$

$$
P(F \mid A) = \frac{0.008}{0.0575} \approx 0.1391
$$

La probabilidad de que una transacción superior a $1,000 sea fraudulenta es **13.91%**.

## Interpretación

Este cálculo muestra que, aunque solo el 1% de las transacciones son fraudulentas, si una transacción es superior a $1,000, la probabilidad de que sea fraudulenta aumenta significativamente al 13.91%. Esto puede ser útil para sistemas de detección automática de fraudes, que pueden priorizar estas transacciones para una revisión más detallada.


In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Datos del problema
p_f = 0.01  # Probabilidad de transacción fraudulenta
p_n = 0.99  # Probabilidad de transacción no fraudulenta
p_a_given_f = 0.80  # Probabilidad de que una transacción fraudulenta sea > $1,000
p_a_given_n = 0.05  # Probabilidad de que una transacción no fraudulenta sea > $1,000

# Cálculo de P(A): Probabilidad de que una transacción sea superior a $1,000
p_a = (p_a_given_f * p_f) + (p_a_given_n * p_n)

# Cálculo de P(F | A): Probabilidad condicional usando el teorema de Bayes
p_f_given_a = (p_a_given_f * p_f) / p_a

# Generar datos para la gráfica
fraude_probabilidades = np.linspace(0, 1, 100)
probabilidad_condicional = (p_a_given_f * fraude_probabilidades) / ((p_a_given_f * fraude_probabilidades) + (p_a_given_n * (1 - fraude_probabilidades)))

# Crear la gráfica
plt.figure(figsize=(12, 6))
plt.plot(fraude_probabilidades, probabilidad_condicional, color='blue', linewidth=2, label='P(F | A)')
plt.axvline(x=p_f, color='red', linestyle='--', label=f'P(F) = {p_f:.2f}')
plt.axhline(y=p_f_given_a, color='green', linestyle='--', label=f'P(F | A) = {p_f_given_a:.4f}')
plt.xlabel('Probabilidad de Fraude P(F)', fontsize=14)
plt.ylabel('Probabilidad Condicional P(F | A)', fontsize=14)
plt.title('Evolución de la Probabilidad Condicional de Fraude', fontsize=16)
plt.legend(fontsize=12)
plt.grid(True)
plt.show()

# Mostrar los resultados numéricos
p_a, p_f_given_a
