<a href="https://colab.research.google.com/github/angelagomezM/TALENTOTECH/blob/main/PROYECTO_DETECCION_DE_Smishing_automatico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Paso 1: Instalar librer√≠as necesarias
!pip install -q ipywidgets

# Paso 2: Descargar dataset p√∫blico y preparar datos
import pandas as pd

url = "https://raw.githubusercontent.com/justmarkham/pycon-2016-tutorial/master/data/sms.tsv"
df = pd.read_csv(url, sep='\t', header=None, names=["label", "message"])

# Convertir etiquetas 'ham' a 0 y 'spam' a 1
df['label'] = df['label'].map({'ham': 0, 'spam': 1})

print(f"Dataset cargado con {len(df)} mensajes.")
print(df['label'].value_counts())

# Paso 3: Entrenar modelo de machine learning
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(df['message'])
y = df['label']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

modelo = LogisticRegression(max_iter=1000)
modelo.fit(X_train, y_train)

print(f"Precisi√≥n en test: {modelo.score(X_test, y_test)*100:.2f}%")

# Paso 4: Funci√≥n mejorada para detectar smishing con reglas y ML
import re

def detectar_sms_mejorado(texto):
    vector = vectorizer.transform([texto])
    pred = modelo.predict(vector)[0]

    # Detectar URLs sospechosas (simplificado)
    url_sospechosa = bool(re.search(r'http[s]?://[^\s]+', texto))
    palabras_peligro = ['bloqueada', 'actualice', 'suspensi√≥n', 'urgente', 'verifique', 'premio', 'clave', 'clic', 'reclama', 'evita', 'pago', 'alerta']

    # Si modelo dice smishing o si hay url sospechosa + palabra clave
    if pred == 1 or (url_sospechosa and any(p in texto.lower() for p in palabras_peligro)):
        mensaje = "‚ö†Ô∏è *Smishing detectado*"
        educacion = """
üìö **¬øQu√© hacer?**

- ‚ùå No hagas clic en enlaces sospechosos.
- üîí No compartas datos personales o bancarios.
- üö´ Bloquea el n√∫mero y rep√≥rtalo a tu operador m√≥vil.
- üõ°Ô∏è Puedes reportar el mensaje a:
   ‚Ä¢ Polic√≠a Nacional: [https://caivirtual.policia.gov.co](https://caivirtual.policia.gov.co)
   ‚Ä¢ MinTIC: [https://www.osi.gov.co](https://www.osi.gov.co)
   ‚Ä¢ Correo: ciberseguridad@mintic.gov.co
        """
        return mensaje + "\n\n" + educacion
    else:
        return "‚úÖ *Mensaje leg√≠timo*"

# Paso 5: Interfaz interactiva para probar mensajes
import ipywidgets as widgets
from IPython.display import display, Markdown

entrada = widgets.Textarea(
    placeholder='Escribe aqu√≠ el mensaje SMS...',
    description='Mensaje:',
    layout=widgets.Layout(width='100%', height='100px')
)

boton = widgets.Button(description="Analizar", button_style='primary')
salida = widgets.Output()

def cuando_clic(b):
    with salida:
        salida.clear_output()
        resultado = detectar_sms_mejorado(entrada.value)
        display(Markdown("### Resultado:\n" + resultado))

boton.on_click(cuando_clic)

display(Markdown("## üì≤ Detector de Smishing Mejorado con Ruta Educativa"))
display(entrada, boton, salida)


[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/1.6 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m [32m1.6/1.6 MB[0m [31m73.2 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.6/1.6 MB[0m [31m24.5 MB/s[0m eta [36m0:00:00[0m
[?25hDataset cargado con 5572 mensajes.
label
0    4825
1     747
Name: count, dtype: int64
Precisi√≥n en test: 96.41%


## üì≤ Detector de Smishing Mejorado con Ruta Educativa

Textarea(value='', description='Mensaje:', layout=Layout(height='100px', width='100%'), placeholder='Escribe a‚Ä¶

Button(button_style='primary', description='Analizar', style=ButtonStyle())

Output()