In [47]:
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from sklearn.ensemble import IsolationForest
from sklearn.preprocessing import LabelEncoder
from sklearn.impute import SimpleImputer
import pandas as pd

def send_email_alert(subject, body):
    sender_email = "correo0@gmail.com"
    receiver_email = "correo0@gmail.com"
    password = "password"

    # Crear el mensaje de correo electrónico
    message = MIMEMultipart()
    message["From"] = sender_email
    message["To"] = receiver_email
    message["Subject"] = subject

    # Adjuntar el cuerpo del mensaje
    message.attach(MIMEText(body, "plain"))

    # Conectar al servidor SMTP de Gmail
    try:
        with smtplib.SMTP_SSL("smtp.gmail.com", 465) as server:
            server.login(sender_email, password)
            server.sendmail(sender_email, receiver_email, message.as_string())
        print("Correo enviado exitosamente.")
    except Exception as e:
        print(f"Error al enviar el correo: {e}")

# Cargar los datos
file_path = 'table.csv'
data = pd.read_csv(file_path)
num_registros = len(data)
print(f"El archivo contiene {num_registros} registros.")

# Preprocesar los datos (Ejemplo de codificación de variables categóricas)
encoder = LabelEncoder()
data['Method_Encoded'] = encoder.fit_transform(data['Request.Method'])
data['URI_Encoded'] = encoder.fit_transform(data['Request.URI'])
data['Host_Encoded'] = encoder.fit_transform(data['Request.Headers.Host'])
data['Transaction_Type_Encoded'] = encoder.fit_transform(data['Transaction Type'])

# Imputar valores faltantes en las columnas numéricas
imputer = SimpleImputer(strategy='median')
data[['Duration', 'External Call Count', 'External Duration', 'Total Time', 'Http.Status Code', 'Response.Headers.Content Length']] = imputer.fit_transform(data[['Duration', 'External Call Count', 'External Duration', 'Total Time', 'Http.Status Code', 'Response.Headers.Content Length']])

# Configurar el modelo Isolation Forest
iso_forest = IsolationForest(n_estimators=100, contamination=0.1, random_state=42)

# Ajustar el modelo
iso_forest.fit(data[['Method_Encoded', 'URI_Encoded', 'Host_Encoded', 'Duration', 'Http.Status Code', 'Response.Headers.Content Length', 'Transaction_Type_Encoded']])

# Predecir anomalías (-1 para anomalías, 1 para normales)
data['anomaly'] = iso_forest.predict(data[['Method_Encoded', 'URI_Encoded', 'Host_Encoded', 'Duration', 'Http.Status Code', 'Response.Headers.Content Length', 'Transaction_Type_Encoded']])

# Filtrar las anomalías detectadas
anomalies = data[data['anomaly'] == -1]
anomalies_count = len(anomalies)
print("Anomalías detectadas:", anomalies_count)

# Calcular estadísticas de las características normales para comparación
normal_data = data[data['anomaly'] == 1]
normal_stats = normal_data[['Duration', 'External Call Count', 'External Duration', 'Total Time', 'Http.Status Code', 'Response.Headers.Content Length']].median()

# Enviar correo si se detectan anomalías
if anomalies_count > 0:
    subject = "Alerta de Anomalía Detectada"
    body = f"Se han detectado {anomalies_count} anomalías en el tráfico de la web.\n\nDetalles de las anomalías:\n"
    for index, row in anomalies.iterrows():
        body += f"Timestamp: {row['Timestamp']}, Method: {row['Request.Method']}, URI: {row['Request.URI']}, Host: {row['Request.Headers.Host']}, Duration: {row['Duration']}, External Call Count: {row['External Call Count']}, External Duration: {row['External Duration']}, Total Time: {row['Total Time']}, HTTP Status Code: {row['Http.Status Code']}, Response Content Length: {row['Response.Headers.Content Length']}, Transaction Type: {row['Transaction Type']}\n"
        if row['Duration'] > normal_stats['Duration']:
            body += f" - La duración de la solicitud ({row['Duration']}) es significativamente mayor que la mediana normal ({normal_stats['Duration']}).\n"
        if row['External Call Count'] > normal_stats['External Call Count']:
            body += f" - El número de llamadas externas ({row['External Call Count']}) es significativamente mayor que la mediana normal ({normal_stats['External Call Count']}).\n"
        if row['External Duration'] > normal_stats['External Duration']:
            body += f" - La duración externa ({row['External Duration']}) es significativamente mayor que la mediana normal ({normal_stats['External Duration']}).\n"
        if row['Total Time'] > normal_stats['Total Time']:
            body += f" - El tiempo total de la solicitud ({row['Total Time']}) es significativamente mayor que la mediana normal ({normal_stats['Total Time']}).\n"
        if row['Http.Status Code'] != normal_stats['Http.Status Code']:
            body += f" - El código de estado HTTP ({row['Http.Status Code']}) es diferente de la mediana normal ({normal_stats['Http.Status Code']}).\n"
        if row['Response.Headers.Content Length'] > normal_stats['Response.Headers.Content Length']:
            body += f" - La longitud del contenido de la respuesta ({row['Response.Headers.Content Length']}) es significativamente mayor que la mediana normal ({normal_stats['Response.Headers.Content Length']}).\n"
        body += "\n"
    send_email_alert(subject, body)
else:
    print("No se han detectado anomalías.")


El archivo contiene 5000 registros.
Anomalías detectadas: 500
Correo enviado exitosamente.


In [41]:
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from sklearn.ensemble import IsolationForest
from sklearn.preprocessing import LabelEncoder
from sklearn.impute import SimpleImputer
import pandas as pd

def send_email_alert(subject, body):
    sender_email = "misarchivos2040@gmail.com"
    receiver_email = "misarchivos2040@gmail.com"
    password = "xhkx koev lmjw xgrp"

    # Crear el mensaje de correo electrónico
    message = MIMEMultipart()
    message["From"] = sender_email
    message["To"] = receiver_email
    message["Subject"] = subject

    # Adjuntar el cuerpo del mensaje
    message.attach(MIMEText(body, "plain"))

    # Conectar al servidor SMTP de Gmail
    try:
        with smtplib.SMTP_SSL("smtp.gmail.com", 465) as server:
            server.login(sender_email, password)
            server.sendmail(sender_email, receiver_email, message.as_string())
        print("Correo enviado exitosamente.")
    except Exception as e:
        print(f"Error al enviar el correo: {e}")

# Cargar los datos
file_path = 'table.csv'  # Usando el path proporcionado
data = pd.read_csv(file_path)

# Convertir el campo Timestamp a datetime
data['Timestamp'] = pd.to_datetime(data['Timestamp'])

# Preprocesar los datos (Ejemplo de codificación de variables categóricas)
encoder = LabelEncoder()
data['Method_Encoded'] = encoder.fit_transform(data['Request.Method'])
data['URI_Encoded'] = encoder.fit_transform(data['Request.URI'])
data['Host_Encoded'] = encoder.fit_transform(data['Host'])

# Imputar valores faltantes
imputer = SimpleImputer(strategy='mean')
data[['Duration', 'External Call Count', 'External Duration', 'Http.Status Code', 'Response.Headers.Content Length']] = imputer.fit_transform(data[['Duration', 'External Call Count', 'External Duration', 'Http.Status Code', 'Response.Headers.Content Length']])

# Añadir una columna para contar el número de solicitudes por IP en un intervalo de tiempo
data.set_index('Timestamp', inplace=True)
request_count = data.groupby('Host').resample('1T').size().reset_index(name='Request_Count')
data = data.reset_index().merge(request_count, on=['Timestamp', 'Host'])

# Verificar y manejar valores NaN
features = ['Method_Encoded', 'URI_Encoded', 'Host_Encoded', 'Duration', 'Http.Status Code', 'Response.Headers.Content Length', 'Request_Count']
data[features] = imputer.fit_transform(data[features])

# Configurar el modelo Isolation Forest
iso_forest = IsolationForest(n_estimators=100, contamination=0.1, random_state=42)

# Ajustar el modelo
iso_forest.fit(data[features])

# Predecir anomalías (-1 para anomalías, 1 para normales)
data['anomaly'] = iso_forest.predict(data[features])

# Filtrar las anomalías detectadas
anomalies = data[data['anomaly'] == -1]

# Enviar correo si se encuentran anomalías
if not anomalies.empty:
    anomaly_details = anomalies[['Timestamp', 'Duration', 'Host', 'Http.Status Code', 'Request_Count']].to_string()
    send_email_alert("Alerta de Anomalía Detectada", f"Se han detectado anomalías en el tráfico de la web. Detalles:\n{anomaly_details}")

print("Anomalías detectadas:", len(anomalies))


Correo enviado exitosamente.
Anomalías detectadas: 7
