In [6]:
import pandas as pd
import requests
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report

def process_csv_file(file_path):
    # Leer el archivo CSV en un DataFrame
    df = pd.read_csv(file_path)

    # Obtener los dominios de prueba del DataFrame
    data_test = df["domain"]

    # Crear una lista vacía para almacenar las predicciones
    predictions = []

    # URL del servidor donde está alojado el modelo
    url = "http://ns158.ingenieria.uncuyo.edu.ar:8000/predict?domain="

    # Realizar las solicitudes HTTP y obtener las predicciones
    for domain in data_test:
        response = requests.get(url + domain)
        if response.status_code == 200:
            prediction = response.json()['class']
            predictions.append(prediction)
        else:
            print(f"Error al hacer la predicción para el dominio: {domain}")

    # Crear una nueva columna en el DataFrame para almacenar las predicciones
    df['prediction'] = predictions

    # Obtener las predicciones y etiquetas del DataFrame
    df['class'] = df['class'].replace({1: 'dga', 0: 'normal'})
    predictions = df['prediction']
    labels = df['class']

    # Calcular la matriz de confusión
    confusion = confusion_matrix(labels, predictions)

    # Calcular el reporte de clasificación que incluye precision, recall, F1-score y support
    report = classification_report(labels, predictions)

    # Obtener las cuentas de los valores de la clase
    counts = labels.value_counts()
    dga_count = counts['dga']
    #normal_count = counts['normal']

    # Crear un DataFrame para almacenar los resultados de las métricas
    metrics_df = pd.DataFrame({
        'File': [file_path],
        'DGA Count': [dga_count],
        #'Normal Count': [normal_count],
        'Confusion Matrix': [confusion],
        'Classification Report': [report]
    })

    return metrics_df


# Ejemplo de uso
file_paths = ['4kdomain.csv']#,'bamital.csv','banjori.csv','bedep.csv','conficker.csv','dyre.csv','matsnu.csv','pushdo.csv','ramdo.csv','suppobox.csv']  # Lista de archivos CSV a procesar

results = pd.DataFrame()  # DataFrame para almacenar los resultados de las métricas

for file_path in file_paths:
    metrics = process_csv_file(file_path)
    results = pd.concat([results, metrics], ignore_index=True)

# Imprimir los resultados
print(results)



           File  DGA Count       Confusion Matrix  \
0  4kdomain.csv       4000  [[399, 3601], [0, 0]]   

                               Classification Report  
0                precision    recall  f1-score   ...  


  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
