In [19]:
import os
import glob
import pandas as pd
from config import constants
from features.extractor import extract_features_from_pcap

In [20]:
BASE_PATH = '../data/raw'

In [21]:
CATEGORIES = list(constants.CATEGORIES)
print(CATEGORIES)

['video_hosting', 'e-mail', 'social_network', 'cloud_service', 'information', 'games', 'music']


In [22]:
def process_category(category):
    """Обрабатывает все PCAP-файлы в категории."""
    category_path = os.path.join(BASE_PATH, category)
    if not os.path.exists(category_path):
        print(f"Папка {category_path} не найдена.")
        return []

    pcap_files = glob.glob(os.path.join(category_path, "*.pcap"))
    if not pcap_files:
        print(f"PCAP-файлы в категории {category} не найдены.")
        return []

    print(f"Найдены файлы: {len(pcap_files)}")

    features_list = []
    for pcap_file in pcap_files:
        features = extract_features_from_pcap(pcap_file, category)
        if features:
            features_list.extend(features)

    return features_list

In [23]:
all_features = []

for category in CATEGORIES:
    print(f"\nОбработка категории: {category}")
    features = process_category(category)
    all_features.extend(features)

if not all_features:
    print("Не удалось извлечь признаки. Проверьте PCAP-файлы.")
    exit(1)


Обработка категории: video_hosting
Найдены файлы: 6
Успешно обработан файл ../data/raw\video_hosting\1_windows.pcap: 18 пакетов, 3 потоков
Успешно обработан файл ../data/raw\video_hosting\2_windows.pcap: 19 пакетов, 3 потоков
Успешно обработан файл ../data/raw\video_hosting\3_windows.pcap: 763 пакетов, 1 потоков
Успешно обработан файл ../data/raw\video_hosting\4_windows.pcap: 400 пакетов, 2 потоков
Успешно обработан файл ../data/raw\video_hosting\5_windows.pcap: 11 пакетов, 2 потоков
Успешно обработан файл ../data/raw\video_hosting\6_windows.pcap: 9 пакетов, 3 потоков

Обработка категории: e-mail
Найдены файлы: 6
Успешно обработан файл ../data/raw\e-mail\1_windows.pcap: 15 пакетов, 3 потоков
Успешно обработан файл ../data/raw\e-mail\2_windows.pcap: 28 пакетов, 1 потоков
Успешно обработан файл ../data/raw\e-mail\3_windows.pcap: 15 пакетов, 2 потоков
Успешно обработан файл ../data/raw\e-mail\4_windows.pcap: 112 пакетов, 5 потоков
Успешно обработан файл ../data/raw\e-mail\5_windows.pcap:

In [24]:
df = pd.DataFrame(all_features)
output_csv = "data/different_features/traffic_features.csv"
df.to_csv(output_csv, sep=',', encoding='utf-8', index=False)
print(f"Признаки сохранены в {output_csv}")

Признаки сохранены в data/different_features/traffic_features.csv


In [None]:
|