In [13]:
import os
import glob
import pandas as pd
from config import constants
from features.extractor import extract_features_from_pcap

In [14]:
BASE_PATH = '../data/raw'

In [15]:
CATEGORIES = list(constants.CATEGORIES)
print(CATEGORIES)

['cloud_service', 'e-mail', 'games', 'information', 'music', 'social_network', 'video_hosting']


In [16]:
def process_category(category):
    category_path = os.path.join(BASE_PATH, category)
    if not os.path.exists(category_path):
        print(f"Папка {category_path} не найдена.")
        return []

    pcap_files = glob.glob(os.path.join(category_path, "*.pcap"))
    if not pcap_files:
        print(f"PCAP-файлы в категории {category} не найдены.")
        return []

    print(f"Найдены файлы: {len(pcap_files)}")

    features_list = []
    for pcap_file in pcap_files:
        features = extract_features_from_pcap(pcap_file, category)
        if features:
            features_list.extend(features)

    return features_list

In [17]:
all_features = []

for category in CATEGORIES:
    print(f"\nОбработка категории: {category}")
    features = process_category(category)
    all_features.extend(features)

if not all_features:
    print("Не удалось извлечь признаки. Проверьте PCAP-файлы.")
    exit(1)


Обработка категории: cloud_service
Найдены файлы: 20
Успешно обработан файл ../data/raw\cloud_service\10_windows_300.pcap: 1362 пакетов, 6 потоков
Успешно обработан файл ../data/raw\cloud_service\11_darwin_300.pcap: 55 пакетов, 6 потоков
Успешно обработан файл ../data/raw\cloud_service\12_darwin_300.pcap: 3347 пакетов, 6 потоков
Успешно обработан файл ../data/raw\cloud_service\13_darwin_300.pcap: 3589 пакетов, 10 потоков
Успешно обработан файл ../data/raw\cloud_service\14_darwin_300.pcap: 48 пакетов, 4 потоков
Успешно обработан файл ../data/raw\cloud_service\15_darwin_300.pcap: 2 пакетов, 2 потоков
Успешно обработан файл ../data/raw\cloud_service\16_darwin_300.pcap: 20 пакетов, 6 потоков
Успешно обработан файл ../data/raw\cloud_service\16_windows_600.pcap: 96 пакетов, 7 потоков
Успешно обработан файл ../data/raw\cloud_service\17_darwin_300.pcap: 39 пакетов, 11 потоков
Успешно обработан файл ../data/raw\cloud_service\17_windows_600.pcap: 1559 пакетов, 9 потоков
Успешно обработан файл .

In [18]:
df = pd.DataFrame(all_features)
output_csv = "data/different_features/traffic_features.csv"
df.to_csv(output_csv, sep=',', encoding='utf-8', index=False)
print(f"Признаки сохранены в {output_csv}")

Признаки сохранены в data/different_features/traffic_features.csv
