## Пример 1: Антивирусное программное обеспечение

Пример адаптивной антивирусной системы на **Python** предполагает моделирование процесса использования _машинного обучения_ для обнаружения потенциально ___вредоносных файлов___ на основе моделей поведения, а не только на основе известных *вирусных сигнатур*. Этот пример будет представлять собой базовую демонстрацию с использованием _синтетических данных_.

### Шаг 1: Импорт библиотек и создание необходимых инструментов

In [1]:
import numpy as np # Библиотека для работы с данными
from sklearn.ensemble import RandomForestClassifier # Библиотека классификации данных 
import os # библиотека для работы с операционной системой
from binary_list import BinaryList # библиотека для работы со списком бинарных сигнатур файлов

#### Добавление функций и путей к файлам

In [2]:
def read_file_content(file_path): # Функция read_file_content считает содержимое файла по указанному пути file_path
    with open(file_path, 'rb') as file:
        return file.read() # вернет резуьтат, содержимое файла

# Paths to directories
normal_files_dir = os.path.join("AdaptiveAntivirus", "normal_files") # путь к обычным файлам сохраним в переменную normal_files_dir
virus_files_dir = os.path.join("AdaptiveAntivirus", "viruses") # путь к файлам в которых точно известно что есть вирус сохраним
# в переменную virus_files_dir


In [3]:
normal_files_dir # покажет путь к директории с обычгыми файлами

'AdaptiveAntivirus\\normal_files'

In [4]:
virus_files_dir # покажет путь к директории с точно вирусными файлами

'AdaptiveAntivirus\\viruses'

In [5]:
os.listdir(normal_files_dir) # покажет списко всех файлов в директории с обычгыми файлами

['brubz.bin',
 'bufeb.txt',
 'etwch.bin',
 'ghfag.txt',
 'hmftk.bin',
 'icgia.bak',
 'jagyz.bak',
 'kxrui.bak',
 'lczja.log',
 'lmcfw.txt',
 'maxqg.bak',
 'mlful.dat',
 'onigu.log',
 'pcjgk.bin',
 'qsrfj.dat',
 'qzkss.bak',
 'rydds.txt',
 'soojl.dat',
 'wuwif.txt',
 'zgsgr.bak']

In [6]:
normal_files = [os.path.join(normal_files_dir, f) for f in os.listdir(normal_files_dir)] # сохраняем список относительных путей
# файлов os.listdir(normal_files_dir) в переменную normal_files
normal_data = BinaryList([read_file_content(f) for f in normal_files]) # сохраняем в переменную normal_data содержимое каждого файла
# директории normal_files_dir

In [8]:
normal_data[:5] # бинарные сигнатуры первых 5 файлов директории normal_files_dir

[bits: 0010110111100101,
bits: 1001100110010100,
bits: 0000000001111100,
bits: 0010111100111101,
bits: 1001001000101111]

In [9]:
virus_files = [os.path.join(virus_files_dir, f) for f in os.listdir(virus_files_dir)]
virus_data = BinaryList([read_file_content(f) for f in virus_files]) # сохраняем в переменную virus_data сигнатуры вирусных файлов

In [10]:
virus_data # посмотрим на получившееся сигнатуры

[bits: 0000000011111111,
bits: 1111111111111111]

**Обратите внимание** на то как отличаются сигнатуры вирусных файлов и обычных файлов