Troubleshooting chapter

adspect · Aug 25, 2022 · fa5a93d · fa5a93d
1 parent 083f730
commit fa5a93d
Show file tree

Hide file tree

Showing 6 changed files with 168 additions and 86 deletions.
diff --git a/filtering.md → how-it-works.md b/filtering.md → how-it-works.md
@@ -1,4 +1,6 @@
-# Фильтрация трафика
+# Как это работает
+
+**Данная глава не обязательна к прочтению.**
 
 Существует несколько подходов к обнаружению и фильтрации нежелательных посетителей в рекламном трафике.
 В этой главе мы рассмотрим три основных технологии автоматической фильтрации и покажем, что делает Adspect
@@ -63,12 +65,47 @@ services", мобильный контент) для защиты wap-click-оф
 
 Машинное обучение оказалось идеальным инструментом анализа отпечатков с их огромным набором составляющих их фактов.
 Adspect использует собственную технологию машинного обучения VLA™, которая постоянно обучается и точно распознает
-нежелательных посетителей далеко за рамками тех проверок, которые мы изначально в нее заложили. Более подробное
-описание технологии вы можете найти в [главе о VLA](vla.md).
-
-Машинное обучение пока остается "высшей математикой", которую применяют лишь немногие из лидеров рынка корпоративных
-антифрод-систем. Adspect является первой компанией, применившей машинное обучение для решения проблем безопасности
-в сфере партнерского маркетинга и рекламных технологий.
+нежелательных посетителей далеко за рамками тех проверок, которые мы изначально в нее заложили.
+
+VLA™ --- это аббревиатура от "Virtual Learning Appliance". Это торговое название нашей технологии
+машинного обучения, лежащей в основе наиболее продвинутых фильтров трафика в Adspect. Если говорить
+упрощенно, то это математическая машина, т.н. модель, которая проверяет входящий трафик и сама находит
+подозрительные повторяющиеся последовательности среди тысяч фактов в машинных отпечатках посетителей.
+По этим признакам она определяет модераторов, кликфрод и прочую злонамеренную активность. VLA находится
+в постоянном цикле самообучения, развиваясь и адаптируясь к новым угрозам по мере их появления. VLA
+является нашим самым мощным оружием в гонке вооружений партнерского маркетинга, так как может распознавать
+цели далеко за рамками тех проверок, которые мы изначально заложили. То, что человек-аналитик может
+упустить, никогда не ускользнет от математически точного анализа запрограммированной машины.
+
+Принцип работы машинного обучения можно проиллюстрировать следующей аналогией. Представьте полицейского
+в аэропорту, которого проинструктировали задерживать всех пассажиров с определенной татуировкой, так как
+известно, что носящие эту татуировку принадлежат к опасной банде. За последний месяц полицейский задержал
+десять человек с татуировкой и заметил, что все они также были одеты в футболки с таким же символом.
+Он сделал выводы и теперь будет также останавливать других пассажиров в таких футболках вне зависимости
+от того, есть у них татуировка или нет.
+
+В то время, как наши обычные проверки отпечатков дают очень близкую к 100% точность определения
+нежелательных посетителей, VLA является по своей природе вероятностной системой. Реальная ценность VLA
+в том, что стандартные проверки охватывают лишь заранее известные нам типы угроз, но VLA обнаруживает
+новые, ранее не известные нам образцы. Система получает на вход отпечаток, анализирует каждый факт в
+его составе и выдает процент уверенности в его опасности, как будто говоря: "я на 97% уверена в том,
+что это отпечаток опасного посетителя, и тебе лучше отфильтровать его!"
+
+Остается лишь определить, какой процент уверенности является достаточно высоким, чтобы фильтровать.
+В этом вопросе решение принимаете вы. В настройках каждого потока есть параметр "Точность VLA",
+который предназначен как раз для этого: вы выбираете минимально необходимую уверенность VLA, при
+которой посетитель будет отфильтрован на белую страницу. Например, если вы указали точность в 95%,
+то VLA отфильтрует всех тех посетителей, в чьей опасности она уверена на 95% и более. Те же, в ком
+VLA сомневается меньше, будут пропущены на контент (при отсутствии других признаков опасности). Этот
+единственный параметр точности позволяет вам тонко настроить систему в соответствии с вашим личным
+пониманием того, что значит "достаточная уверенность". Наши тесты показали, что 95% --- хорошее
+начальное значение для точности VLA.
+
+"Под капотом" VLA представляет из себя самообучающуюся модель дискретного
+[байесовского классификатора](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%B0)
+с единым общим датасетом (шаблоном) и множеством дочерних датасетов (специализаций), индивидуальных
+для каждого потока. Это означает, в частности, что со временем база знаний VLA адаптируется к специфике
+трафика каждого конкретного потока в Adspect.
 
 ## Наш подход
 

diff --git a/index.rst b/index.rst
@@ -6,11 +6,11 @@
    :caption: Содержание:
 
    overview
-   filtering
-   vla
+   how-it-works
    use-cases
    streams
    integration
+   troubleshooting
    binom
    comsign
    tracker

diff --git a/integration.md b/integration.md
@@ -181,7 +181,7 @@ Blogspot или Tilda, где вы не имеете возможности за
 ## Смена активного потока
 
 У каждого потока есть связанные с ним файлы `index.php`, `filter.php` и `ajax.php`, в которых закодирован ID потока.
-Однако, вы можете изменить целевой поток для любого перехода, указав полный ID потока в параметре ссылки `__sid`:
+Однако, вы можете изменить целевой поток для любого перехода, указав ID потока в параметре ссылки `__sid`:
 
 ```
 https://example.com/index.php?__sid=1ea85c7c-b977-6804-8e69-00162501c2b4
@@ -191,33 +191,3 @@ https://example.com/index.php?__sid=1ea85c7c-b977-6804-8e69-00162501c2b4
 
 Если вам нужно изменить имя параметра `__sid` на другое, то откройте PHP-файл Adspect в текстовом редакторе,
 найдите в нем строку `__sid` и замените ее на нужное вам имя (например, `utm_campaign`).
-
-## Отладка
-
-Наиболее часто встречающаяся ошибка интеграции &mdash; 500 Internal Server Error &mdash;
-происходит по следующим причинам:
-
-1. Файл, указанный для отображения контента/белой страницы без редиректа, не существует на сервере по заданному пути;
-2. PHP на сервере не имеет поддержки cURL &mdash; вам нужно установить пакет `php-curl`.
-
-Все PHP-файлы Adspect поддерживают режим отладки. Если он включен, то ошибки, происходящие на стороне сервера, будут
-отображаться в браузере. Чтобы включить режим отладки, откройте наш PHP-файл в текстовом редакторе, найдите следующий
-код в самом его начале:
-
-```php
-<?php
- defined('ADSPECT_DEBUG') or define('ADSPECT_DEBUG', 0);
-```
-
-и замените в нем `0` на `1`:
-
-```php
-<?php
- defined('ADSPECT_DEBUG') or define('ADSPECT_DEBUG', 1);
-```
-
-Если у вас не работает PHP-интеграция, например, вы видите ошибку HTTP 500, то в режиме отладки вы увидите
-более подробное описание ошибки. При отладке JavaScript-интеграции нужно переходить напрямую на URL нашего
-файла `ajax.php`. Если вы не знаете как исправить ту или иную ошибку, то свяжитесь с нами в Telegram.
-
-**Не забудьте выключить режим отладки после устранения всех неполадок.**