Skip to content

Commit

Permalink
Troubleshooting chapter
Browse files Browse the repository at this point in the history
  • Loading branch information
enclaved committed Aug 25, 2022
1 parent 083f730 commit fa5a93d
Show file tree
Hide file tree
Showing 6 changed files with 168 additions and 86 deletions.
51 changes: 44 additions & 7 deletions filtering.md → how-it-works.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,6 @@
# Фильтрация трафика
# Как это работает

**Данная глава не обязательна к прочтению.**

Существует несколько подходов к обнаружению и фильтрации нежелательных посетителей в рекламном трафике.
В этой главе мы рассмотрим три основных технологии автоматической фильтрации и покажем, что делает Adspect
Expand Down Expand Up @@ -63,12 +65,47 @@ services", мобильный контент) для защиты wap-click-оф

Машинное обучение оказалось идеальным инструментом анализа отпечатков с их огромным набором составляющих их фактов.
Adspect использует собственную технологию машинного обучения VLA™, которая постоянно обучается и точно распознает
нежелательных посетителей далеко за рамками тех проверок, которые мы изначально в нее заложили. Более подробное
описание технологии вы можете найти в [главе о VLA](vla.md).

Машинное обучение пока остается "высшей математикой", которую применяют лишь немногие из лидеров рынка корпоративных
антифрод-систем. Adspect является первой компанией, применившей машинное обучение для решения проблем безопасности
в сфере партнерского маркетинга и рекламных технологий.
нежелательных посетителей далеко за рамками тех проверок, которые мы изначально в нее заложили.

VLA™ --- это аббревиатура от "Virtual Learning Appliance". Это торговое название нашей технологии
машинного обучения, лежащей в основе наиболее продвинутых фильтров трафика в Adspect. Если говорить
упрощенно, то это математическая машина, т.н. модель, которая проверяет входящий трафик и сама находит
подозрительные повторяющиеся последовательности среди тысяч фактов в машинных отпечатках посетителей.
По этим признакам она определяет модераторов, кликфрод и прочую злонамеренную активность. VLA находится
в постоянном цикле самообучения, развиваясь и адаптируясь к новым угрозам по мере их появления. VLA
является нашим самым мощным оружием в гонке вооружений партнерского маркетинга, так как может распознавать
цели далеко за рамками тех проверок, которые мы изначально заложили. То, что человек-аналитик может
упустить, никогда не ускользнет от математически точного анализа запрограммированной машины.

Принцип работы машинного обучения можно проиллюстрировать следующей аналогией. Представьте полицейского
в аэропорту, которого проинструктировали задерживать всех пассажиров с определенной татуировкой, так как
известно, что носящие эту татуировку принадлежат к опасной банде. За последний месяц полицейский задержал
десять человек с татуировкой и заметил, что все они также были одеты в футболки с таким же символом.
Он сделал выводы и теперь будет также останавливать других пассажиров в таких футболках вне зависимости
от того, есть у них татуировка или нет.

В то время, как наши обычные проверки отпечатков дают очень близкую к 100% точность определения
нежелательных посетителей, VLA является по своей природе вероятностной системой. Реальная ценность VLA
в том, что стандартные проверки охватывают лишь заранее известные нам типы угроз, но VLA обнаруживает
новые, ранее не известные нам образцы. Система получает на вход отпечаток, анализирует каждый факт в
его составе и выдает процент уверенности в его опасности, как будто говоря: "я на 97% уверена в том,
что это отпечаток опасного посетителя, и тебе лучше отфильтровать его!"

Остается лишь определить, какой процент уверенности является достаточно высоким, чтобы фильтровать.
В этом вопросе решение принимаете вы. В настройках каждого потока есть параметр "Точность VLA",
который предназначен как раз для этого: вы выбираете минимально необходимую уверенность VLA, при
которой посетитель будет отфильтрован на белую страницу. Например, если вы указали точность в 95%,
то VLA отфильтрует всех тех посетителей, в чьей опасности она уверена на 95% и более. Те же, в ком
VLA сомневается меньше, будут пропущены на контент (при отсутствии других признаков опасности). Этот
единственный параметр точности позволяет вам тонко настроить систему в соответствии с вашим личным
пониманием того, что значит "достаточная уверенность". Наши тесты показали, что 95% --- хорошее
начальное значение для точности VLA.

"Под капотом" VLA представляет из себя самообучающуюся модель дискретного
[байесовского классификатора](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%B0)
с единым общим датасетом (шаблоном) и множеством дочерних датасетов (специализаций), индивидуальных
для каждого потока. Это означает, в частности, что со временем база знаний VLA адаптируется к специфике
трафика каждого конкретного потока в Adspect.

## Наш подход

Expand Down
4 changes: 2 additions & 2 deletions index.rst
Original file line number Diff line number Diff line change
Expand Up @@ -6,11 +6,11 @@
:caption: Содержание:

overview
filtering
vla
how-it-works
use-cases
streams
integration
troubleshooting
binom
comsign
tracker
Expand Down
32 changes: 1 addition & 31 deletions integration.md
Original file line number Diff line number Diff line change
Expand Up @@ -181,7 +181,7 @@ Blogspot или Tilda, где вы не имеете возможности за
## Смена активного потока

У каждого потока есть связанные с ним файлы `index.php`, `filter.php` и `ajax.php`, в которых закодирован ID потока.
Однако, вы можете изменить целевой поток для любого перехода, указав полный ID потока в параметре ссылки `__sid`:
Однако, вы можете изменить целевой поток для любого перехода, указав ID потока в параметре ссылки `__sid`:

```
https://example.com/index.php?__sid=1ea85c7c-b977-6804-8e69-00162501c2b4
Expand All @@ -191,33 +191,3 @@ https://example.com/index.php?__sid=1ea85c7c-b977-6804-8e69-00162501c2b4

Если вам нужно изменить имя параметра `__sid` на другое, то откройте PHP-файл Adspect в текстовом редакторе,
найдите в нем строку `__sid` и замените ее на нужное вам имя (например, `utm_campaign`).

## Отладка

Наиболее часто встречающаяся ошибка интеграции — 500 Internal Server Error —
происходит по следующим причинам:

1. Файл, указанный для отображения контента/белой страницы без редиректа, не существует на сервере по заданному пути;
2. PHP на сервере не имеет поддержки cURL — вам нужно установить пакет `php-curl`.

Все PHP-файлы Adspect поддерживают режим отладки. Если он включен, то ошибки, происходящие на стороне сервера, будут
отображаться в браузере. Чтобы включить режим отладки, откройте наш PHP-файл в текстовом редакторе, найдите следующий
код в самом его начале:

```php
<?php
defined('ADSPECT_DEBUG') or define('ADSPECT_DEBUG', 0);
```

и замените в нем `0` на `1`:

```php
<?php
defined('ADSPECT_DEBUG') or define('ADSPECT_DEBUG', 1);
```

Если у вас не работает PHP-интеграция, например, вы видите ошибку HTTP 500, то в режиме отладки вы увидите
более подробное описание ошибки. При отладке JavaScript-интеграции нужно переходить напрямую на URL нашего
файла `ajax.php`. Если вы не знаете как исправить ту или иную ошибку, то свяжитесь с нами в Telegram.

**Не забудьте выключить режим отладки после устранения всех неполадок.**

0 comments on commit fa5a93d

Please sign in to comment.