# Обучение ассоциативным правилам

Анализ правил ассоциации-это метод определения базовых отношений между различными элементами. Возьмем, к примеру, супермаркет, где покупатели могут купить самые разные товары. Обычно в том, что покупают клиенты, есть определенная закономерность. Например, матери с младенцами покупают детские товары, такие как молоко и подгузники. Девушки могут покупать косметику, в то время как холостяки могут покупать пиво, чипсы и т. Д. Короче говоря, транзакции включают в себя шаблон. Большая прибыль может быть получена, если можно определить взаимосвязь между товарами, приобретенными в разных транзакциях.

Например, если товары A и B чаще покупаются вместе, то можно предпринять несколько шагов для увеличения прибыли. Например:

A и B можно разместить вместе, чтобы, когда клиент покупает один из продуктов, ему не нужно было далеко уходить, чтобы купить другой продукт.
Люди, которые покупают один из продуктов, могут быть нацелены с помощью рекламной кампании на покупку другого.
Коллективные скидки могут быть предложены на эти товары, если клиент покупает их оба.
И A, и B могут быть упакованы вместе.
Процесс выявления ассоциаций между продуктами называется анализом правил ассоциации.


## Априорный алгоритм для обучения ассоциативным правилам

Для реализации анализа правил ассоциации были разработаны различные статистические алгоритмы, и Apriori является одним из таких алгоритмов.

Существует три основных компонента априорного алгоритма:

Support

Confidence

Lift

   Support относится к популярности элемента по умолчанию и может быть рассчитана путем нахождения количества транзакций, содержащих конкретный элемент, деленного на общее количество транзакций.
   Confidence относится к вероятности того, что товар B также будет куплен, если будет куплен товар A. Его можно рассчитать, найдя количество транзакций, в которых A и B покупаются вместе, разделенное на общее количество транзакций, в которых A покупается.
   Lift(A -> B) относится к увеличению коэффициента продажи B при продаже A. Подъемная сила(A –> B) может быть рассчитана путем деления уверенности(A -> B) на поддержку(B). 

### Реализация алгоритма априори с помощью Python

In [21]:
 !pip install apriori

Collecting apriori
  Downloading apriori-1.0.0.tar.gz (1.8 kB)
Building wheels for collected packages: apriori
  Building wheel for apriori (setup.py): started
  Building wheel for apriori (setup.py): finished with status 'done'
  Created wheel for apriori: filename=apriori-1.0.0-py3-none-any.whl size=2484 sha256=0f5f599a2d28f3d6c7d1b44d2e3b9b64589a11ef7c5231eda70a29d194c4b664
  Stored in directory: c:\users\user\appdata\local\pip\cache\wheels\5b\68\dc\04db1838d64a3011a9b737e6f458894dc1f5cbadd128d54c1c
Successfully built apriori
Installing collected packages: apriori
Successfully installed apriori-1.0.0


In [None]:
#импорт библиотек 
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from apyori import apriori

In [None]:
#импорт датасета
store_data = pd.read_csv('https://gist.githubusercontent.com/Harsh-Git-Hub/2979ec48043928ad9033d8469928e751/raw/72de943e040b8bd0d087624b154d41b2ba9d9b60/retail_dataset.csv', sep=',')
store_data.head()

In [None]:
#обработка данных
records = []
for i in range(0, 8):
    records.append([str(store_data.values[i,j]) for j in range(0, 3)])

for i,j in enumerate(records):
    while 'nan' in records[i]: records[i].remove('nan')

In [None]:
#Применение Априори
association_rules = apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2)
association_results = list(association_rules)

In [30]:
#просмотр результатов
print(len(association_results))
print(association_results[0])

for item in association_results:
# первый индекс внутреннего списка
# Содержит базовый элемент и добавляет элемент
    pair = item[0]
    items = [x for x in pair]

    print("Rule: " + str(list(item.ordered_statistics[0].items_base)) + " -> " + str(list(item.ordered_statistics[0].items_add)))
    #второй индекс внутреннего списка
    print("Support: " + str(item[1]))
    #третий индекс списка, расположенный на 0-м месте
    #третьего индекса внутреннего списка
    print("Confidence: " + str(item[2][0][2]))
    print("Lift: " + str(item[2][0][3]))
    print("=====================================")

3
RelationRecord(items=frozenset({'Milk', 'Bagel'}), support=0.125, ordered_statistics=[OrderedStatistic(items_base=frozenset({'Bagel'}), items_add=frozenset({'Milk'}), confidence=1.0, lift=8.0), OrderedStatistic(items_base=frozenset({'Milk'}), items_add=frozenset({'Bagel'}), confidence=1.0, lift=8.0)])
Rule: ['Bagel'] -> ['Milk']
Support: 0.125
Confidence: 1.0
Lift: 8.0
Rule: ['Bagel'] -> ['Milk', 'Bread']
Support: 0.125
Confidence: 1.0
Lift: 8.0
Rule: ['Pencil'] -> ['Meat', 'Wine']
Support: 0.125
Confidence: 0.5
Lift: 4.0


### Вывод
Алгоритмы анализа правил ассоциации, такие как Apriori, очень полезны для поиска простых ассоциаций между нашими элементами данных. Они просты в реализации и обладают высокой объяснимостью. Однако для более продвинутой информации, например, используемой Google или Amazon и т.д., Используются более сложные алгоритмы, такие как рекомендательные системы. Тем не менее, вы, вероятно, можете видеть, что этот метод-очень простой способ получить базовые ассоциации, если это все, что вам нужно для использования.
