In [2]:
import os
import json
import pickle
from bisect import bisect_left, bisect_right
from datetime import datetime, timedelta
from collections import defaultdict, Counter

import numpy as np
import pandas as pd
from tqdm import tqdm
import warnings
warnings.filterwarnings("ignore")

# GPU hack if you need
# os.environ["CUDA_VISIBLE_DEVICES"] = "0"

# Data

Columns
- `party_rk` – client unique identifier
- `account_rk` – client account unique identifier
- `financial_account_type_cd` – debit/credit card flag
- `transaction_dttm` – operation datetime
- `transaction_type_desc` – purchase/payment/...
- `transaction_amt_rur` – transaction price
- `merchant_type` - DUTY FREE STORES/FUEL DEALERS/RESTAURANTS/ etc
- `merchant_group_rk` - McDonald's/Wildberries/ etc

It's important that table is already sorted by `transaction_dttm` column!!!

In [11]:
DATADIR = "./hackathon_data" # "./data"
transactions_path = f"{DATADIR}/avk_hackathon_data_transactions.csv"
data = pd.read_csv(f"{DATADIR}/avk_hackathon_data_transactions.csv")

In [15]:
data_balance = pd.read_csv(f"{DATADIR}/avk_hackathon_data_account_x_balance.csv")

In [5]:
data_soc = pd.read_csv(f"{DATADIR}/avk_hackathon_data_party_x_socdem.csv")

## Mappings
~1 min

In [3]:
# Prepare & save mappings
mappings = defaultdict(dict)
unk_token = "<UNK>"

def create_mapping(values):
    mapping = {unk_token: 0}
    for v in values:
        if not pd.isna(v):
            mapping[str(v)] = len(mapping)

    return mapping


for col in tqdm(
    [
        "transaction_type_desc",
        "merchant_rk",
        "merchant_type",
        "merchant_group_rk",
        "category",
        "financial_account_type_cd",
    ]
):

    col_values = (
        pd.read_csv(transactions_path, usecols=[col])[col]
        .fillna(unk_token)
        .astype(str)
    )
    mappings[col] = create_mapping(col_values.unique())
    del col_values


with open(f"{DATADIR}/mappings.json", "w") as f:
    json.dump(mappings, f)

  0%|          | 0/6 [00:05<?, ?it/s]


KeyboardInterrupt: 

In [12]:
# load mappings
unk_token = "<UNK>"
with open(f"{DATADIR}/mappings.json", 'r') as f:
     mappings = json.load(f)

In [9]:
mappings

{'transaction_type_desc': {'<UNK>': 0,
  'Покупка': 1,
  'Оплата услуг': 2,
  'Платеж': 3,
  'Снятие наличных': 4},
 'merchant_rk': {'<UNK>': 4816,
  '88676.0': 1,
  '887248.0': 2,
  '830014.0': 3,
  '363834.0': 4,
  '85919.0': 5,
  '146084.0': 6,
  '166649.0': 7,
  '1117458.0': 8,
  '798183.0': 9,
  '123479.0': 10,
  '362659.0': 11,
  '179531.0': 12,
  '988289.0': 13,
  '467110.0': 14,
  '596938.0': 15,
  '1116811.0': 16,
  '226559.0': 17,
  '528509.0': 18,
  '1097997.0': 19,
  '415888.0': 20,
  '500918.0': 21,
  '149715.0': 22,
  '516518.0': 23,
  '439054.0': 24,
  '245107.0': 25,
  '521220.0': 26,
  '166902.0': 27,
  '114006.0': 28,
  '611670.0': 29,
  '567084.0': 30,
  '55980.0': 31,
  '250736.0': 32,
  '93298.0': 33,
  '1092595.0': 34,
  '46122.0': 35,
  '552790.0': 36,
  '374309.0': 37,
  '695981.0': 38,
  '501347.0': 39,
  '261009.0': 40,
  '372350.0': 41,
  '3620.0': 42,
  '560151.0': 43,
  '651570.0': 44,
  '1059424.0': 45,
  '774130.0': 46,
  '118933.0': 47,
  '356081.0': 48,

## Parse transactions by users
~ 40 min

In [19]:
party2cat = defaultdict(list)
usecols = [
    "party_rk",
    "category",
]

for chunk in tqdm(
    pd.read_csv(transactions_path, usecols=usecols, chunksize=100_000w)
):
    chunk["category"] = (
        chunk["category"].fillna(unk_token).astype(str)
    )
    print(chunk["category"])  
    for i, row in chunk.iterrows():
        party2cat[row.party_rk].append(
            mappings["category"][row.category]
        )

    del chunk
        
pickle.dump(party2cat, open(f"{DATADIR}/party2cat.pkl", "wb"))

9it [00:00, 81.85it/s]

0               Сувениры
1               Фаст Фуд
2           Супермаркеты
3             Дом/Ремонт
4           Супермаркеты
5           Супермаркеты
6           Супермаркеты
7       Сервисные услуги
8           Супермаркеты
9                Красота
10                 <UNK>
11          Супермаркеты
12         Разные товары
13             Транспорт
14                 <UNK>
15                 <UNK>
16    Медицинские услуги
17          Супермаркеты
18               Топливо
19          Одежда/Обувь
20               Красота
21          Одежда/Обувь
22          Супермаркеты
23              Наличные
24          Супермаркеты
25          Одежда/Обувь
26          Супермаркеты
27              Фаст Фуд
28             Транспорт
29          Супермаркеты
             ...        
70         Разные товары
71              Наличные
72          Супермаркеты
73     Финансовые услуги
74          Супермаркеты
75               Топливо
76          Супермаркеты
77          Супермаркеты
78          Супермаркеты


27it [00:00, 82.56it/s]

1800          Супермаркеты
1801              Фаст Фуд
1802          Супермаркеты
1803                 <UNK>
1804          Супермаркеты
1805          Супермаркеты
1806          Супермаркеты
1807     Финансовые услуги
1808    Медицинские услуги
1809         Разные товары
1810          Супермаркеты
1811                Аптеки
1812              Фаст Фуд
1813          Супермаркеты
1814          Супермаркеты
1815              Фаст Фуд
1816              Фаст Фуд
1817              Фаст Фуд
1818         Разные товары
1819          Супермаркеты
1820             Транспорт
1821          Супермаркеты
1822                 <UNK>
1823          Супермаркеты
1824                 <UNK>
1825             Рестораны
1826              Наличные
1827          Супермаркеты
1828              Наличные
1829          Супермаркеты
               ...        
1870            Дом/Ремонт
1871     Финансовые услуги
1872              Наличные
1873     Финансовые услуги
1874                 <UNK>
1875                 <UNK>
1

45it [00:00, 82.86it/s]

3600        Разные товары
3601         Супермаркеты
3602         Супермаркеты
3603        Разные товары
3604         Супермаркеты
3605            Транспорт
3606         Супермаркеты
3607             Фаст Фуд
3608             Фаст Фуд
3609                <UNK>
3610         Супермаркеты
3611         Супермаркеты
3612         Супермаркеты
3613              Топливо
3614         Супермаркеты
3615         Супермаркеты
3616        Разные товары
3617               Аптеки
3618                Цветы
3619         Супермаркеты
3620    Финансовые услуги
3621         Супермаркеты
3622                  НКО
3623            Транспорт
3624         Супермаркеты
3625               Аптеки
3626        Разные товары
3627                <UNK>
3628            Рестораны
3629               Аптеки
              ...        
3670                <UNK>
3671            Рестораны
3672         Супермаркеты
3673         Супермаркеты
3674                <UNK>
3675            Рестораны
3676               Аптеки
3677        

72it [00:00, 85.06it/s]

5400                <UNK>
5401                <UNK>
5402                <UNK>
5403               Аптеки
5404                <UNK>
5405                <UNK>
5406    Финансовые услуги
5407    Финансовые услуги
5408    Финансовые услуги
5409                <UNK>
5410                <UNK>
5411                <UNK>
5412                <UNK>
5413                <UNK>
5414                <UNK>
5415                <UNK>
5416            Транспорт
5417    Финансовые услуги
5418            Транспорт
5419        Связь/Телеком
5420                <UNK>
5421             Наличные
5422                  НКО
5423        Разные товары
5424               Аптеки
5425    Финансовые услуги
5426               Музыка
5427        Разные товары
5428    Финансовые услуги
5429         Супермаркеты
              ...        
5470         Супермаркеты
5471         Супермаркеты
5472     Сервисные услуги
5473              Топливо
5474         Супермаркеты
5475             Фаст Фуд
5476             Фаст Фуд
5477        

90it [00:01, 86.22it/s]

7200             Рестораны
7201         Разные товары
7202          Супермаркеты
7203                 <UNK>
7204          Супермаркеты
7205                 <UNK>
7206          Супермаркеты
7207          Супермаркеты
7208          Супермаркеты
7209          Супермаркеты
7210          Супермаркеты
7211                 <UNK>
7212                 <UNK>
7213                 <UNK>
7214          Супермаркеты
7215               Топливо
7216             Транспорт
7217            Фото/Видео
7218          Супермаркеты
7219          Супермаркеты
7220          Супермаркеты
7221                 <UNK>
7222               Топливо
7223               Красота
7224                Аптеки
7225          Супермаркеты
7226                 Книги
7227                 <UNK>
7228          Супермаркеты
7229          Супермаркеты
               ...        
7270          Супермаркеты
7271              Фаст Фуд
7272           Аренда авто
7273          Супермаркеты
7274                 <UNK>
7275             Транспорт
7

108it [00:01, 86.72it/s]

9100            <UNK>
9101        Транспорт
9102     Супермаркеты
9103       Дом/Ремонт
9104     Супермаркеты
9105     Супермаркеты
9106            Отели
9107     Супермаркеты
9108     Супермаркеты
9109            <UNK>
9110      Развлечения
9111         Фаст Фуд
9112           Аптеки
9113     Одежда/Обувь
9114         Наличные
9115     Супермаркеты
9116     Супермаркеты
9117     Супермаркеты
9118     Супермаркеты
9119     Супермаркеты
9120            <UNK>
9121    Разные товары
9122         Фаст Фуд
9123      Спорттовары
9124     Супермаркеты
9125     Супермаркеты
9126        Рестораны
9127            <UNK>
9128         Фаст Фуд
9129            <UNK>
            ...      
9170       Дом/Ремонт
9171          Топливо
9172     Супермаркеты
9173     Супермаркеты
9174     Супермаркеты
9175     Супермаркеты
9176       Автоуслуги
9177    Разные товары
9178              НКО
9179            <UNK>
9180      Развлечения
9181            <UNK>
9182            <UNK>
9183     Супермаркеты
9184     С

126it [00:01, 86.90it/s]

10900          Супермаркеты
10901          Супермаркеты
10902     Финансовые услуги
10903          Супермаркеты
10904              Фаст Фуд
10905          Супермаркеты
10906                 <UNK>
10907              Наличные
10908     Финансовые услуги
10909          Супермаркеты
10910             Рестораны
10911                 <UNK>
10912          Супермаркеты
10913                 <UNK>
10914          Супермаркеты
10915                Аптеки
10916                 <UNK>
10917          Супермаркеты
10918          Супермаркеты
10919              Фаст Фуд
10920                 <UNK>
10921              Фаст Фуд
10922          Супермаркеты
10923                  Кино
10924          Супермаркеты
10925          Одежда/Обувь
10926            Автоуслуги
10927                 <UNK>
10928             Транспорт
10929           Развлечения
                ...        
10970              Наличные
10971                 <UNK>
10972              Фаст Фуд
10973    Медицинские услуги
10974               

144it [00:01, 87.16it/s]

12800         Супермаркеты
12801         Супермаркеты
12802         Супермаркеты
12803         Супермаркеты
12804            Транспорт
12805         Супермаркеты
12806         Супермаркеты
12807             Фаст Фуд
12808              Красота
12809             Наличные
12810         Одежда/Обувь
12811         Супермаркеты
12812              Красота
12813            Транспорт
12814         Супермаркеты
12815         Супермаркеты
12816           Дом/Ремонт
12817         Супермаркеты
12818         Супермаркеты
12819           Фото/Видео
12820                <UNK>
12821         Супермаркеты
12822                <UNK>
12823         Супермаркеты
12824         Супермаркеты
12825             Фаст Фуд
12826        Разные товары
12827         Супермаркеты
12828          Развлечения
12829            Рестораны
               ...        
12870         Супермаркеты
12871         Супермаркеты
12872            Транспорт
12873            Транспорт
12874             Фаст Фуд
12875         Супермаркеты
1

162it [00:01, 87.30it/s]

14700                <UNK>
14701         Супермаркеты
14702                <UNK>
14703            Транспорт
14704             Фаст Фуд
14705         Супермаркеты
14706         Супермаркеты
14707         Супермаркеты
14708            Транспорт
14709              Топливо
14710          Развлечения
14711                <UNK>
14712         Супермаркеты
14713        Связь/Телеком
14714    Финансовые услуги
14715        Разные товары
14716         Супермаркеты
14717         Супермаркеты
14718                <UNK>
14719    Финансовые услуги
14720                <UNK>
14721                <UNK>
14722         Супермаркеты
14723                <UNK>
14724                <UNK>
14725         Супермаркеты
14726         Супермаркеты
14727                <UNK>
14728                <UNK>
14729                <UNK>
               ...        
14770              Топливо
14771                 Кино
14772               Аптеки
14773             Наличные
14774         Супермаркеты
14775            Транспорт
1

180it [00:02, 86.55it/s]

16500    Финансовые услуги
16501                <UNK>
16502                <UNK>
16503            Транспорт
16504                <UNK>
16505             Госсборы
16506            Транспорт
16507         Супермаркеты
16508         Супермаркеты
16509              Топливо
16510         Супермаркеты
16511            Транспорт
16512             Наличные
16513                <UNK>
16514         Супермаркеты
16515         Супермаркеты
16516         Супермаркеты
16517                <UNK>
16518         Одежда/Обувь
16519              Топливо
16520             Фаст Фуд
16521         Супермаркеты
16522         Супермаркеты
16523                <UNK>
16524                <UNK>
16525    Финансовые услуги
16526         Супермаркеты
16527         Супермаркеты
16528         Супермаркеты
16529         Супермаркеты
               ...        
16570           Дом/Ремонт
16571    Финансовые услуги
16572                <UNK>
16573             Фаст Фуд
16574              Топливо
16575             Фаст Фуд
1

198it [00:02, 84.73it/s]

18300                 <UNK>
18301          Одежда/Обувь
18302               Красота
18303          Супермаркеты
18304               Красота
18305          Супермаркеты
18306                Аптеки
18307              Фаст Фуд
18308    Медицинские услуги
18309             Транспорт
18310         Разные товары
18311          Супермаркеты
18312         Разные товары
18313                 <UNK>
18314          Супермаркеты
18315                Аптеки
18316          Супермаркеты
18317              Фаст Фуд
18318     Финансовые услуги
18319          Супермаркеты
18320            Дом/Ремонт
18321          Супермаркеты
18322          Супермаркеты
18323          Супермаркеты
18324    Медицинские услуги
18325         Разные товары
18326          Супермаркеты
18327         Разные товары
18328                Аптеки
18329                   НКО
                ...        
18370                 <UNK>
18371     Финансовые услуги
18372          Супермаркеты
18373                 <UNK>
18374               

216it [00:02, 83.92it/s]

20100            Рестораны
20101            Рестораны
20102                <UNK>
20103              Топливо
20104             Фаст Фуд
20105                Отели
20106         Супермаркеты
20107             Фаст Фуд
20108             Животные
20109         Супермаркеты
20110         Супермаркеты
20111    Финансовые услуги
20112         Супермаркеты
20113            Транспорт
20114         Супермаркеты
20115         Супермаркеты
20116                  НКО
20117             Фаст Фуд
20118         Одежда/Обувь
20119         Супермаркеты
20120                <UNK>
20121         Супермаркеты
20122                <UNK>
20123         Супермаркеты
20124         Супермаркеты
20125        Разные товары
20126                <UNK>
20127    Финансовые услуги
20128         Супермаркеты
20129         Супермаркеты
               ...        
20170                <UNK>
20171         Супермаркеты
20172               Аптеки
20173             Фаст Фуд
20174             Фаст Фуд
20175         Супермаркеты
2

234it [00:02, 83.74it/s]

21900            Рестораны
21901         Супермаркеты
21902                <UNK>
21903                <UNK>
21904        Разные товары
21905         Супермаркеты
21906         Супермаркеты
21907                Отели
21908            Транспорт
21909    Финансовые услуги
21910             Фаст Фуд
21911         Супермаркеты
21912                <UNK>
21913         Супермаркеты
21914    Финансовые услуги
21915         Супермаркеты
21916               Аптеки
21917                <UNK>
21918         Супермаркеты
21919             Фаст Фуд
21920                <UNK>
21921         Супермаркеты
21922             Фаст Фуд
21923              Красота
21924        Разные товары
21925                <UNK>
21926         Супермаркеты
21927               Аптеки
21928         Супермаркеты
21929                <UNK>
               ...        
21970         Одежда/Обувь
21971             Фаст Фуд
21972         Супермаркеты
21973             Фаст Фуд
21974         Супермаркеты
21975         Супермаркеты
2

252it [00:02, 84.86it/s]

23700         Супермаркеты
23701                <UNK>
23702             Фаст Фуд
23703         Супермаркеты
23704             Фаст Фуд
23705         Супермаркеты
23706            Транспорт
23707         Супермаркеты
23708                <UNK>
23709         Супермаркеты
23710         Супермаркеты
23711         Супермаркеты
23712              Топливо
23713         Супермаркеты
23714         Супермаркеты
23715     Сервисные услуги
23716         Супермаркеты
23717                <UNK>
23718                  НКО
23719         Супермаркеты
23720         Супермаркеты
23721         Супермаркеты
23722    Финансовые услуги
23723         Супермаркеты
23724                <UNK>
23725             Фаст Фуд
23726            Транспорт
23727                <UNK>
23728               Музыка
23729             Фаст Фуд
               ...        
23770                <UNK>
23771         Супермаркеты
23772        Разные товары
23773          Развлечения
23774        Связь/Телеком
23775                <UNK>
2

270it [00:03, 86.24it/s]

25600                <UNK>
25601            Транспорт
25602             Фаст Фуд
25603             Фаст Фуд
25604        Разные товары
25605         Супермаркеты
25606         Супермаркеты
25607                <UNK>
25608                Отели
25609         Супермаркеты
25610           Авиабилеты
25611            Транспорт
25612    Финансовые услуги
25613         Супермаркеты
25614         Супермаркеты
25615     Сервисные услуги
25616    Финансовые услуги
25617     Сервисные услуги
25618                <UNK>
25619                <UNK>
25620          Развлечения
25621     Сервисные услуги
25622    Финансовые услуги
25623                <UNK>
25624              Топливо
25625             Фаст Фуд
25626         Супермаркеты
25627         Супермаркеты
25628         Супермаркеты
25629        Разные товары
               ...        
25670                <UNK>
25671         Супермаркеты
25672              Топливо
25673                <UNK>
25674             Фаст Фуд
25675         Одежда/Обувь
2

288it [00:03, 86.85it/s]

27500             Фаст Фуд
27501         Супермаркеты
27502        Разные товары
27503                <UNK>
27504         Супермаркеты
27505         Супермаркеты
27506                <UNK>
27507             Фаст Фуд
27508             Наличные
27509         Супермаркеты
27510             Фаст Фуд
27511    Финансовые услуги
27512             Фаст Фуд
27513                <UNK>
27514         Супермаркеты
27515         Супермаркеты
27516                <UNK>
27517             Фаст Фуд
27518         Супермаркеты
27519         Супермаркеты
27520         Супермаркеты
27521         Супермаркеты
27522           Дом/Ремонт
27523         Супермаркеты
27524         Супермаркеты
27525             Наличные
27526         Супермаркеты
27527              Топливо
27528             Наличные
27529          Развлечения
               ...        
27570         Супермаркеты
27571         Супермаркеты
27572         Супермаркеты
27573                <UNK>
27574             Фаст Фуд
27575                <UNK>
2

306it [00:03, 87.03it/s]

29300              Топливо
29301        Разные товары
29302        Разные товары
29303                <UNK>
29304              Топливо
29305         Супермаркеты
29306         Одежда/Обувь
29307            Транспорт
29308            Рестораны
29309         Супермаркеты
29310            Рестораны
29311         Супермаркеты
29312        Разные товары
29313              Топливо
29314         Супермаркеты
29315         Супермаркеты
29316            Транспорт
29317         Супермаркеты
29318         Супермаркеты
29319            Транспорт
29320         Супермаркеты
29321         Супермаркеты
29322    Финансовые услуги
29323         Супермаркеты
29324         Супермаркеты
29325           Дом/Ремонт
29326         Супермаркеты
29327         Супермаркеты
29328            Транспорт
29329         Супермаркеты
               ...        
29370         Супермаркеты
29371                <UNK>
29372                <UNK>
29373             Фаст Фуд
29374        Связь/Телеком
29375         Супермаркеты
2

324it [00:03, 87.14it/s]

31200              Топливо
31201        Разные товары
31202                <UNK>
31203         Супермаркеты
31204         Супермаркеты
31205         Супермаркеты
31206                <UNK>
31207                <UNK>
31208             Фаст Фуд
31209                <UNK>
31210         Одежда/Обувь
31211         Супермаркеты
31212         Супермаркеты
31213              Топливо
31214           Автоуслуги
31215         Супермаркеты
31216        Разные товары
31217                <UNK>
31218           Дом/Ремонт
31219            Транспорт
31220         Супермаркеты
31221        Разные товары
31222            Транспорт
31223             Наличные
31224         Супермаркеты
31225        Разные товары
31226           Дом/Ремонт
31227            Транспорт
31228         Супермаркеты
31229                <UNK>
               ...        
31270         Супермаркеты
31271         Одежда/Обувь
31272              Топливо
31273         Супермаркеты
31274         Одежда/Обувь
31275    Финансовые услуги
3

342it [00:03, 87.36it/s]

33000                <UNK>
33001         Супермаркеты
33002         Супермаркеты
33003         Супермаркеты
33004            Транспорт
33005           Автоуслуги
33006         Супермаркеты
33007         Супермаркеты
33008         Супермаркеты
33009         Одежда/Обувь
33010                <UNK>
33011            Рестораны
33012         Супермаркеты
33013         Супермаркеты
33014         Супермаркеты
33015         Супермаркеты
33016              Топливо
33017         Супермаркеты
33018         Супермаркеты
33019          Развлечения
33020         Супермаркеты
33021         Супермаркеты
33022         Супермаркеты
33023         Супермаркеты
33024                <UNK>
33025         Супермаркеты
33026            Транспорт
33027            Транспорт
33028    Финансовые услуги
33029         Супермаркеты
               ...        
33070              Топливо
33071         Супермаркеты
33072         Супермаркеты
33073         Супермаркеты
33074                <UNK>
33075            Транспорт
3

360it [00:04, 87.48it/s]

34900         Супермаркеты
34901              Красота
34902         Супермаркеты
34903        Связь/Телеком
34904                <UNK>
34905         Супермаркеты
34906            Транспорт
34907            Транспорт
34908    Финансовые услуги
34909            Транспорт
34910                 Кино
34911         Супермаркеты
34912             Фаст Фуд
34913            Транспорт
34914         Супермаркеты
34915            Транспорт
34916         Супермаркеты
34917    Финансовые услуги
34918         Супермаркеты
34919        Разные товары
34920             Фаст Фуд
34921         Одежда/Обувь
34922              Топливо
34923                <UNK>
34924         Супермаркеты
34925         Супермаркеты
34926         Супермаркеты
34927        Связь/Телеком
34928         Супермаркеты
34929              Красота
               ...        
34970             Фаст Фуд
34971            Транспорт
34972                <UNK>
34973        Разные товары
34974                <UNK>
34975              Топливо
3

378it [00:04, 87.35it/s]

36800          Спорттовары
36801         Супермаркеты
36802            Транспорт
36803         Супермаркеты
36804         Супермаркеты
36805    Финансовые услуги
36806             Наличные
36807           Дом/Ремонт
36808         Супермаркеты
36809         Супермаркеты
36810            Транспорт
36811         Одежда/Обувь
36812            Рестораны
36813              Топливо
36814                <UNK>
36815    Финансовые услуги
36816         Супермаркеты
36817                <UNK>
36818         Супермаркеты
36819           Дом/Ремонт
36820                <UNK>
36821         Супермаркеты
36822         Супермаркеты
36823    Финансовые услуги
36824                <UNK>
36825         Супермаркеты
36826            Транспорт
36827         Супермаркеты
36828        Разные товары
36829             Фаст Фуд
               ...        
36870                <UNK>
36871         Супермаркеты
36872        Разные товары
36873         Супермаркеты
36874           Автоуслуги
36875         Супермаркеты
3

405it [00:04, 87.36it/s]

38700         Супермаркеты
38701          Развлечения
38702        Разные товары
38703                <UNK>
38704              Топливо
38705            Рестораны
38706              Красота
38707         Супермаркеты
38708             Наличные
38709         Супермаркеты
38710    Финансовые услуги
38711         Супермаркеты
38712         Супермаркеты
38713                 Кино
38714           Дом/Ремонт
38715         Супермаркеты
38716            Транспорт
38717             Наличные
38718         Супермаркеты
38719            Транспорт
38720                <UNK>
38721             Фаст Фуд
38722         Супермаркеты
38723         Супермаркеты
38724               Аптеки
38725           Дом/Ремонт
38726                <UNK>
38727         Супермаркеты
38728             Наличные
38729         Супермаркеты
               ...        
38770         Супермаркеты
38771          Развлечения
38772         Супермаркеты
38773                <UNK>
38774             Наличные
38775            Рестораны
3

423it [00:04, 87.19it/s]

40500         Супермаркеты
40501                Книги
40502          Развлечения
40503            Рестораны
40504         Супермаркеты
40505              Красота
40506    Финансовые услуги
40507             Фаст Фуд
40508         Супермаркеты
40509         Супермаркеты
40510         Супермаркеты
40511            Транспорт
40512                <UNK>
40513         Супермаркеты
40514                <UNK>
40515            Рестораны
40516        Разные товары
40517        Разные товары
40518         Супермаркеты
40519         Супермаркеты
40520         Супермаркеты
40521            Рестораны
40522         Супермаркеты
40523               Аптеки
40524        Связь/Телеком
40525         Супермаркеты
40526            Транспорт
40527         Супермаркеты
40528            Рестораны
40529    Финансовые услуги
               ...        
40570         Супермаркеты
40571         Одежда/Обувь
40572         Одежда/Обувь
40573         Супермаркеты
40574              Топливо
40575                <UNK>
4

441it [00:05, 87.17it/s]

42400                 <UNK>
42401          Супермаркеты
42402          Супермаркеты
42403     Финансовые услуги
42404            Дом/Ремонт
42405                 <UNK>
42406          Одежда/Обувь
42407                 <UNK>
42408                 <UNK>
42409                 <UNK>
42410          Супермаркеты
42411          Одежда/Обувь
42412             Рестораны
42413          Супермаркеты
42414                 <UNK>
42415          Супермаркеты
42416                 <UNK>
42417                 <UNK>
42418     Финансовые услуги
42419              Фаст Фуд
42420             Рестораны
42421              Наличные
42422                  Кино
42423          Супермаркеты
42424             Рестораны
42425    Медицинские услуги
42426             Транспорт
42427                Аптеки
42428                  Кино
42429              Фаст Фуд
                ...        
42470                Аптеки
42471          Супермаркеты
42472          Супермаркеты
42473      Сервисные услуги
42474              Ф

459it [00:05, 87.23it/s]

44200         Супермаркеты
44201         Супермаркеты
44202              Топливо
44203              Топливо
44204                <UNK>
44205         Супермаркеты
44206               Аптеки
44207         Супермаркеты
44208             Фаст Фуд
44209              Топливо
44210              Топливо
44211               Аптеки
44212             Сувениры
44213         Супермаркеты
44214         Супермаркеты
44215    Финансовые услуги
44216             Фаст Фуд
44217         Супермаркеты
44218              Топливо
44219         Одежда/Обувь
44220         Супермаркеты
44221             Фаст Фуд
44222         Супермаркеты
44223         Супермаркеты
44224                <UNK>
44225     Сервисные услуги
44226         Супермаркеты
44227         Супермаркеты
44228         Супермаркеты
44229             Фаст Фуд
               ...        
44270                <UNK>
44271         Супермаркеты
44272        Разные товары
44273             Фаст Фуд
44274             Наличные
44275        Разные товары
4

477it [00:05, 87.27it/s]

46100         Супермаркеты
46101           Дом/Ремонт
46102         Супермаркеты
46103         Супермаркеты
46104         Супермаркеты
46105    Финансовые услуги
46106         Супермаркеты
46107              Красота
46108    Финансовые услуги
46109         Супермаркеты
46110              Красота
46111            Рестораны
46112         Супермаркеты
46113           Дом/Ремонт
46114             Наличные
46115         Супермаркеты
46116          Развлечения
46117         Супермаркеты
46118          Развлечения
46119         Супермаркеты
46120        Связь/Телеком
46121        Разные товары
46122              Красота
46123                <UNK>
46124    Финансовые услуги
46125                <UNK>
46126                <UNK>
46127              Топливо
46128            Рестораны
46129        Разные товары
               ...        
46170        Разные товары
46171        Разные товары
46172            Транспорт
46173         Супермаркеты
46174        Разные товары
46175         Супермаркеты
4

495it [00:05, 87.29it/s]

47900            Ж/д билеты
47901             Рестораны
47902          Одежда/Обувь
47903                Аптеки
47904           Развлечения
47905                 <UNK>
47906          Супермаркеты
47907          Супермаркеты
47908          Супермаркеты
47909                 <UNK>
47910               Топливо
47911          Супермаркеты
47912          Супермаркеты
47913          Супермаркеты
47914         Разные товары
47915          Супермаркеты
47916         Разные товары
47917          Супермаркеты
47918          Супермаркеты
47919     Финансовые услуги
47920          Супермаркеты
47921         Связь/Телеком
47922              Фаст Фуд
47923          Супермаркеты
47924          Супермаркеты
47925                Аптеки
47926          Супермаркеты
47927          Супермаркеты
47928           Развлечения
47929                 <UNK>
                ...        
47970              Фаст Фуд
47971          Супермаркеты
47972          Супермаркеты
47973             Транспорт
47974          Супер

513it [00:05, 86.05it/s]

49800             Фаст Фуд
49801         Супермаркеты
49802           Дом/Ремонт
49803            Транспорт
49804         Супермаркеты
49805                  НКО
49806    Финансовые услуги
49807         Супермаркеты
49808         Супермаркеты
49809             Фаст Фуд
49810           Авиабилеты
49811         Одежда/Обувь
49812     Сервисные услуги
49813         Супермаркеты
49814         Супермаркеты
49815         Супермаркеты
49816             Фаст Фуд
49817           Дом/Ремонт
49818             Фаст Фуд
49819    Финансовые услуги
49820         Супермаркеты
49821         Супермаркеты
49822         Супермаркеты
49823         Супермаркеты
49824         Супермаркеты
49825            Транспорт
49826          Развлечения
49827                <UNK>
49828         Супермаркеты
49829        Разные товары
               ...        
49870         Супермаркеты
49871             Наличные
49872                <UNK>
49873                <UNK>
49874                <UNK>
49875    Финансовые услуги
4

531it [00:06, 84.67it/s]

51600          Супермаркеты
51601          Супермаркеты
51602             Рестораны
51603          Супермаркеты
51604              Наличные
51605          Супермаркеты
51606                 <UNK>
51607          Супермаркеты
51608             Транспорт
51609            Дом/Ремонт
51610              Наличные
51611         Разные товары
51612             Рестораны
51613          Супермаркеты
51614     Финансовые услуги
51615          Супермаркеты
51616          Супермаркеты
51617          Супермаркеты
51618             Транспорт
51619               Топливо
51620             Транспорт
51621             Рестораны
51622          Супермаркеты
51623                 <UNK>
51624                  Кино
51625             Рестораны
51626          Супермаркеты
51627          Супермаркеты
51628                 <UNK>
51629             Транспорт
                ...        
51670     Финансовые услуги
51671                 <UNK>
51672             Рестораны
51673              Сувениры
51674          Одежд

549it [00:06, 83.87it/s]

53400              Фаст Фуд
53401            Дом/Ремонт
53402                 <UNK>
53403              Животные
53404               Красота
53405          Супермаркеты
53406               Топливо
53407     Финансовые услуги
53408            Дом/Ремонт
53409         Связь/Телеком
53410    Медицинские услуги
53411             Транспорт
53412               Топливо
53413             Рестораны
53414          Супермаркеты
53415             Рестораны
53416          Супермаркеты
53417             Рестораны
53418              Фаст Фуд
53419          Супермаркеты
53420          Супермаркеты
53421                  Кино
53422            Дом/Ремонт
53423          Супермаркеты
53424            Дом/Ремонт
53425          Супермаркеты
53426          Супермаркеты
53427          Супермаркеты
53428          Одежда/Обувь
53429             Транспорт
                ...        
53470     Финансовые услуги
53471             Рестораны
53472          Супермаркеты
53473              Наличные
53474          Супер

567it [00:06, 83.51it/s]

55200         Супермаркеты
55201        Разные товары
55202    Финансовые услуги
55203            Рестораны
55204             Фаст Фуд
55205         Одежда/Обувь
55206         Супермаркеты
55207         Супермаркеты
55208            Duty Free
55209    Финансовые услуги
55210         Супермаркеты
55211    Финансовые услуги
55212        Разные товары
55213                <UNK>
55214         Турагентства
55215           Дом/Ремонт
55216         Супермаркеты
55217                <UNK>
55218           Автоуслуги
55219         Супермаркеты
55220         Супермаркеты
55221                <UNK>
55222         Супермаркеты
55223    Финансовые услуги
55224              Топливо
55225               Аптеки
55226                Книги
55227    Финансовые услуги
55228          Спорттовары
55229                <UNK>
               ...        
55270    Финансовые услуги
55271         Супермаркеты
55272         Супермаркеты
55273            Транспорт
55274         Супермаркеты
55275         Супермаркеты
5

585it [00:06, 85.11it/s]

57000         Супермаркеты
57001         Супермаркеты
57002        Связь/Телеком
57003         Супермаркеты
57004                <UNK>
57005                <UNK>
57006                <UNK>
57007         Супермаркеты
57008         Супермаркеты
57009         Супермаркеты
57010         Супермаркеты
57011         Супермаркеты
57012         Супермаркеты
57013         Супермаркеты
57014         Супермаркеты
57015                <UNK>
57016         Супермаркеты
57017         Супермаркеты
57018            Рестораны
57019         Супермаркеты
57020         Супермаркеты
57021         Супермаркеты
57022              Топливо
57023         Супермаркеты
57024         Супермаркеты
57025             Наличные
57026        Связь/Телеком
57027           Автоуслуги
57028         Супермаркеты
57029         Супермаркеты
               ...        
57070                <UNK>
57071    Финансовые услуги
57072                <UNK>
57073    Финансовые услуги
57074                <UNK>
57075    Финансовые услуги
5

603it [00:07, 86.30it/s]

58900     Финансовые услуги
58901            Автоуслуги
58902              Фаст Фуд
58903          Супермаркеты
58904          Одежда/Обувь
58905    Медицинские услуги
58906     Финансовые услуги
58907          Супермаркеты
58908          Супермаркеты
58909     Финансовые услуги
58910          Супермаркеты
58911         Разные товары
58912    Медицинские услуги
58913            Авиабилеты
58914              Животные
58915          Супермаркеты
58916     Финансовые услуги
58917     Финансовые услуги
58918          Супермаркеты
58919           Образование
58920              Наличные
58921             Рестораны
58922             Рестораны
58923          Супермаркеты
58924              Фаст Фуд
58925                 <UNK>
58926     Финансовые услуги
58927            Дом/Ремонт
58928                 <UNK>
58929             Транспорт
                ...        
58970          Супермаркеты
58971               Топливо
58972          Супермаркеты
58973          Супермаркеты
58974             Тр

621it [00:07, 86.84it/s]

60800              Топливо
60801         Супермаркеты
60802         Супермаркеты
60803        Разные товары
60804    Финансовые услуги
60805        Разные товары
60806               Музыка
60807         Супермаркеты
60808                <UNK>
60809           Дом/Ремонт
60810                Цветы
60811           Дом/Ремонт
60812         Супермаркеты
60813         Супермаркеты
60814        Разные товары
60815                <UNK>
60816         Супермаркеты
60817                <UNK>
60818         Супермаркеты
60819         Супермаркеты
60820         Супермаркеты
60821         Супермаркеты
60822        Разные товары
60823         Супермаркеты
60824         Супермаркеты
60825         Супермаркеты
60826                <UNK>
60827          Спорттовары
60828        Разные товары
60829         Супермаркеты
               ...        
60870         Супермаркеты
60871                <UNK>
60872            Транспорт
60873         Супермаркеты
60874            Искусство
60875         Супермаркеты
6

639it [00:07, 87.21it/s]

62700            Рестораны
62701             Наличные
62702         Супермаркеты
62703         Супермаркеты
62704        Разные товары
62705         Супермаркеты
62706            Рестораны
62707            Рестораны
62708         Супермаркеты
62709              Топливо
62710            Транспорт
62711                <UNK>
62712    Финансовые услуги
62713           Автоуслуги
62714                <UNK>
62715         Супермаркеты
62716                <UNK>
62717            Транспорт
62718                <UNK>
62719         Супермаркеты
62720         Супермаркеты
62721         Супермаркеты
62722         Супермаркеты
62723         Супермаркеты
62724                <UNK>
62725                <UNK>
62726                <UNK>
62727         Супермаркеты
62728         Супермаркеты
62729            Рестораны
               ...        
62770                 Кино
62771    Финансовые услуги
62772                <UNK>
62773         Супермаркеты
62774                <UNK>
62775         Супермаркеты
6

657it [00:07, 85.21it/s]

64600             Фаст Фуд
64601    Финансовые услуги
64602        Разные товары
64603             Наличные
64604    Финансовые услуги
64605                <UNK>
64606     Сервисные услуги
64607                  НКО
64608              Топливо
64609           Дом/Ремонт
64610                <UNK>
64611         Одежда/Обувь
64612         Супермаркеты
64613        Разные товары
64614         Супермаркеты
64615         Супермаркеты
64616         Супермаркеты
64617             Фаст Фуд
64618         Супермаркеты
64619         Супермаркеты
64620          Развлечения
64621             Сувениры
64622                <UNK>
64623         Супермаркеты
64624         Супермаркеты
64625                Цветы
64626           Дом/Ремонт
64627               Аптеки
64628         Супермаркеты
64629         Супермаркеты
               ...        
64670         Супермаркеты
64671            Рестораны
64672    Финансовые услуги
64673            Транспорт
64674               Аптеки
64675     Сервисные услуги
6

675it [00:07, 86.12it/s]

66400           Авиабилеты
66401               Аптеки
66402    Финансовые услуги
66403         Супермаркеты
66404           Ж/д билеты
66405                <UNK>
66406        Разные товары
66407                <UNK>
66408              Топливо
66409         Супермаркеты
66410    Финансовые услуги
66411           Дом/Ремонт
66412              Топливо
66413         Супермаркеты
66414         Супермаркеты
66415        Разные товары
66416         Супермаркеты
66417           Дом/Ремонт
66418         Супермаркеты
66419                <UNK>
66420                 Кино
66421                <UNK>
66422    Финансовые услуги
66423             Наличные
66424        Разные товары
66425        Разные товары
66426    Финансовые услуги
66427             Наличные
66428        Разные товары
66429             Наличные
               ...        
66470            Транспорт
66471               Аптеки
66472              Топливо
66473         Супермаркеты
66474         Супермаркеты
66475           Дом/Ремонт
6

693it [00:08, 86.51it/s]

68200         Супермаркеты
68201    Финансовые услуги
68202         Супермаркеты
68203              Красота
68204             Фаст Фуд
68205            Транспорт
68206              Красота
68207                <UNK>
68208         Супермаркеты
68209         Супермаркеты
68210            Транспорт
68211             Фаст Фуд
68212         Супермаркеты
68213             Фаст Фуд
68214        Разные товары
68215         Супермаркеты
68216                <UNK>
68217         Одежда/Обувь
68218         Супермаркеты
68219        Разные товары
68220                <UNK>
68221         Супермаркеты
68222         Супермаркеты
68223         Супермаркеты
68224              Топливо
68225         Супермаркеты
68226         Супермаркеты
68227                <UNK>
68228                <UNK>
68229           Авиабилеты
               ...        
68270         Супермаркеты
68271         Супермаркеты
68272         Супермаркеты
68273         Супермаркеты
68274                <UNK>
68275             Наличные
6

711it [00:08, 86.15it/s]

70100            Транспорт
70101         Супермаркеты
70102             Наличные
70103           Автоуслуги
70104        Разные товары
70105        Разные товары
70106               Аптеки
70107         Супермаркеты
70108        Разные товары
70109         Одежда/Обувь
70110                  НКО
70111                <UNK>
70112         Супермаркеты
70113         Супермаркеты
70114              Красота
70115               Аптеки
70116         Супермаркеты
70117              Топливо
70118         Супермаркеты
70119         Супермаркеты
70120                <UNK>
70121        Разные товары
70122         Супермаркеты
70123         Супермаркеты
70124         Супермаркеты
70125            Рестораны
70126        Разные товары
70127         Супермаркеты
70128                <UNK>
70129             Фаст Фуд
               ...        
70170    Финансовые услуги
70171                <UNK>
70172                <UNK>
70173         Супермаркеты
70174                <UNK>
70175                <UNK>
7

721it [00:08, 85.94it/s]

71900           Транспорт
71901        Супермаркеты
71902        Супермаркеты
71903          Дом/Ремонт
71904           Рестораны
71905          Дом/Ремонт
71906        Супермаркеты
71907               <UNK>
71908           Транспорт
71909        Супермаркеты
71910          Автоуслуги
71911           Транспорт
71912             Топливо
71913        Супермаркеты
71914        Одежда/Обувь
71915           Транспорт
71916        Супермаркеты
71917             Топливо
71918        Супермаркеты
71919        Супермаркеты
71920        Одежда/Обувь
71921       Разные товары
71922       Связь/Телеком
71923        Супермаркеты
71924    Сервисные услуги
71925        Супермаркеты
71926           Транспорт
71927        Супермаркеты
71928        Супермаркеты
71929        Супермаркеты
               ...       
71970           Транспорт
71971        Супермаркеты
71972    Сервисные услуги
71973           Рестораны
71974        Супермаркеты
71975           Транспорт
71976            Фаст Фуд
71977       




KeyboardInterrupt: 

In [9]:
# Prepare & save client data
party2dates = defaultdict(list)  # for each party save a series of the transaction dates 
party2sum = defaultdict(list)  # for each party save a series of the transaction costs 
party2merchant_type = defaultdict(list)  # for each party save a series of the transaction_type 
party2trans_type = defaultdict(list)  # for each party save a series of the transaction merchant_type

usecols = [
    "party_rk",
    "transaction_dttm",
    "transaction_amt_rur",
    "merchant_type",
    "transaction_type_desc",
]

for chunk in tqdm(
    pd.read_csv(transactions_path, usecols=usecols, chunksize=100_000)
):

    chunk["merchant_type"] = (
        chunk["merchant_type"].fillna(unk_token).astype(str)
    )
    chunk["transaction_type_desc"] = (
        chunk["transaction_type_desc"].fillna(unk_token).astype(str)
    )
    chunk["transaction_amt_rur"] = chunk["transaction_amt_rur"].fillna(0)

    for i, row in chunk.iterrows():
        party2dates[row.party_rk].append(row.transaction_dttm)
        party2sum[row.party_rk].append(row.transaction_amt_rur)
        party2merchant_type[row.party_rk].append(
            mappings["merchant_type"][row.merchant_type]
        )
        party2trans_type[row.party_rk].append(
            mappings["transaction_type_desc"][row.transaction_type_desc]
        )

    del chunk

pickle.dump(party2dates, open(f"{DATADIR}/party2dates.pkl", "wb"))
pickle.dump(party2sum, open(f"{DATADIR}/party2sum.pkl", "wb"))
pickle.dump(party2merchant_type, open(f"{DATADIR}/party2merchant_type.pkl", "wb"))
pickle.dump(party2trans_type, open(f"{DATADIR}/party2trans_type.pkl", "wb"))

0it [00:03, ?it/s]


KeyboardInterrupt: 

In [13]:
# load client data
party2dates = pickle.load(open(f"{DATADIR}/party2dates.pkl", 'rb'))
party2sum = pickle.load(open(f"{DATADIR}/party2sum.pkl", 'rb'))
party2merchant_type = pickle.load(open(f"{DATADIR}/party2merchant_type.pkl", 'rb'))
party2trans_type = pickle.load(open(f"{DATADIR}/party2trans_type.pkl", 'rb'))
party2cat = pickle.load(open(f"{DATADIR}/party2cat.pkl", 'rb'))

In [30]:
categories_types = mappings["category"]
categories_types

{'<UNK>': 7,
 'Сувениры': 1,
 'Фаст Фуд': 2,
 'Супермаркеты': 3,
 'Дом/Ремонт': 4,
 'Сервисные услуги': 5,
 'Красота': 6,
 'Разные товары': 7,
 'Транспорт': 8,
 'Медицинские услуги': 9,
 'Топливо': 10,
 'Одежда/Обувь': 11,
 'Наличные': 12,
 'Связь/Телеком': 13,
 'Частные услуги': 14,
 'Финансовые услуги': 15,
 'Рестораны': 16,
 'Развлечения': 17,
 'НКО': 18,
 'Книги': 19,
 'Кино': 20,
 'Автоуслуги': 21,
 'Музыка': 22,
 'Отели': 23,
 'Аптеки': 24,
 'Цветы': 25,
 'Ж/д билеты': 26,
 'Авиабилеты': 27,
 'Спорттовары': 28,
 'Госсборы': 29,
 'Аренда авто': 30,
 'Животные': 31,
 'Duty Free': 32,
 'Турагентства': 33,
 'Образование': 34,
 'Искусство': 35,
 'Фото/Видео': 36}

# Decision process

### Idea

As we had predictions of transactions, which can be performed by a particular person. So we decided to predict income/outcome of a person in that months in order to make recommendation. Based on that information we can suggest to him/her to participate in different kinds of challenges and quests.

### Investement suggestions
either to make an investement and buy shares, create an "automatic savings plan" or to make a personal plan of spending money, make a suggestion of how to spend less.

### Entertainment suggestions
Get quests and challenges for your favourite time spending. Cinemas, concerts and restaurants. 

In [6]:
mappings_cat = defaultdict(dict)
unk_token = "<UNK>"

for name in mappings['merchant_type'].keys():
    if name == unk_token:
        continue
    else:
        mappings_cat[mappings['merchant_type'][name]] = list()

col_values = (
        pd.read_csv(transactions_path, usecols=["merchant_type", 'category'])
        .fillna(unk_token)
        .astype(str)
    )

for i, row in tqdm(
    col_values.iterrows()
    ):
    
    if mappings["category"][row.category] not in mappings_cat[mappings['merchant_type'][row.merchant_type]]:
        mappings_cat[mappings['merchant_type'][row.merchant_type]].append(mappings["category"][row.category])
        
with open(f"{DATADIR}/mappings_cat_merchant_type.json", "w") as f:
    json.dump(mappings_cat, f)

11987617it [15:59, 12488.79it/s]


In [45]:
# load mappings
unk_token = "<UNK>"
with open(f"{DATADIR}/mappings_cat_merchant_type.json", 'r') as f:
     mappings_cat = json.load(f)

In [46]:
# if person is interested in money increasing/saving strategies
money_recommendations_pack = {
    'Capital saving strategy': {
        'Expenses decrease suggestion.': ' https://journal.tinkoff.ru/selected/budget/  ',
        'Card limits setting.': '  https://help.tinkoff.ru/drive-dc/limit-add-card/add-card-set-limits/  ',
    },
    'Safe capital increase strategies': {
        'Deposits suggestion.': '  https://www.tinkoff.ru/deposit/  ',
        'Charity suggestion.': {
            'Moscow': '  https://www.tinkoff.ru/payments/categories/blagotvoritelnost/  ',
            'All': '  https://www.tinkoff.ru/about/news/04082020-tinkoff-launched-charity-service/  ',
        },
        'Automatic savings.': '  https://www.tinkoff.ru/eng/media/news/08062020-investments-box-eng/  ',
    },
    'Capital increase strategies': {
        'Investement suggestion.': '  https://www.tinkoff.ru/invest/ ',
        'Charity suggestion.': {
            'Moscow': '  https://www.tinkoff.ru/payments/categories/blagotvoritelnost/ ',
            'All': '  https://www.tinkoff.ru/about/news/04082020-tinkoff-launched-charity-service/ ',
        },
    },
}

# if person is inetrested in entertainment
entertainment_recommendation_pack = {
    'Cinemas': {
        'Moscow': 'Visit three cinemas in Moscow. Get cashback for buying tickets at Tinkoff. https://www.tinkoff.ru/entertainment/moskva/movies/  ',
        "All": 'Visit three the oldest cinemas. Get cashback for buying tickets at Tinkoff.  https://help.tinkoff.ru/junior/earn/cashback-for-movie/ ',
    },
    'Restaurants': 'Visit three the most interesting Georgian restaurants.  https://www.tinkoff.ru/entertainment/:city/restaurants/ ',
    'Music': 'Visit three coolest rock-concerts in three months.  https://www.tinkoff.ru/entertainment/concerts/ ',
}

In [53]:
date_months = '2019-06'
user_num = 33943

def get_data_party(user_num, date_months):
    data_party = dict()
    
    data_user = data[data['party_rk'] == user_num]
    months = [item[:-3] for item in data_user['transaction_dttm']]
    data_user['month'] = months
    data_user = data_user[data_user['month'] == date_months]['merchant_type'].dropna()

    data_user_balance = data_balance[data_balance['party_rk'] == user_num]
    months = [item[:-3] for item in data_user_balance['cur_month']]
    data_user_balance['month'] = months
    data_user_balance = sum(data_user_balance[data_user_balance['month'] == date_months]['balance_chng'])

    city = data_soc[data_soc['party_rk'] == user_num]['region_flg']
    
    data_party["merchant_type"] = list(data_user)
    data_party["balance"] = data_user_balance
    data_party["city"] = np.int(city)
    
    return data_party

def get_key(d, value):
    for k, v in d.items():
        if v == value:
            return k
        

data_party = get_data_party(user_num, date_months)

In [58]:
def give_advise_category_based(cat, balance, city):
    
    # financial advises
    if balance < 0:
        strategy = 'Capital saving strategy'
        if cat in ['Развлечения', 'Рестораны']:
            return money_recommendations_pack[strategy]['Card limits setting.']
        else:
            return money_recommendations_pack[strategy]['Expenses decrease suggestion.']
    else:
        if balance >= 10000:
            strategy = 'Safe capital increase strategies'
            
            if city == 0: 
                city_name = 'Moscow'
                link = money_recommendations_pack[strategy]['Charity suggestion.'][city_name]
            else:
                city_name = 'All'
                link = money_recommendations_pack[strategy]['Charity suggestion.'][city_name]
                
            if cat in ['Развлечения', 'Кино']:
                link += '  '
                link += entertainment_recommendation_pack['Cinemas'][city_name]
        else:
            strategy = 'Capital increase strategies'
            return money_recommendations_pack[strategy]['Investement suggestion.']
        
    return link

In [54]:
def recommend_quest_for_user(data_party):
    
    categories_transac = np.zeros(len(mappings['category']))

    for name in data_party['merchant_type']:
        # get categories of transactions
        categories_transac[mappings_cat[str(mappings['merchant_type'][str(name)])][0]] += 1

    max_ind_category_1 = categories_transac.argmax()
    priority_cat_1 = get_key(mappings["category"], max_ind_category_1)
    categories_transac[max_ind_category_1] = 0

    max_ind_category_2 = categories_transac.argmax()
    priority_cat_2 = get_key(mappings["category"], max_ind_category_2)
    categories_transac[max_ind_category_2] = 0

    max_ind_category_3 = categories_transac.argmax()
    priority_cat_3 = get_key(mappings["category"], max_ind_category_3)
    categories_transac[max_ind_category_3] = 0

    max_ind_category_4 = categories_transac.argmax()
    priority_cat_4 = get_key(mappings["category"], max_ind_category_4)
    categories_transac[max_ind_category_3] = 0

    priorities = [priority_cat_1, priority_cat_2, priority_cat_3, priority_cat_4]
    
    
    return advises

In [60]:
def get_advise(data_party):
    categories_transac = np.zeros(len(mappings['category']))

    for name in data_party['merchant_type']:
        # get categories of transactions
        categories_transac[mappings_cat[str(mappings['merchant_type'][str(name)])][0]] += 1

    max_ind_category_1 = categories_transac.argmax()
    priority_cat_1 = get_key(mappings["category"], max_ind_category_1)
    categories_transac[max_ind_category_1] = 0

    max_ind_category_2 = categories_transac.argmax()
    priority_cat_2 = get_key(mappings["category"], max_ind_category_2)
    categories_transac[max_ind_category_2] = 0

    max_ind_category_3 = categories_transac.argmax()
    priority_cat_3 = get_key(mappings["category"], max_ind_category_3)
    categories_transac[max_ind_category_3] = 0

    max_ind_category_4 = categories_transac.argmax()
    priority_cat_4 = get_key(mappings["category"], max_ind_category_4)
    categories_transac[max_ind_category_3] = 0

    priorities = [priority_cat_1, priority_cat_2, priority_cat_3, priority_cat_4]

    advise_1 = give_advise_category_based(priority_cat_1, data_party['balance'], data_party['city'])
    return advise_1

In [62]:
# The model can give an advise what can person do with their financies in the next month or can plan activities
get_advise(data_party)

'  https://www.tinkoff.ru/payments/categories/blagotvoritelnost/  '