### С помощью кода данные о цене и валюте оплачиваемых конверсий подтягиваются из одной таблицы в другую - таблицу для создания ежедневного отчета
Изначально таблицы не имеют уникального ключа для объединения данных

In [1]:
import pandas as pd
from datetime import date
from datetime import datetime
import numpy as np
import requests

### Чтение и предобработка

In [5]:
# создание переменной "дата", которая используется в названии файлов
date = (datetime.now()-pd.Timedelta(1, "d")).date()

In [6]:
# чтение загруженных в папку файлов
offers = pd.read_csv(f'ReportOffer_{date}_{date}.csv', sep=';')
offer_target = pd.read_csv(f'ReportOfferTarget_{date}_{date}.csv', sep=';')

In [7]:
# просмотр количества строк для сверки с конечным документом
strings = offers.shape[0]
print(f'В документе {strings} строк')

В документе 1328 строк


In [8]:
# создание новых названий столбцов для удобства работы и синхронизации таблиц
offers = offers.rename(columns={
    'Дата':'date', 
    'Offer Account Manager Team Name':'account_manager', 
    'Байер':'buyer', 
    'Оффер':'offer',
    'Тип трекера':'tracker_type', 
    'Offer External Id':'offer_external_id', 
    'Приложение':'app', 
    'Группа офферов':'offer group',
    'Страна':'geo', 
    'Платформа':'platform', 
    'Источник трафика':'media_source', 
    'Команда':'team', 
    'Ячейки':'subteam',
    'Выплаты':'income', 
    'Затраты':'spend', 
    'Маржа':'margin', 
    'Комиссия':'commission', 
    '% за шлюз':'gateway_fee', 
    'ROI':'ROI',
    'Депозит':'deposit', 
    'Конверсия':'conversion', 
    'Подтв. конверсия':'confirmed_conversion', 
    'Rebill':'rebill',
    "Number of subid's with quality":'subids_with_quality_number', 
    'Средний депозит':'mean_deposit',
    'Общая сумма депозитов':'total_deposits', 
    'Cabinet Name':'cabinet_name', 
    'Является кабинет белым':'is_cabinet_white',
    'Sub Id10':'sub_id10', 
    'Sub Id':'sub_id'
})

offer_target = offer_target.rename(columns={
    'Дата':'date', 
    'Байер':'buyer', 
    'Оффер':'offer',
    'Статус оффера':'offer_status',
    'Тип трекера':'tracker_type', 
    'Offer External Id':'offer_external_id', 
    'Ответственный менеджер':'account_manager',
    'Ср. цена депозита':'mean_deposit_cost',
    'Страна':'geo', 
    'Платформа':'platform', 
    'Источник трафика':'media_source', 
    'Приложение':'app', 
    'Группа офферов':'offer group',
    'Команда':'team', 
    'Ячейка':'subteam',
    'Цель конверсии Оффера':'offer_conversion_aim',
    'Выплата за цель/% комиссии':'offer_cost', 
    'Валюта цели':'currency',
    'Выплаты':'income', 
    'Sum Payout With Corrected':'sum_payout_with_corrected',
    'Депозит':'deposit', 
    'Конверсия':'conversion', 
    'Подтв. конверсия':'confirmed_conversion', 
    'Новые компании':'new_campaigns',
    'Активные кампании':'active_campaigns', 
    'Sub Id':'sub_id',
    'Sub Id10':'sub_id10', 
    'Cabinet Name':'cabinet_name', 
    'Кабинет является белым':'is_cabinet_white'
})

### Создание итогового файла

In [9]:
# создание уникального ключа для объединения таблиц по типу трекера appsflyer
offers['key'] = offers['date'] \
                .astype(str)+offers['buyer'] \
                .astype(str)+offers['offer_external_id'] \
                .astype(str)+offers['geo'] \
                .astype(str)+offers['media_source'] \
                .astype(str)+offers['cabinet_name'] \
                .astype(str)

offer_target['key'] = offer_target['date'] \
                .astype(str)+offer_target['buyer'] \
                .astype(str)+offer_target['offer_external_id'] \
                .astype(str)+offer_target['geo'] \
                .astype(str)+offer_target['media_source'] \
                .astype(str)+offer_target['cabinet_name'] \
                .astype(str)

In [10]:
# разделение таблицы на три части по типу трекера, так как они имеют разные уникальные ключи 
offers_default = offers.query('tracker_type == "Default"')
offers_af = offers.query('tracker_type == "Appsflyer"')
offers_ktr = offers.query('tracker_type == "Keitaro"')

In [11]:
# подтягивание необходимых значений из одной таблицы в другую
offers_keitaro = offers_ktr \
    .merge(offer_target[['sub_id', 'offer_cost', 'currency']] \
    .dropna(), how='left', on='sub_id', validate='m:m')

offers_appsflyer = offers_af \
    .merge(offer_target[['key', 'offer_cost', 'currency']] \
    .drop_duplicates(subset='key'), how='left', on='key', validate='m:m')

In [12]:
# соединение трех частей с новыми данными обратно в одну таблицу
report_offers = pd.concat([offers_default, offers_appsflyer, offers_keitaro], axis=0)

In [13]:
# удаление лишнего столбца
report_offers = report_offers.drop(columns='is_cabinet_white')

In [14]:
# замена типа данных для даты
report_offers.date = pd.to_datetime(report_offers.date)

In [15]:
# подготовка к замене типа данных для числовых значений
report_offers['offer_cost'] = report_offers['offer_cost'].str.replace(',', '.')
report_offers['offer_cost'] = report_offers['offer_cost'].str.replace(' ', '')
report_offers['income'] = report_offers['income'].str.replace(',', '.')
report_offers['spend'] = report_offers['spend'].str.replace(',', '.')
report_offers['margin'] = report_offers['margin'].str.replace(',', '.')
report_offers['commission'] = report_offers['commission'].str.replace(',', '.')
report_offers['gateway_fee'] = report_offers['gateway_fee'].str.replace(',', '.')
report_offers['ROI'] = report_offers['ROI'].str.replace(',', '.')

In [16]:
# замена типа данных для числовых значений 
report_offers['offer_cost'] = report_offers['offer_cost'].astype('float64')
report_offers['income'] = report_offers['income'].astype('float64')
report_offers['spend'] = report_offers['spend'].astype('float64')
report_offers['margin'] = report_offers['margin'].astype('float64')
report_offers['commission'] = report_offers['commission'].astype('float64')
report_offers['gateway_fee'] = report_offers['gateway_fee'].astype('float64')
report_offers['ROI'] = report_offers['ROI'].astype('float64')

In [17]:
# изменение порядка столбцов
report_offers = report_offers[['date', 'buyer', 'offer', 'tracker_type',
       'offer_external_id', 'account_manager', 'app', 'offer group', 'geo', 'platform',
       'media_source', 'team', 'subteam', 'income', 'spend', 'margin',
       'commission', 'gateway_fee', 'ROI', 'deposit', 'conversion',
       'confirmed_conversion', 'rebill', 'subids_with_quality_number',
       'mean_deposit', 'total_deposits', 'cabinet_name', 'sub_id10', 'sub_id',
       'key', 'offer_cost', 'currency']]

In [18]:
# проверка количества строк на совпадение с исходным документом и сохранение итогового файла
final_strings = report_offers.shape[0]
if final_strings == strings:
    report_offers.to_excel(f'report_offers_{date}.xlsx', index=False)
    print(f'Всё верно! В документе {final_strings} строк.')
elif final_strings != strings:
    print('Ошибка! Количество строк не совпало!')

Всё верно! В документе 1328 строк.
