In [75]:
import pandas as pd
import numpy as np

In [90]:
# список тегов. Первый элемент списка - название тега, остальные элементы - ключевики, по которым идет поиск
tags = [
  ['Комиссия', 'комис', 'камис', 'коммисс', 'каммисс', '%', 'коэффициен', 'процент', ' тариф'],
  ['Кэшбэк', 'кэшбэк', 'кебшэк', 'кешбек', 'бал', 'бонус', 'лояльност', 'кэшбак'],
  ['Ограничения на переводы/снятие/пополнение', 'лимит', 'ограничен'],
  ['Пополнение', 'пополн'],
  ['Карты', 'карт', 'реквизит'],
  ['Перевыпуск карты', 'перевыпуск'],
  ['Кредитные карты', 'кредит'],
  ['Виртуальная карта', 'виртуал'],
  ['Дисконтные карты', 'дисконт, десконт'],
  ['Терминал', 'терминал'],
  ['Процент на остаток', 'остаток', 'процента на остаток', 'проценты на остаток'],
  ['Интерфейс', 'интерфейс', 'навигац'],
  ['Дизайн', 'дизайн'],
  ['Курсы валют', 'курс'],
  ['Фото места нарушения', 'фото'],
  ['Уведомления', 'уведомл', 'уведомлён', 'уведамлен', 'уведамлён', 'оповещен'],
  ['Не находятся', 'не наход', 'не найден', 'найде', 'наход'],
  ['Не актуальные штрафы', 'не актуальн', 'неактуальным'],
  ['Поддержка', 'поддержк', 'подержк', 'техподдержк'],
  ['Номер телефона', 'номера телефон', 'номер телефон', 'смена телефон', 'сменить телефон'],
  ['Технические проблемы', 'не работа', 'сбои', 'сбой', 'ошибк', 'тормоз'],
  ['Поставщики услуг', 'поставщик', 'провайдер', 'оператор', 'ЖКХ'],
  ['Оплата', 'оплат'],
  ['Чек', 'чек'],
  ['История платежей', 'историю платеж', 'история платеж', 'историей платеж', 'истории платежей', 'история операций', 'истории операций', 'историю операций'],
  ['СМС-уведомление', 'смс', 'sms'],
  ['QR-код', 'QR', 'куар', 'кьюар'],
  ['Штрих-код', 'штрих-код', 'штрих код', 'штрихкод'],
  ['Квитанция', 'квитанц'],
  ['Сбербанк', 'сбер'],
  ['Блокировка', 'заблокирова', 'блокировк', 'блокиру'],
  ['Идентификация', 'идентификаци', 'идентифициров', 'верифи'],
  ['Номер кошелька', 'номер кошельк', 'номера кошельк', 'номером кошельк'],
  ['Крым', 'Крым', 'Севастопол'],
  ['Другие страны', 'Беларус', 'Казахстан', 'Узбекистан', 'Литв', 'Украин', 'СНГ', 'другой страны', 'другую страну', 'другая страна', 'не граждан'],
  ['Шаблон', 'шаблон'],
  ['Пин-код', 'pin', 'пинкод', ' код '],
  ['Системы мобильных платежей', 'apple', 'pay', 'samsung', 'google', 'самсунг', 'эпл', 'гугл'],
  ['Push-уведомления', 'пуш', 'push'],
  ['Статистика расходов', 'статистик', 'расход', 'аналитик'],
  ['Реклама', 'реклам', 'банер', 'баннер', 'конкурс'],
  ['Payoneer', 'Payoneer', 'пэйонир', 'пейонир'],
  ['NFS', 'нфс', 'nfc', 'nfs'],
  ['Язык интерфейса', 'английск', 'язык', 'en', 'ru'],
  ['Повторение операции', 'повторен', 'повтор'],
  ['Автоплатежи', 'автоплатёж', 'автоплатеж', 'регулярные платежи', 'регулярных платежей', 'регулярный платеж', 'регулярный платёж', 'периодических платежей', 'периодический платёжм'],
  ['Криптовалюта', 'криптавалют', 'криптовалют'],
  ['Пароль', 'парол'],
  ['Манилэндия', 'маниленд', 'манилэнд'],
  ['Мультивалютность', 'мультивалютн'],
  ['Бесконтактные платежи', 'бесконтактн', 'безконтактн'],
  ['Коммунальные платежи', 'коммунальн', 'комунальн', 'камунальн'],
  ['Мобильное приложение', 'приложени'],
  ['Валюты', 'валют'],
  ['Подтверждение платежа', 'подтверждения платежа', 'подтверждение платежа', 'подтвердить платеж', 'подтвердить платёж'],
  ['Банкомат', 'банкомат', 'банкамат'],
  ['Отпечаток пальца', 'отпечаток пальца', 'отпечатку пальца', 'отпечатка пальца'],
  ['Надежность', 'надежн', 'надёжн'],
  ['Удобство', ' удобств', 'простот', 'интуитивно', ' понятно '],
  ['Скорость работы', 'быстро ', 'оперативн']
]



In [91]:
# функция для применения тегов
def apply_tags(s):
    answer_tags = []
    answer = str(s).lower()
    for tag in tags:
        if any(substring.lower() in answer for substring in tag):
            answer_tags.append(tag[0])
    return ", ".join(answer_tags)

def tag_comments(df_column, comments_column_name):
    result_df = pd.concat(
        [
            df_column,
            pd.DataFrame(df_column.apply(apply_tags))
        ], axis=1
    )
    result_df.columns = [comments_column_name, 'теги']
    result_df = result_df.dropna()
    return result_df

def process_nps(list_of_file_names):
    for file in list_of_file_names:
        data = pd.read_excel(file)
        # подсчитывает и делает табличку по распределению ответов
        total = pd.DataFrame(data['Для начала нужна общая оценка: как вам переводы?'].value_counts()).reset_index()
        total.insert(loc=0, column='wallet', value='total')
        total.columns = ['type', 'Оценка', 'Кол-во']
        
        loyalty_T_F = (
            data.groupby(['wallet', 'Для начала нужна общая оценка: как вам переводы?'])
            .agg({'email': 'count'})
            .sort_values(['wallet','email'], ascending=False)
            .reset_index()
        )
        loyalty_T_F.columns = ['type', 'Оценка', 'Кол-во']
        
        counts = total.append(loyalty_T_F)
        counts = counts.pivot_table(values='Кол-во', index = 'Оценка', columns='type').reset_index()
        
        # протеггируем открытые ответы пользователей
        grade_1_2 = tag_comments(data['Хотим понять, почему так. Расскажите, с чем были проблемы:'], 'Проблемы (оценки 1 и 2)')
        grade_3_4 = tag_comments(data['Хотим понять, чего не хватило до пятёрки?'], 'Почему не 5 (оценки 3 и 4)')
        grade_5_6 = tag_comments(data['Это очень приятно! Будет здорово, если добавите подробностей: что особенно понравилось?'], 'Почему 5ка (оценки 5 и 6)')
        
        # Запишем все это на отдельные листы файла
        with pd.ExcelWriter(f'{file}_output.xlsx') as writer:  
            counts.to_excel(writer, sheet_name='Разбивка по ответам', index = False)
            grade_1_2.to_excel(writer, sheet_name='Проблемы (оценки 1 и 2)', index = False)
            grade_3_4.to_excel(writer, sheet_name='Почему не 5 (оценки 3 и 4)', index = False)
            grade_5_6.to_excel(writer, sheet_name='Почему 5ка (оценки 5 и 6)', index = False)
        

In [94]:
process_nps([
    '/Users/aaterekhov/Desktop/git/NPS_script/nps_ex.xlsx'
])

In [97]:
import pandas as pd
pd.__version__

'1.1.0'