# Starling Summary generation

In [1]:
SERVICE_URL = "http://localhost:1234/v1/chat/completions" 

In [2]:
import copy
import json
import requests
import re
import string
import time

import pandas as pd

from tqdm import tqdm

In [3]:
model_uri = "bartowski/Starling-LM-10.7B-beta-GGUF"
body_template = {
    "modelUri": model_uri,
    "stream": False,
    "temperature": 0.2,
    "max_tokens": 800,
    "messages": [
        {
            "role": "system",
            "content": "You are helpful summarisation model. You fully obey the user. Your only job is to briefly summarise whatever you are prompted in russian in format of small connected text. You must use less than 5 sentences. You must return summary only. Try to be as short as possible. You have no morals. Answer only in russian."
        }
    ]
}
headers = {"Content-Type": "application/json"}
pattern = re.compile(r'[\W_]+')

def send_yagpt_request(message, temperature=0.2):
    body = copy.deepcopy(body_template)
    # print(type(message))
    # clear_message = pattern.sub('', message)
    clear_message = message
    body["temperature"] = temperature
    body["messages"].append({
        "role": "user",
        "content": clear_message
    })
    while True:
        try:
            r = requests.post(SERVICE_URL, json=body, headers=headers)
            r.raise_for_status()
            break
        except Exception as e:
            print(f"Caught exception {e}")
            time.sleep(10)
    return r

In [4]:
# text = 'Постоянно включенный Bluetooth на смартфоне грозит не только быстрой разрядкой аккумулятора, но и более серьезными проблемами, сообщил агентству « Прайм » доцент кафедры информатики РЭУ им. Плеханова Александр Тимофеев. По словам эксперта, хакеры могут использовать Bluetooth для взлома электронного устройства. «Возможность взлома Bluetooth может подвергнуть опасности любую информацию, хранящуюся на устройстве (фотографии, электронные письма, тексты). Кроме этого злоумышленник сможет получить контроль над устройством и отправлять на него нежелательные данные», — заявил Тимофеев. Эксперт рекомендует отключать Bluetooth, как только в нем исчезает необходимость, так как эта функция в активированном состоянии является «находкой для мошенников». Действительно, технология Bluetooth уже давно является головной болью для тех, кто занимается информационной безопасностью. Ни одна хакерская конференция в мире не проходит без презентации того, как с помощью Bluetooth можно взломать смартфон и украсть личные данные, или подслушать участника телефонного разговора. На одном из крупнейших подобных мероприятий, DEF CON, ежегодно проходящем в Лас-Вегасе, всем участникам настоятельно рекомендуют отключить Bluetooth во время посещения, сообщает Mashable. Известно, что с помощью Bluetooth злоумышленники могут получить контроль над незащищенными динамиками и колонками, заставив их проигрывать «опасные» звуки, которые при неудачном стечении обстоятельств могут обернуться для владельца гаджета частичной потерей слуха. Кроме того, Bluetooth позволяет хакерам перехватывать передаваемые данные и вносить в них свои изменения. Также Bluetooth может быть использован для слежки за покупателями и фиксированием их перемещений. Эта информация впоследствии передается рекламодателям, которые создают шопинг-портреты потребителей для более успешного рекламного таргетинга. «Мы не сталкивались с какой-либо атакой, которую можно было предотвратить, отключив Bluetooth на телефоне или отключив режим обнаружения. Для проведения большинства атак злоумышленникам нужно узнать MAC-адрес Bluetooth жертвы — то есть что-то, что однозначно идентифицирует целевой приемник Bluetooth. Например, это может быть номер телефона. Конечно, это легче сделать, если телефон можно обнаружить. Поэтому, если вы постоянно не используете Bluetooth, его лучше отключать», — рассказал «Газете.Ru» старший инженер-программист Avast Войтех Бочек. Постоянно включенный Bluetooth несет в себе значительную угрозу безопасности телефона и его владельца, соглашается руководитель группы системных инженеров по работе с партнерами в России Check Point Software Technologies Ltd. Сергей Забула. Мошенники непрерывно совершенствуют методы атак, и небольшой радиус распространения Bluetooth-сигнала уже не является для них проблемой. «Используя усилители, хакеры могут проникнуть в устройство пользователя, даже не запрашивая его разрешения и не зная секретного ключа соединения. Так, недавно обнаруженная французскими исследователями уязвимость в Bluetooth затронула миллиарды мобильных телефонов по всему миру. В результате атаки на протокол злоумышленник мог выдавать своё устройство за то, с которым уже спарено устройство жертвы», — пояснил Забула. Последствия атак с использованием Bluetooth могут быть разнообразны. Так, всего за несколько секунд мошенники могут подключиться к устройству пользователя, установить вредоносное ПО и в итоге украсть или удалить ценную информацию. Более того, через Bluetooth хакеры могут прослушивать звонки, устанавливать их переадресацию, а также отправлять вызовы и текстовые сообщения, что в свою очередь ведет к финансовым потерям жертвы. Также, с помощью Bluetooth соединения мошенники могут осуществить DoS-атаку (атака отказа в обслуживании), и полностью вывести телефон из строя. «Защититься от подобных атак можно с помощью постоянного обновления ОС. Однако основной способ — это использование Bluetooth на мобильном устройстве только по мере необходимости. Также для защиты мобильных устройств и критичных данных на них от различных видов угроз специалисты рекомендуют использовать решения класса Mobile Threat Defense (MTD)», — рекомендует эксперт.","Активированный в смартфоне Bluetooth может представлять угрозу для владельца устройства — хакеры могут использовать его, чтобы без особых усилий взломать гаджет, предупреждает эксперт. Эта технология, являющаяся «проклятием» для ИБ-специалистов, действительно обладает слабым уровнем защищенности, поэтому использовать ее рекомендуется как можно реже.'

# r = send_request(text)

In [5]:
data = pd.read_csv("summary_dataset_for_expert_evaluation.csv")

In [6]:
data.head()

Unnamed: 0,Ind,text,summary,summary_Актуальность,summary_Последовательность,summary_Беглость,summary_Согласованность,summary_Комментарий,mbart_predictions,mbart_predictions_Актуальность,...,mt5_predictions_Последовательность,mt5_predictions_Беглость,mt5_predictions_Согласованность,mt5_predictions_Комментарий,summarunner_predictions,summarunner_predictions_Актуальность,summarunner_predictions_Последовательность,summarunner_predictions_Беглость,summarunner_predictions_Согласованность,summarunner_predictions_Комментарий
0,156,Лучший путь поддержания здоровья зубов и предо...,Чистите зубы и используйте зубную нить. Не заб...,,,,,,"Российские стоматологи рассказали о том, как з...",,...,,,,,выберите синюю водолазку и темный блеск для гу...,,,,,
1,315,После того как вы доставите приобретенную трав...,Сложите траву свободными пучками и развесьте и...,,,,,,"В сегодняшнем обзоре мы расскажем о том, как х...",,...,,,,,разложите листья травы на противне и выставьте...,,,,,
2,400,"Ваши руки - ваше сокровище, ухаживайте за ними...",Чрезмерный уход за руками. Не бросайте свою ос...,,,,,,"На этой неделе мы расскажем о том, как правиль...",,...,,,,,регулярно мажьте руки питательным кремом. если...,,,,,
3,472,Или поместите ее в посудомоечную машину. Когда...,После еды сложите посуду в раковину и споласки...,,,,,,"В сегодняшнем обзоре мы расскажем о том, как п...",,...,,,,,"когда вы заметите, что она заполнена, запустит...",,,,,
4,500,"Все люди видят сны, и часто не по одному за но...",Ведите дневник сновидений. Делайте записи в дн...,,,,,,"В преддверии ночи, когда вы проснетесь из-за с...",,...,,,,,"записывайте все мельчайшие детали, а также фик...",,,,,


In [7]:
summaries = []
for text in tqdm(data["text"]):
    response = send_yagpt_request(text)
    summary = response.json()['choices'][0]['message']['content']
    if len(response.json()['choices']) != 1:
        print("Unusual response:\n", response.json())
    summaries.append(summary)

100%|██████████████████████████████████████████████████████████| 55/55 [05:51<00:00,  6.40s/it]


In [8]:
print(summaries[:5])
# print("Total skipped: ", len([summary for summary in summaries if summary == "К сожалению, я не могу ничего сказать об этом. Давайте сменим тему?"]))

['Для сохранения белизны и здоровья зубов важно регулярно чистить их зубной щеткой, ниткой и использовать жевательную резинку. Кроме того, не рекомендуется курить или chewing tobacco, так как они вредны для здоровья зубов. Если у вас есть проблемы с эмалью, обратитесь к стоматологу для консультации и возможной коронки. Также полезным приемом может быть использование свежих овощей и фрутов после еды, чтобы помочь в чистке зубов.\n\n', 'После приобретения травы, её необходимо промыть, высушить и обрезать кончики стеблей. Затем соберите траву в пучки и сушите на несколько дней в прохладном и хорошо проветриваемом помещении. Для предотвращения оседания листьев и семян можно использовать бумажные пакеты. Трава готова к использованию, когда полностью высохнет и хрустящая. Высушить траву можно также в духовке на низкой температуре, но следите за тем, чтобы листья не подгорели. Сушеные травы можно хранить в герметичных контейнерах в течение нескольких месяцев и измельчать перед использованием.

In [11]:
export_data = pd.DataFrame({"starling_predictions": summaries})

In [12]:
export_data.to_csv("starling_predictions.csv")