In [2]:
from llm_as_judge import LLMAsJudge
from factory import get_parser
from parsers.tg_channel import TelegramWebParser
# from parser import LandingPageParser
from creative_generation import CreativeGenerator

from mistralai import Mistral

In [3]:
import re
def load_stopwords(path='sensetive_words.txt') -> set[str]:
    with open(path, 'r', encoding='utf-8') as f:
        content = f.read()
    words = [w.strip().lower() for w in content.split(',') if w.strip()]
    return set(words)

def compile_stopword_pattern(stopwords: set[str]) -> re.Pattern:
    escaped = map(re.escape, stopwords)
    pattern = re.compile(r'\b(' + '|'.join(escaped) + r')\b', re.IGNORECASE)
    return pattern

def contains_stopwords(text: str, pattern: re.Pattern) -> bool:
    found = {match.group(0).lower() for match in pattern.finditer(text)}
    return sorted(found)

In [4]:
stop_words = load_stopwords()
pattern = compile_stopword_pattern(stop_words)
contains_stopwords('дрочиться буду или ты снотворный, будешь', pattern)

['дрочиться', 'снотворный']

In [18]:
sample_url_401 = "https://sokolov.ru/" 
sample_url_403 = 'https://www.banki.ru/' #https://www.banki.ru/ #https://t.me/s/kvvins #https://t.me/ru_fancybot
parser = get_parser(sample_url_403)
parser

<parsers.base.LandingPageParser at 0x7f9570017a30>

In [19]:
parsed_data = parser.parse()

INFO:parsers.base:Страница успешно загружена: https://www.banki.ru/
INFO:parsers.base:Парсинг завершён успешно.


In [20]:
api_key = 'x2HtdihRnziqstzrsXjzjJpLfqfcua2H'
model = 'mistral-large-latest' # 123b
# model = 'mistral-small-latest' # 24b
# model = 'open-mistral-7b' # 7b
# model = 'ministral-8b-latest' # 8b
client = Mistral(api_key=api_key)

In [21]:
llm_instance = LLMAsJudge(client=client, model=model)
key_aspects = llm_instance.extract_key_aspects(parsed_data=parsed_data)

Ты — эксперт по маркетингу и таргетингу. Твоя задача — на основе описания посадочной страницы:
            1. Выделить название рекламного объекта
2. Сгенерировать 3–5 наиболее релевантных категорий продукта или услуги. При выборе опирайся на бизнес-логику: эти категории будут использоваться в алгоритмах для поиска и сегментирования целевой аудитории, где можно прорекламировать этот продукт.
3. Для каждой сгенерированной категории подобрать ровно одну тематику из этого списка:
   Telegram; Бизнес и стартапы; Блоги; Букмекерство; Видео и фильмы; Даркнет; Дизайн; Для взрослых; Другое; Еда и кулинария; Здоровье и Фитнес; Игры; Инстаграм; Интерьер и строительство; Искусство; Картинки и фото; Карьера; Книги; Криптовалюты; Курсы и гайды; Лингвистика; Маркетинг, PR, реклама; Медицина; Мода и красота; Музыка; Не указана; Новости и СМИ; Образование; Общая; Познавательное; Политика; Право; Природа; Продажи; Психология; Путешествия; Религия; Рукоделие; Семья и дети; Софт и приложения; Спорт; Техн

INFO:httpx:HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO:llm_as_judge:Ключевые аспекты успешно получены от LLM.


In [13]:
key_aspects

{'brend_name': 'fancybot.ru',
 'categories': [{'name': 'Мода и красота', 'theme': 'Мода и красота'},
  {'name': 'Софт и приложения', 'theme': 'Софт и приложения'},
  {'name': 'Образ жизни', 'theme': 'Образование'},
  {'name': 'Технологии', 'theme': 'Технологии'}]}

In [11]:
creative_gen = CreativeGenerator(client, model, sample_url_403)
creatives = creative_gen.generate_creatives(key_aspects)

Ты — креативный копирайтер, специализирующийся на создании рекламных текстов.Твоя задача - заполнить две сущности: рекламный заголовок и текстовый креатив (не более 160 символов!).

Есть три стиля рекламных текстов:
1) Стиль 1: Длинный, формальный, содежржит самые важные преимущества продукта (не более 160 символов!)
2) Стиль 2: Эмоциональный, аппелирующий к потенциальным болям клиента, может также быть юмористическим (не более 160 символов!)
3) Стиль 3: Самый короткий текст, но цепляющий(не более 5-10 слов)

Теперь для каждого стиля сразу сгенерируй два поля:
- headline
- ad_text

Для каждого из трёх стилей придумай свой уникальный заголовок и рекламный текст, используя ключевые аспекты.


        Редакционные требования:
        - Нельзя обращаться на «ты»; только «вы», повелительное наклонение на «вы».
        - Не использовать CAPS LOCK, лишние аббревиатуры, латиницу (если не бренд).
        - Эмодзи и «!» минимально, без негативной или вульгарной стилистики.
        - Заголовок: д

INFO:httpx:HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO:creative_generation:Креативы успешно получены от LLM.


In [12]:
creatives

{'Стиль 1': {'headline': 'Fancybot.ru — ваш гид в мире стиля',
  'ad_text': 'Откройте Fancybot.ru: мода, красота, софт и образование. Все преимущества в одном месте. Узнайте больше!'},
 'Стиль 2': {'headline': 'Fancybot.ru: живите стильно',
  'ad_text': 'Устали искать идеальный образ? Fancybot.ru — мода, технологии и образование. Ваш стиль — наш приоритет!'},
 'Стиль 3': {'headline': 'Fancybot.ru: стиль и технологии',
  'ad_text': 'Мода, красота, софт и образование. Всё на Fancybot.ru.'}}