In [25]:
from llm_as_judge import LLMAsJudge
from factory import get_parser
from parsers.tg_channel import TelegramWebParser
# from parser import LandingPageParser
from moderation import CreativeGenerator

from mistralai import Mistral

In [26]:
import re
def load_stopwords(path='sensetive_words.txt') -> set[str]:
    with open(path, 'r', encoding='utf-8') as f:
        content = f.read()
    words = [w.strip().lower() for w in content.split(',') if w.strip()]
    return set(words)

def compile_stopword_pattern(stopwords: set[str]) -> re.Pattern:
    escaped = map(re.escape, stopwords)
    pattern = re.compile(r'\b(' + '|'.join(escaped) + r')\b', re.IGNORECASE)
    return pattern

def contains_stopwords(text: str, pattern: re.Pattern) -> bool:
    found = {match.group(0).lower() for match in pattern.finditer(text)}
    return sorted(found)

In [27]:
stop_words = load_stopwords()
pattern = compile_stopword_pattern(stop_words)
contains_stopwords('дрочиться буду или ты снотворный, будешь', pattern)

['дрочиться', 'снотворный']

Мы оказываем услуги лазерной эпиляции. Первая лазерная эпиляция с гарантией результата, курс 7 процедур, если темные волосы еще останутся, следующие 3 процедуры за наш счёт.
Интервал между процедурами курса 2-3 месяца.

In [28]:
len('')

155

In [29]:
sample_url_401 = "https://sokolov.ru/" 
sample_url_403 = 'https://t.me/s/kvvins' #https://www.banki.ru/ #https://t.me/s/kvvins #https://t.me/ru_fancybot
parser = get_parser(sample_url_403)
parser

<parsers.tg_channel.TelegramWebParser at 0x7f9fb9aa1ca0>

In [30]:
len('Ваша кожа будет точно как у младенцев! Первая лазерная эпиляция с гарантией. Если волосы останутся, следующие 3 процедуры бесплатно. Подарите себе уверенность!')

159

In [31]:
parsed_data = parser.parse()

INFO:parsers.base:Страница успешно загружена: https://t.me/s/kvvins


In [32]:
api_key = 'Q4Hj5o5PSeo7WsZBcnT6EAzJPl9cLEEu' # мой: 'x2HtdihRnziqstzrsXjzjJpLfqfcua2H'
model = 'mistral-large-latest' # 123b
# model = 'mistral-small-latest' # 24b
# model = 'open-mistral-7b' # 7b
# model = 'ministral-8b-latest' # 8b
client = Mistral(api_key=api_key)

In [35]:
llm_instance = LLMAsJudge(client=client, model=model, url=sample_url_403)
key_aspects = llm_instance.extract_key_aspects(parsed_data=parsed_data)

INFO:httpx:HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"
INFO:llm_as_judge:Ключевые аспекты успешно получены от LLM.


In [36]:
key_aspects

{'brand_name': 'Кvins клиника лазерной эпиляции@kvvins',
 'themes': ['Здоровье и Фитнес', 'Медицина', 'Мода и красота'],
 'prompt': 'Клиника Кvins предлагает лазерную эпиляцию с гарантией. 7 процедур, если волосы не уйдут, следующие 3 бесплатно. Запись через WhatsApp или Instagram.'}

In [37]:
12493 - 11932

561

In [38]:
prompt = '''
Мы оказываем услуги лазерной эпиляции. Первая лазерная эпиляция с гарантией результата, курс 7 процедур, если темные волосы еще останутся, следующие 3 процедуры за наш счёт. Интервал между процедурами курса 2-3 месяца.
'''

In [39]:
creative_gen = CreativeGenerator(client, model, sample_url_403)
creatives = creative_gen.generate_creatives(prompt, key_aspects)

INFO:httpx:HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 429 Too Many Requests"
INFO:httpx:HTTP Request: POST https://api.mistral.ai/v1/chat/completions "HTTP/1.1 200 OK"


```json
{
  "Стиль 1": {
    "headline": "Кvins клиника лазерной эпиляции@kvvins",
    "ad_text": "Первая лазерная эпиляция с гарантией результата. Курс из 7 процедур, интервал 2-3 месяца. Если останутся темные волосы, следующие 3 процедуры бесплатно."
  },
  "Стиль 2": {
    "headline": "Кvins клиника лазерной эпиляции@kvvins",
    "ad_text": "Забудьте о нежелательных волосах! Гарантированный результат после курса из 7 процедур. Если останутся темные волосы, следующие 3 процедуры за наш счет!"
  },
  "Стиль 3": {
    "headline": "Кvins клиника лазерной эпиляции@kvvins",
    "ad_text": "Гладкая кожа навсегда. Гарантия результата."
  }
}
```
Стиль 1 []
Стиль 2 []
Стиль 3 []


In [40]:
creatives

{'Стиль 1': {'headline': 'Кvins клиника лазерной эпиляции@kvvins',
  'ad_text': 'Первая лазерная эпиляция с гарантией результата. Курс из 7 процедур, интервал 2-3 месяца. Если останутся темные волосы, следующие 3 процедуры бесплатно.'},
 'Стиль 2': {'headline': 'Кvins клиника лазерной эпиляции@kvvins',
  'ad_text': 'Забудьте о нежелательных волосах! Гарантированный результат после курса из 7 процедур. Если останутся темные волосы, следующие 3 процедуры за наш счет!'},
 'Стиль 3': {'headline': 'Кvins клиника лазерной эпиляции@kvvins',
  'ad_text': 'Гладкая кожа навсегда. Гарантия результата.'}}

In [41]:
for style, creative in creatives.items():
    print(len(creative['ad_text']))

152
151
43


In [42]:
for style, creative in creatives.items():
    print(len(creative['headline']))

38
38
38


In [40]:
618 + 200 + 100 + 561

1479