# Описание проекта
Mag_Py_bot - сервис, который создает изображения по текстовому запросу пользователей.

## Как запустить сервис
* Запустить выполнение кода в ячейке ниже
* После установки всех библиотек перейти в телеграм [Mag_Py_bot](https://t.me/MagPyBot)
* Запустить бота командой **/start**
* Чтобы создать изображение, написать **/generate** и промпт на английском языке
* Обратите внимание - инициализация модели может составлять 5-7 минут с начала запроса
* Enjoy!

## ⭐ Стек технологий
* Python - язык разработки
* Google Colab - среда разработки и выполнения кода
* [Huggingface](https://huggingface.co) - платформа для хостинга LLM, их использования и обучения
* [Flux.1-dev](https://huggingface.co/black-forest-labs/FLUX.1-dev) - text-2-image модель, которая генерирует изображение по текстовому запросу
* [Telegram - бот](https://t.me/MagPyBot), выступающий в роли фронтенда

## 📚 Основные библиотеки и модули
* [python-telegram-bot](https://python-telegram-bot.org) -
создание бота и взаимодействия с Telegram API
* [Pillow](https://pypi.org/project/pillow/) - обработка изображений
* [requests](https://pypi.org/project/requests/) -  работа с HTTP - запросами
* [nest-asyncio](https://pypi.org/project/nest-asyncio/) - работа с асинхронными запросами
* [logging](https://docs.python.org/3/library/logging.html) - система логирования Python
* [BytesIO](https://docs.python.org/3/library/io.html#io.BytesIO) - работа с изображениями в памяти

## ⚡Используемые подходы
* [Объектно-ориентированное программирование](https://ru.wikipedia.org/wiki/Объектно-ориентированное_программирование)
* [Асинхронное программирование](https://javarush.com/quests/lectures/ru.javarush.python.core.lecture.level14.lecture02)

## ✅ Что реализовано и работает в проекте
* Основные функции бота:
  * прием текстовых сообщений от пользователя
  * валидация введенного текста
  * генерация изображения
  * отображение прогресса генерации ❗
  * сохранение от отправка готовых изображений

* Процесс работы:
  * инициализация - загрузка конфигурации и токенов
  * запуск бота
  * запросы к API Huggingface
  * проверка доступности API
  * асинхронное выполнение запросов
  * ограничение длины промптов

## ❌ Что реализовано и НЕ работает или НЕ используется в работе
* логирование в консоль и в файл
* токены не вынесены в секреты
* словарь недопустимого контента не вынесен в файл
* проверка доступа пользователей по ID

## ⚓ Список фукнций
* Основные
  * **async def main()**
    * точка входа в программу
    * инициализирует бота
    * регистрирует обработчики команд
    * запускает основной цикл бота
  * **def load_forbidden_words()**
    * загружает список запрещенных слов
  * **def check_user_permission()**
    * управление правами доступа к боту
  * **def validate_prompt()**
    * проверяет текст на допустимую длину
    * проверяет текст на отсутствие запрещенных слов
  * **async def generate_image()**
    * отправляет запрос к API для генерации изображения
    * возвращает статус, сообщение об ошибке и данные изображения
* Обработчики команд (handlers)
  * **async def start()**
    * отправляет приветственное сообщение и инструкции при первом запуске бота
  * **async def help_command()**
    * отправляет справку по использованию бота
  * **async def generate_command()**
    * обрабатывает команду на генерацию: /generate
  * **async def handle_message()**
    * основной обработчик сообщений
    * проверяет права доступа
    * валидирует текст
    * запускает генерацию
    * отправляет результат


## 📔 Заметки
* поиск получается только на английском языке

* пришлось использовать nest_asyncio, потому что Google Colab уже использует [event loop](https://javarush.com/quests/lectures/ru.javarush.python.core.lecture.level14.lecture05), и нужен был еще один внутри существующего, так как бот не запускался =(
  
* как следствие, ошибка, быстро пофиксить не удалось:  
> ERROR:__main__:Ошибка при запуске: Cannot close a running event loop .


* очень долгая инициализация модели в Huggingface. И все бы ничего, но не могу разобраться, как получить статус инициализации для создания прогрессбара для пользователя

* как следствие - генерация изображения занимает 5 - 8 минут =(

* что пробовал, но так или иначе не завелось:
  * FastAPI + uvicorn - вебсервер и API
  * py-localtunnel, ngrok - тунеллирование
  * встроенный проброс портов в Google Colab - переделал реализацию, убрал









In [None]:
"""
-
- tqdm - андрей показал либу с прогрессбаром, добавить
- tqdm только для консоли взлетела, не могу понять, можно ли для Телеги, уберу
- localtunnel не взлетел в Colab, не смог разобраться почему.
- ngrok не дает зарегаться из-за санкций
- нагуглил встроенный инструмент для проброса портов - google.colab.output.eval_js
- https://colab.research.google.com/notebooks/snippets/advanced_outputs.ipynb
- выпилил, сделал по-другому
- убрал FastAPI + uvicorn, выдает 405 при обращении к эндпоинту
"""


# Установка библиотек
!pip install python-telegram-bot pillow requests nest_asyncio

import os
import logging
import requests
import time
import asyncio
from telegram import Bot, Update
from telegram.ext import Application, CommandHandler, MessageHandler, filters, CallbackContext
from PIL import Image
from io import BytesIO
import nest_asyncio


# Настройка логирования - TODO не работает, разобраться
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.FileHandler('bot_logs.txt'),
        logging.StreamHandler()  # Добавляем вывод в консоль
    ]
)
logger = logging.getLogger(__name__)


# Конфигурация
TELEGRAM_TOKEN = "7494854039:AAEfXvfLMeBRPMaMJlbxF4htI1BQ2vxN6UE"  # TODO вынести в секреты
HUGGINGFACE_TOKEN = "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"  # TODO вынести в секреты
ALLOWED_USERS = []  # Пустой список означает доступ для всех
MAX_PROMPT_LENGTH = 500 # при большей длине начинает тупить почему-то

# тестовый список запрещенных слов, TODO вынести в файл
FORBIDDEN_WORDS = [
    # Русские
    '', '',
    # Английские
    'fuck', 'shit', 'bitch', 'dick', 'ass',
    # Запрет на генерацию потенциально неприемлемого контента
    'porn', 'порно', 'nude', 'naked', 'sex', 'nigger',
]

def load_forbidden_words(filename='forbidden_words.txt'):
    try:
        with open(filename, 'r', encoding='utf-8') as file:
            words = file.read().splitlines()
            FORBIDDEN_WORDS.extend(words)
            logger.info(f"Загружено {len(words)} запрещенных слов из файла")
    except FileNotFoundError:
        logger.warning(f"Файл {filename} не найден, используется базовый список слов")
    except Exception as e:
        logger.error(f"Ошибка при загрузке списка слов: {str(e)}")

# ограничение доступа, TODO либо доработать, либо удалить
def check_user_permission(user_id: int) -> bool:
    return not ALLOWED_USERS or user_id in ALLOWED_USERS

# валидируем промпты по длине и по bad words
def validate_prompt(text: str) -> tuple[bool, str]:
    if len(text) > MAX_PROMPT_LENGTH:
        return False, "Текст слишком длинный"

    text_lower = text.lower()
    found_words = [word for word in FORBIDDEN_WORDS if word in text_lower]

    if found_words:
        return False, "Текст содержит недопустимые слова"

    return True, ""


async def generate_image(prompt: str) -> tuple[bool, str, bytes]:
    """
    Генерирует изображение используя Hugging Face API.
    Возвращает: (успех, сообщение об ошибке, данные изображения)
    """
    try:
        # Отправляем запрос к API
        response = requests.post(
            "https://api-inference.huggingface.co/models/black-forest-labs/FLUX.1-dev",
            headers={"Authorization": f"Bearer {HUGGINGFACE_TOKEN}"},
            json={"inputs": prompt},
            stream=True  # Включаем потоковую передачу
        )

        if response.status_code == 503:
            # Модель загружается
            return False, "Модель инициализируется, пожалуйста, попробуйте через минуту", None

        elif response.status_code == 200:
            return True, "", response.content
        else:
            error_msg = f"Ошибка API: {response.status_code}"
            logger.error(f"{error_msg}. Ответ: {response.text}")
            return False, error_msg, None

    except Exception as e:
        error_msg = f"Ошибка при генерации: {str(e)}"
        logger.error(error_msg)
        return False, error_msg, None


async def handle_message(update: Update, context: CallbackContext, text: str = None):
    user_id = update.effective_user.id
    text = text or update.message.text

    logger.info(f"Получен запрос от пользователя {user_id}: {text}")

    if not check_user_permission(user_id):
        await update.message.reply_text("⛔ У вас нет доступа к боту.")
        return

    is_valid, error_message = validate_prompt(text)
    if not is_valid:
        await update.message.reply_text(f"❌ Ошибка: {error_message}")
        return

    # Создаем индикаторы этапов с эмодзи
    stages = [
        "⚪ Подготовка запроса...",
        "⚪ Инициализация модели...",
        "⚪ Генерация изображения...",
        "⚪ Сохранение результата..."
    ]
    progress_text = "\n".join(stages)
    progress_message = await update.message.reply_text(progress_text)

    try:
        # Обновляем статус первого этапа
        stages[0] = "🟢 Подготовка запроса - готово"
        await progress_message.edit_text("\n".join(stages))

        # Первая попытка генерации
        success, error_msg, image_data = await generate_image(text)

        # Если модель загружается, делаем несколько попыток
        attempts = 0
        while not success and "инициализируется" in error_msg and attempts < 5:
            stages[1] = f"🟡 Инициализация модели - попытка {attempts + 1}/5"
            await progress_message.edit_text("\n".join(stages))

            await asyncio.sleep(10)  # Ждем 10 секунд между попытками
            success, error_msg, image_data = await generate_image(text)
            attempts += 1

        stages[1] = "🟢 Инициализация модели - готово"
        await progress_message.edit_text("\n".join(stages))

        if success and image_data:
            # Обновляем статус генерации
            stages[2] = "🟢 Генерация изображения - готово"
            await progress_message.edit_text("\n".join(stages))

            # Сохраняем изображение
            image = Image.open(BytesIO(image_data))
            os.makedirs("generated_images", exist_ok=True)
            image_path = f"generated_images/img_{user_id}_{int(time.time())}.png"
            image.save(image_path)

            # Обновляем статус сохранения
            stages[3] = "🟢 Сохранение результата - готово"
            await progress_message.edit_text("\n".join(stages))

            # Отправляем изображение
            with open(image_path, "rb") as image_file:
                await update.message.reply_photo(
                    photo=image_file,
                    caption=f"🎨 Изображение по запросу:\n{text[:100]}..."
                )

            logger.info(f"Изображение успешно сгенерировано и отправлено пользователю {user_id}")
        else:
            # Обновляем статус с ошибкой
            stages[2] = "❌ Генерация изображения - ошибка"
            await progress_message.edit_text("\n".join(stages) + f"\n\nОшибка: {error_msg}")

    except Exception as e:
        error_msg = f"Ошибка при обработке сообщения: {str(e)}"
        logger.error(error_msg)
        # Отмечаем текущий этап как проблемный
        for i in range(len(stages)):
            if "⚪" in stages[i]:
                stages[i] = stages[i].replace("⚪", "❌")
        await progress_message.edit_text("\n".join(stages) + "\n\n❌ Произошла ошибка при генерации изображения.")


async def start(update: Update, context: CallbackContext):
    user_id = update.effective_user.id
    logger.info(f"Команда /start от пользователя {user_id}")

    welcome_text = """
    Привет! Я бот для генерации изображений по текстовому описанию.

    Доступные команды:
    /start - показать это сообщение
    /help - получить справку
    /generate <текст> - сгенерировать изображение

    Как использовать бота:
    1. Отправьте текстовое описание желаемого изображения
    2. Дождитесь генерации (обычно занимает до 5 минут)
    3. Получите готовое изображение

    Ограничения:
    - Максимальная длина описания: 500 символов
    - Без запрещенных слов
    - Только текст на английском языке
    """
    await update.message.reply_text(welcome_text)

async def help_command(update: Update, context: CallbackContext):
    user_id = update.effective_user.id
    logger.info(f"Команда /help от пользователя {user_id}")

    help_text = """
    Как использовать бота:
    1. Отправьте текстовое описание желаемого изображения
    2. Дождитесь генерации (обычно занимает до 5 минут)
    3. Получите готовое изображение

    Ограничения:
    - Максимальная длина описания: 500 символов
    - Без запрещенных слов
    - Только текст на английском языке
    """
    await update.message.reply_text(help_text)

async def generate_command(update: Update, context: CallbackContext):
    user_id = update.effective_user.id
    logger.info(f"Команда /generate от пользователя {user_id}")

    if not context.args:
        await update.message.reply_text("Пожалуйста, добавьте текст после команды /generate")
        return

    text = ' '.join(context.args)
    await handle_message(update, context, text)


async def main():
    # Инициализация бота
    application = Application.builder().token(TELEGRAM_TOKEN).build()

    # Добавляем обработчики команд
    application.add_handler(CommandHandler("start", start))
    application.add_handler(CommandHandler("help", help_command))
    application.add_handler(CommandHandler("generate", generate_command))
    application.add_handler(MessageHandler(filters.TEXT & ~filters.COMMAND, handle_message))

    logger.info("Бот запущен")
    await application.run_polling(allowed_updates=Update.ALL_TYPES)

# Запуск бота
if __name__ == "__main__":
    try:
        # Загружаем дополнительные запрещенные слова
        load_forbidden_words()

        # Применяем nest_asyncio для работы в Google Colab
        nest_asyncio.apply()

        # Запускаем бота
        logger.info("Запуск бота...")
        asyncio.run(main())

    except KeyboardInterrupt:
        logger.info("Бот остановлен")
    except Exception as e:
        logger.error(f"Ошибка при запуске: {str(e)}")

Collecting python-telegram-bot
  Downloading python_telegram_bot-21.6-py3-none-any.whl.metadata (17 kB)
Collecting httpx~=0.27 (from python-telegram-bot)
  Downloading httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting httpcore==1.* (from httpx~=0.27->python-telegram-bot)
  Downloading httpcore-1.0.6-py3-none-any.whl.metadata (21 kB)
Collecting h11<0.15,>=0.13 (from httpcore==1.*->httpx~=0.27->python-telegram-bot)
  Downloading h11-0.14.0-py3-none-any.whl.metadata (8.2 kB)
Downloading python_telegram_bot-21.6-py3-none-any.whl (652 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m652.1/652.1 kB[0m [31m9.3 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading httpx-0.27.2-py3-none-any.whl (76 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.4/76.4 kB[0m [31m4.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading httpcore-1.0.6-py3-none-any.whl (78 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m78.0/78.0 kB[0m [31m5.0 MB/s[0m et

ERROR:__main__:Ошибка при запуске: Cannot close a running event loop
