<a href="https://colab.research.google.com/github/OGthug-coder/fashion-product-description-ai/blob/main/fashion_content_generation_assistant.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**RAG-система для генерации описаний fashion-товаров**

Этот Colab-ноутбук содержит автоматизированную систему для создания продающих описаний одежды и аксессуаров для маркетплейсов (Ozon, Wildberries, Lamoda).

Как это работает
Система использует комбинацию искусственного интеллекта и ваших данных:

Анализирует изображения товаров с помощью компьютерного зрения

Извлекает ключевую информацию из характеристик товара

Генерирует готовые к публикации описания с SEO-оптимизацией

Что нужно сделать
- Создать бесплатный Groq API ключ https://console.groq.com/keys
- Загрузите папку с изображениями товаров в папку /content/sample_data/items

Запустите все ячейки кода последовательно

Система автоматически создаст описания для товаров

Результат
На выходе вы получите готовые тексты с:

продающими формулировками

модными характеристиками

SEO-хештегами

точными описаниями материалов и фасонов

In [None]:
# Скачивание зависимостей
!pip install --quiet groq langchain langchain-groq sentence-transformers faiss-cpu tiktoken
!pip install --quiet groq langchain langchain-groq sentence-transformers faiss-cpu tiktoken

In [None]:
# Подключение зависимостей
import os, getpass
from google.colab import userdata
from groq import Groq
from IPython.display import Markdown

In [None]:
# Чтение API ключа к сервису groq, создать ключ тут: https://console.groq.com/keys (через vpn)
try:
    os.environ['GROQ_API_KEY'] = userdata.get('GROQ_API_KEY')
except Exception as e:
    os.environ['GROQ_API_KEY'] = getpass.getpass('Введите ваш GROQ_API_KEY (скрыто): ')

In [None]:
# Создание клиента к groq
client = Groq(api_key=os.environ['GROQ_API_KEY'])

In [None]:
# функция для отправки сообщений к LLM модели и чтения ответа
def groq_chat(prompt, model='meta-llama/llama-4-scout-17b-16e-instruct'):
    messages = [{'role': 'user', 'content': prompt}]
    resp = client.chat.completions.create(model=model, messages=messages, max_tokens=500, temperature=0.2)
    return resp.choices[0].message.content

In [None]:
# Пример работы функции
display(Markdown(groq_chat("Объясни простыми словами, что такое fashion индустрия")))

**Fashion индустрия** — это огромная и многогранная сфера, которая включает в себя всё, что связано с модой и одеждой. Она объединяет людей, которые создают, производят и продают одежду, аксессуары и другие модные товары.

**Основные направления fashion индустрии:**

* **Дизайн и создание одежды**: дизайнеры создают новые модели одежды, обуви и аксессуаров, учитывая последние модные тенденции и стили.
* **Производство**: фабрики и мастерские производят одежду и аксессуары в больших масштабах.
* **Маркетинг и реклама**: компании продвигают свои бренды и продукты через рекламу, социальные сети и другие каналы.
* **Розничная торговля**: магазины и онлайн-площадки продают модные товары конечным потребителям.

**Fashion индустрия** также включает в себя:

* **Модные показы и мероприятия**: показы мод, фестивали и другие события, где дизайнеры представляют свои новые коллекции.
* **Модные журналы и блоги**: издания и онлайн-ресурсы, которые освещают последние модные тенденции и новости индустрии.
* **Инфлюенсеры и блогеры**: люди, которые имеют большое количество подписчиков в социальных сетях и продвигают модные бренды и продукты.

В целом, **fashion индустрия** — это динамичная и постоянно развивающаяся сфера, которая влияет на то, как мы одеваемся и представляем себя в мире.

In [None]:
# Простейший менеджер диалога (подходит для небольших сессий)
dialogue = []

def add_message(role, text):
    dialogue.append({'role': role, 'content': text})

def get_reply(user_text):
    add_message('user', user_text)
    max_messages = 10
    history = dialogue[-max_messages:]

    # Формируем промпт с историей
    prompt_parts = []
    for msg in history:
        prompt_parts.append(f"{msg['role']}: {msg['content']}")
    prompt_parts.append("assistant:")

    full_prompt = "\n".join(prompt_parts)

    # Получаем ответ от модели
    response = groq_chat(full_prompt)

    # Добавляем ответ в историю
    add_message('assistant', response)

    return response

# Добавляем системный промпт
add_message('system', 'Ты — профессиональный копирайтер на маркетплейсе модной одежды. Составь краткое, но яркое описание товара для карточки на Ozon. Опиши товар, его преимущества и ощущения от ношения. Используй информацию из контекста ниже. Не придумывай несуществующих деталей.')

In [None]:
# Тестируем диалог, для выхода напиши exit
msg = None
while msg != 'exit':
  msg = input('User: ')
  print('Assistant:')
  display(Markdown(get_reply(msg)))
  print('\n')

User: ривет, сгенерируй описание для черного вечернего платья
Assistant:


"Погрузитесь в мир роскоши и элегантности с нашим черным вечерним платьем!

Это потрясающее платье создано, чтобы сделать вас настоящей королевой вечера. Изготовленное из высококачественных материалов, оно поражает своей красотой и комфортом.

Стройный силуэт, тонкие детали и изящная длина делают это платье идеальным выбором для любого торжественного мероприятия. Наденьте его и почувствуйте себя настоящей звездой!

Преимущества:
- Высококачественные материалы для комфорта и долговечности
- Стройный силуэт для подчеркивания вашей фигуры
- Изящная длина для создания неповторимого образа

Приготовьтесь блистать в этом эффектном черном вечернем платье!"



User: exit
Assistant:


Не за что! Если понадобится помощь с другими описаниями или чем-то ещё, обращайся!





In [None]:
# Далее пробуем создать RAG (Retrieval-Augmented Generation) и подключить его к модели для более точных ответов
from sentence_transformers import SentenceTransformer
import faiss
import numpy as np
from langchain_groq import ChatGroq
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 1. ПОДГОТОВКА БАЗЫ ЗНАНИЙ (Документы для модных товаров)
# Это пример. В реальных задачах обычно грузится из документов.
docs = [
    # Бренды и их ДНК
    "Бренд 'North Star' ориентирован на молодежную аудиториу, сочетает уличный стиль и функциональность. Слоган: 'Вырази свой стиль'.",
    "Бренд 'La Moda' — это премиальная классика для деловых людей. Акцент на качественные материалы: итальянская шерсть, египетский хлопок.",
    "Бренд 'EcoWear' использует только экологичные материалы: органический хлопок, переработанный полиэстер, тассел. Важен акцент на устойчивости моды.",
    "Befree — российский бренд, специализирующийся на производстве мужской и женской одежды, обуви и аксессуаров. Befree следуют глобальным тенденциям и создают коллекции для всех, кто любит молодежную моду — вне зависимости от возраста, размера одежды, внешности, профессии и увлечений.",

    # Описания материалов и их преимуществ
    "Хлопок пима: обладает невероятной мягкостью и долговечностью. Дышащий материал, идеален для базового гардероба и чувствительной кожи.",
    "Мембранная ткань: технологичная ткань с защитой от ветра и воды. При этом пропускает воздух, обеспечивая комфорт при активном движении. Идеальна для курток и пуховиков.",
    "Эластан: добавляется в состав ткани для обеспечения растяжимости и эластичности. Обеспечивает идеальную посадку по фигуре и свободу движений.",

    # Стилистические советы и тренды
    "Оверсайз-крой: свободный, немаркий крой, который сейчас в тренде. Свитшоты, рубашки и пиджаки оверсайз можно сочетать с более приталенными низами.",
    "Сочетание текстур: тренд сезона - сочетать разные фактуры. Например, грубый деним с нежным шелком или кожаный пиджак с воздушным платьем.",
    "База гардероба: классическая белая рубашка, качественные джинсы с прямым кроем, малое черное платье. Эти вещи должны быть в каждом гардеробе.",

    # Ключевые слова для SEO (Озон, Wildberries)
    "Популярные запросы: джинсы женские, худи оверсайз, платье миди, куртка утепленная, рубашка мужская, кроссовки повседневные.",
    "Часто ищут по свойствам: безрукавка женская, завышенная талия, приталенный крой, на натуральном меху, с капюшоном.",
    "Актуальные тренды: вельвет, кордерой, кашкорсе, одежда в стиле авиаторов, винтажные принты, спортивный шик.",

    # Примеры описаний товаров
    """- Удлиненный женский джемпер свободного кроя из плотной 100% хлопковой ткани толстой вязки
       - Круглый вырез горловины в рубчик без воротника. Длинные свободные рукава с широкими эластичными манжетами в рубчик и спущенной линией плеча. Присборенный эластичный нижний край в рубчик. Декоративные рваные элементы
       - Рваный джемпер с принтом в романтическом стиле из новой коллекции дополнит любые образы. Сочетай его с любимым низом и создавай дерзкие и стильные аутфиты, в которых тебе будет максимально комфортно в любую погоду. Носи этот рваный вязаный пуловер отдельно или в составе трендовых многослойных образов. Создавай с джемпером с принтом образы в стиле гранж на концерты, рейвы или вечеринки, носи его с леггинсами и высокими ботинками
       - Размер на модели: S""",
    """- Удлиненная футболка унисекс свободного кроя oversize из дышащей, приятной к телу 100% хлопковой ткани средней плотности
       - Круглый вырез горловины. Удлиненные свободные рукава без отворотов со спущенной линией плеча. Прямой нижний край без разрезов и декоративных элементов
       - Футболка из коллекции Co:Create HUB, созданная с привлечением креаторов из хаба талантов. Универсальная и суперудобная хлопковая футболка с принтом под любое настроение для занятий спортом, йогой, повседневных луков и просто отдыха дома. Сочетай ее с любимым низом и создавай расслабленные и стильные кэжуал-луки, в которых тебе будет максимально удобно. Носи ее отдельно или используй в качестве основы для трендовых многослойных луков. Стильная свободная унисекс-футболка отлично подойдет как для девушек, так и для парней. Носи ее в расслабленных повседневных образах и с гордостью демонстрируй всем свою уникальность
       - Размер на модели: XS/S
    """,
    """- Женская блузка полуприлегающего кроя из легкой, приятной к телу, гладкой ткани с креповой фактурой
       - Классический отложной воротник с застежкой под горло, съемный черный галстук в комплекте. Длинные рукава с широкими манжетами на пуговицах и прямой линией плеча. Застежка на мелкие пуговицы спереди. Прямой спереди, удлиненный и закругленный сзади нижний край
       - Однотонная белая рубашка с контрастным черным галстуком в комплекте. Стильная и легкая рубашка с галстуком внесет приятное разнообразие в твой повседневный гардероб на каждый день или для особых случаев. Универсальная и практичная классическая блузка сочетается с низом в любом стиле, от классики до гранжа. Создавай ультратрендовые расслабленные луки в школу, университет или офис. Поиграй с галстуком, оставляя его распущенным, завязывая в свободный узел или широкий бант. Заверши образ удобной обувью и любимыми аксессуарами
       - Размер на модели: S"""
]



In [None]:
# 2. ЭМБЕДДИНГИ И ИНДЕКС, эмбеддинг это как библиотекарь по нашей базе знаний, индекс это инструмент для быстрого поиска информации по базе знаний
emb_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2') # Лучше для русского
doc_embs = emb_model.encode(docs, convert_to_numpy=True)

d = doc_embs.shape[1]
index = faiss.IndexFlatL2(d)
index.add(doc_embs)

def retrieve(query, k=3):
    q_emb = emb_model.encode([query], convert_to_numpy=True)
    D, I = index.search(q_emb, k=k)
    return [docs[i] for i in I[0]]

In [None]:
from langchain.schema.runnable import RunnableSequence

# 3. НАСТРОЙКА LLM И ПРОМПТА
llm = ChatGroq(
    model="meta-llama/llama-4-scout-17b-16e-instruct",
    temperature=0.7  # Немного креативности, но не слишком много
)

# Ключевые изменения здесь, промпт заточен под маркетплейс.
prompt = PromptTemplate(
    input_variables=['context', 'product_data'],
    template="""
Ты — профессиональный копирайтер для маркетплейсов Ozon и Wildberries.
Используй информацию из контекста ниже и данные о товаре, чтобы составить продающее и SEO-оптимизированное описание.

Ориентируйся на следующий пример описания: '- Женская блузка полуприлегающего кроя из легкой, приятной к телу, гладкой ткани с креповой фактурой
- Классический отложной воротник с застежкой под горло, съемный черный галстук в комплекте. Длинные рукава с широкими манжетами на пуговицах и прямой линией плеча. Застежка на мелкие пуговицы спереди. Прямой спереди, удлиненный и закругленный сзади нижний край
- Однотонная белая рубашка с контрастным черным галстуком в комплекте. Стильная и легкая рубашка с галстуком внесет приятное разнообразие в твой повседневный гардероб на каждый день или для особых случаев. Универсальная и практичная классическая блузка сочетается с низом в любом стиле, от классики до гранжа. Создавай ультратрендовые расслабленные луки в школу, университет или офис. Поиграй с галстуком, оставляя его распущенным, завязывая в свободный узел или широкий бант. Заверши образ удобной обувью и любимыми аксессуарами
- Размер на модели: S'

# КОНТЕКСТ (информация о брендах, материалах и трендах):
{context}

# ДАННЫЕ ТОВАРА:
{product_data}

# ИНСТРУКЦИИ:
1. Описание должно быть кратким, убедительным и легкочитаемым.
2. Подчеркни ключевые преимущества товара и материалы.
3. Упомяни актуальные тренды, если они уместны.
4. Укажи, для какого стиля и повода подходит вещь.
5. В конце добавь 3-5 SEO-хештегов через решетку (например, #джинсыженские).
6. Не придумывай несуществующие характеристики товара.

ОПИСАНИЕ:
"""
)

chain = RunnableSequence(first=prompt, last=llm)

In [None]:
# 4. ФУНКЦИЯ ДЛЯ ГЕНЕРАЦИИ ОПИСАНИЯ
def generate_product_description(product_data_query):
    # Извлекаем релевантный контекст для нашего товара
    context_chunks = retrieve(product_data_query, k=3)
    context = "\n".join(context_chunks)

    # Передаем контекст и данные о товаре в LLM
    result = chain.invoke({
        'context': context,
        'product_data': product_data_query
    })

    # Извлекаем текст
    if hasattr(result, 'content'):
        return result.content
    else:
        return str(result)

In [None]:
# 5. ПРИМЕР ИСПОЛЬЗОВАНИЯ
# В реальности эти данные могут приходить из CSV или API
product_info = """
Название: Джинсы North Star SLIM FIT
Бренд: North Star
Категория: Джинсы женские
Цвет: Темно-синий
Состав: 98% хлопок, 2% эластан
Размеры: 40, 42, 44, 46, 48
Особенности: Завышенная талия, прямой крой, мама-джинсы, универсальная база гардероба.
"""

description = generate_product_description(product_info)
print("СГЕНЕРИРОВАННОЕ ОПИСАНИЕ:")
print(description)
print("\n" + "-"*50 + "\n")

# Демонстрация работы поиска
print("БЫЛИ НАЙДЕНЫ СЛЕДУЮЩИЕ РЕЛЕВАНТНЫЕ ЧАНКИ:")
for i, chunk in enumerate(retrieve(product_info, k=3)):
    print(f"{i+1}. {chunk}")

СГЕНЕРИРОВАННОЕ ОПИСАНИЕ:
Женские джинсы North Star SLIM FIT темно-синего цвета - это универсальная база гардероба для современных женщин. Изготовленные из высококачественного хлопка (98%) с добавлением эластана (2%), они обеспечивают комфорт и гибкость движений.

Завышенная талия и прямой крой создают стильный и современный образ, а slim fit посадка делает их подходящими для различных типов фигур. Эти "мама-джинсы" - отличный выбор для повседневного ношения, работы или особых случаев.

Сочетайте их с любимой обувью и верхней одеждой, чтобы создать образ в любом стиле - от классического до гранжа. Благодаря своему нейтральному цвету и крою, эти джинсы станут идеальной основой для ваших outfits.

Размеры: 40, 42, 44, 46, 48.

#джинсыженские #темносиниеджинсы #slimfitджинсы

--------------------------------------------------

БЫЛИ НАЙДЕНЫ СЛЕДУЮЩИЕ РЕЛЕВАНТНЫЕ ЧАНКИ:
1. - Удлиненная футболка унисекс свободного кроя oversize из дышащей, приятной к телу 100% хлопковой ткани средней плотнос

Далее добавим в нашу модель обработку изображений товаров для более точной генерации описаний

In [None]:
# Функция для поиска всех изображений в указанной папке

import os
import glob

def get_image_paths(folder_path):
    """
    Извлекает пути ко всем изображениям в папке и её подпапках.
    Использует метод из :cite[7]
    """
    image_extensions = ['.png', '.jpg', '.jpeg', '.bmp', '.tif', '.tiff', '.webp']
    image_paths = []

    # Рекурсивный обход папок
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            ext = os.path.splitext(file)[-1].lower()
            if ext in image_extensions:
                full_path = os.path.join(root, file)
                image_paths.append(full_path)

    # Сортировка для предсказуемости порядка
    image_paths.sort()
    return image_paths

In [None]:
# Дополняем импорты
from transformers import BlipProcessor, BlipForConditionalGeneration
import torch
from PIL import Image

# --- КОНФИГУРАЦИЯ МОДЕЛЕЙ ---
# Инициализация модели для описания изображений (один раз при запуске)
device = "cuda" if torch.cuda.is_available() else "cpu"
processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base").to(device)

# Функция для генерации описания изображения
def describe_image(image_path):
    try:
        raw_image = Image.open(image_path).convert('RGB')
        inputs = processor(raw_image, return_tensors="pt").to(device)
        out = model.generate(**inputs, max_length=50)
        caption = processor.decode(out[0], skip_special_tokens=True)
        return caption
    except Exception as e:
        print(f"Ошибка обработки {image_path}: {str(e)}")
        return ""

# Обрабатывает все изображения в папке и возвращает объединённое описание
def process_all_images(folder_path):
    image_paths = get_image_paths(folder_path)

    all_descriptions = []

    for img_path in image_paths:
        desc = describe_image(img_path)
        if desc:
            all_descriptions.append(f"{desc}")

    # Объединяем все описания в один текст
    return ", ".join(all_descriptions)

# --- МОДИФИКАЦИЯ ФУНКЦИИ ГЕНЕРАЦИИ ---
# Усовершенствованная функция генерации описания.
# Если указан путь к папке с изображениями, извлекает из них визуальные признаки.
def generate_product_description(product_data_query, image_folder_path=None):

    # Базовый контекст из текстовых данных
    context_chunks = retrieve(product_data_query, k=3)
    context = "\n".join(context_chunks)

    # Визуальный контекст из изображений
    visual_context = ""

    if image_folder_path and os.path.exists(image_folder_path):
        visual_context = process_all_images(image_folder_path)
        # Добавляем визуальный контекст к общему контекст
        context = visual_context + "\n" + context

    # Передаем контекст и данные о товаре в LLM
    result = chain.invoke({
        'context': context,
        'product_data': product_data_query
    })

    # Извлекаем текст
    if hasattr(result, 'content'):
        return result.content
    else:
        return str(result)

Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.52, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.


Fetching 1 files:   0%|          | 0/1 [00:00<?, ?it/s]

In [None]:
# --- ПРИМЕР ИСПОЛЬЗОВАНИЯ ---
product_info = product_info = """
Название: Джинсы Zarina
Бренд: Zarina
Категория: Джинсы женские
Цвет: Темно-синий
Состав: 100% хлопок
Размеры:
50/164 RUS
50/164 RUS
52/164 RUS
52/164 RUS
54/164 RUS
54/164 RUS
40/170 RUS
40/170 RUS
42/170 RUS
42/170 RUS
44/170 RUS
44/170 RUS
46/170 RUS
46/170 RUS
48/170 RUS
48/170 RUS
50/170 RUS
50/170 RUS
52/170 RUS
52/170 RUS
54/170 RUS
54/170 RUS
40/176 RUS
40/176 RUS
42/176 RUS
42/176 RUS
44/176 RUS
44/176 RUS
Особенности: Посадка Высокая.
Размер товара на модели 42/170 RUS
"""

image_folder = "/content/sample_data/items/jeans/zarina_blue_jeans"

description = generate_product_description(product_info, image_folder_path=image_folder)
print(description)

Джинсы Zarina - это стильные и комфортные джинсы темно-синего цвета из 100% хлопка. Высокая посадка обеспечивает отличную поддержку и делает их идеальными для повседневного ношения.

Свободный крой и эластичная ткань позволяют создать расслабленный и стильный образ. Джинсы Zarina подходят для различных стилей и поводов - от casual до streetwear.

Носи их с любимой обувью и верхней одеждой, чтобы создать свой уникальный образ.

#джинсыженские #темносиниеджинсы #zarinad jeans


In [None]:
# --- ПРИМЕР ИСПОЛЬЗОВАНИЯ ---
product_info = product_info = """
Название: Футболка-бойфренд Берегите птиц
Бренд: Берегите птиц
Категория: футболка женская
Цвет: Красная-красный;бежевый
Состав: 95% хлопок, 5% лайкра
Размеры: 42-48 RU (one-size)
Особенности: Футболка свободного удлиненного силуэта
"""

image_folder = "/content/sample_data/items/shirts/beregite_ptic_shirt"

description = generate_product_description(product_info, image_folder_path=image_folder)
print(description)

Футболка-бойфренд Берегите птиц - это стильная и удобная вещь для современных женщин. Изготовлена из высококачественного материала: 95% хлопка и 5% лайкры, что обеспечивает комфорт и свободу движений.

Удлиненный свободный силуэт и мягкая ткань делают эту футболку идеальной для повседневного ношения. Модель подходит для создания расслабленных и стильных луков, как для casual-образов, так и для более официальных мероприятий.

Благодаря своему универсальному дизайну, эта футболка легко сочетается с различными видами одежды: джинсами, юбками, шортами и т.д. Вы можете носить ее как отдельно, так и в качестве базового слоя для многослойных образов.

Размер: 42-48 RU (one-size), что делает ее доступной для широкого круга покупателей.

Добавьте эту футболку в свой гардероб и создавайте стильные и комфортные образы каждый день!

#футболкиженские #одеждадляженщин #стильнаяодежда
