# RAG
В этом ноутбуке реализован подход Retrieval-Augmented Generation (RAG) для генерации описаний одежды. Возможности генеративной модели комбинируются с релевантными примерами из обучающего датасета.  

Для этого используется:
- модель `SentenceTransformers` модель для построения эмбеддингов входных характеристик
- FAISS-индекс для поиска ближайших соседей
- извлеченные примеры, которые вместе с входными характеристиками подаются в промпт модели.  

Цель — повысить качество описаний за счёт ориентации на реальные примеры и понизить вероятность галлюцинаций.  

In [1]:
!pip install sentence-transformers faiss-cpu

Collecting faiss-cpu
  Downloading faiss_cpu-1.11.0.post1-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (5.0 kB)
Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch>=1.11.0->sentence-transformers)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch>=1.11.0->sentence-transformers)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch>=1.11.0->sentence-transformers)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch>=1.11.0->sentence-transformers)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch>=1.11.0->sentence-transformers)
  Downloading nvidia_cublas_cu12-12.4.5.8-

## 1. Загрузка и подготовка данных

In [2]:
import faiss
import pandas as pd
import numpy as np
import openai
from sentence_transformers import SentenceTransformer

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
# беру те же датасеты, что и в rut5, gpt
df_train = pd.read_csv('drive/MyDrive/proj_cloth_desc_gen/df_train.csv', index_col =0).reset_index(drop=True)
df_val = pd.read_csv('drive/MyDrive/proj_cloth_desc_gen/df_val.csv', index_col =0).reset_index(drop=True)

In [5]:
# удаляю инструкцию
df_train["input"] = df_train["input"].str.replace("Сгенерируй описание одежды для карточки товара:\n", "", regex=False)
df_val["input"] = df_val["input"].str.replace("Сгенерируй описание одежды для карточки товара:\n", "", regex=False)

## 2. Подбор параметров RAG (SentenceTransformer + нормализация)
Сравним на нескольких примеров качество генерации и найденные похожие примеры для разных моделей построения эмбеддингов:
- all-MiniLM-L6-v2
- paraphrase-multilingual-MiniLM-L12-v2
  
А также с использованием и без использования нормализации эмбеддингов

In [6]:
# функция построения FAISS индекса
def build_faiss_index(model_name="all-MiniLM-L6-v2", normalize=False):

    # Переводим входные тексты в эмбеддинги
    model = SentenceTransformer(model_name)
    texts = df_train["input"].tolist()
    embeddings = model.encode(texts, convert_to_numpy=True)

    if normalize:
        # нормализуем эмбеддинги по длине (норма 1)
        embeddings = embeddings / np.linalg.norm(embeddings, axis=1, keepdims=True)
        # поиск ближайших соседей по косинусному сходству
        index = faiss.IndexFlatIP(embeddings.shape[1])
    else:
        # поиск по евклидовому расстоянию
        index = faiss.IndexFlatL2(embeddings.shape[1])

    # добавляем эмбеддинг в индекс
    index.add(embeddings)
    return index, embeddings, model


In [7]:
# функция поиска k ближайших примеров из train датасета на основе FAISS-индекса
def retrieve_similar_examples(query, index, model, normalize=False, k=3):
    
    query_emb = model.encode(query, convert_to_numpy=True).reshape(1, -1)
    if normalize:
        query_emb = query_emb / np.linalg.norm(query_emb, axis=1, keepdims=True)

    distances, indices = index.search(query_emb, k)
    return df_train.iloc[indices[0]]

# функция генерации описания при помощи RAG
def generate_description_rag(input_text, index, model, normalize=False, k=3):
    # K близжайших примеров на train датасете по входному тексту
    retrieved = retrieve_similar_examples(input_text, index, model, normalize, k)

    # добавляем инструкцию + похожие примеры + входной текст
    prompt = "Сгенерируй описание одежды по характеристикам. Не выдумывай того, чего нет.\n"
    for _, row in retrieved.iterrows():
        prompt += f"\nХарактеристики:\n{row['input']}\nОписание:\n{row['final_desc']}\n"

    prompt += f"\nХарактеристики:\n{input_text}\nОписание:\n"

    # генерация через OpenAI
    response = client.chat.completions.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.7,
        top_p=0.95,
        max_tokens=512,
        timeout=60
    )
    return retrieved, response.choices[0].message.content


In [8]:
from getpass import getpass
import openai

openai.api_key = getpass("Введи OpenAI API ключ: ")

Введи OpenAI API ключ: ··········


In [9]:
client = openai.OpenAI(api_key=openai.api_key)

In [10]:
# рандломные примеры
df_sample = df_val.sample(5, random_state = 42)
inp = df_sample['input'].tolist()

In [11]:
# all-MiniLM-L6-v2 без нормализации
idx_1, emb_1, model_1 = build_faiss_index(model_name="all-MiniLM-L6-v2", normalize=False)
emb_1.shape

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/612 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

(44727, 384)

In [29]:
serch_list, gen_list = [], []
for i in inp:
  df_serch, gen_rag = generate_description_rag(i, idx_1, model_1, normalize=False, k=3)
  serch_list.append(df_serch['input'].tolist())
  gen_list.append(gen_rag)
df_sample['l6_k'] = serch_list
df_sample['l6_gen'] = gen_list

In [13]:
# all-MiniLM-L6-v2 с нормализацией
idx_2, emb_2, model_2 = build_faiss_index(model_name="all-MiniLM-L6-v2", normalize=True)
emb_2.shape

(44727, 384)

In [28]:
serch_list, gen_list = [], []
for i in inp:
  df_serch, gen_rag = generate_description_rag(i, idx_2, model_2, normalize=True, k=3)
  serch_list.append(df_serch['input'].tolist())
  gen_list.append(gen_rag)
df_sample['l6_norm_k'] = serch_list
df_sample['l6_norm_gen'] = gen_list

In [30]:
# paraphrase-multilingual-MiniLM-L12-v2 без нормализации
idx_3, emb_3, model_3 = build_faiss_index(model_name="paraphrase-multilingual-MiniLM-L12-v2", normalize=False)
emb_3.shape

modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/645 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/471M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.08M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

(44727, 384)

In [31]:
serch_list, gen_list = [], []
for i in inp:
  df_serch, gen_rag = generate_description_rag(i, idx_3, model_3, normalize=False, k=3)
  serch_list.append(df_serch['input'].tolist())
  gen_list.append(gen_rag)
df_sample['l12_k'] = serch_list
df_sample['l12_gen'] = gen_list

In [32]:
# paraphrase-multilingual-MiniLM-L12-v2 с нормализацией
idx_4, emb_4, model_4 = build_faiss_index(model_name="paraphrase-multilingual-MiniLM-L12-v2", normalize=True)
emb_4.shape

(44727, 384)

In [33]:
serch_list, gen_list = [], []
for i in inp:
  df_serch, gen_rag = generate_description_rag(i, idx_4, model_4, normalize=True, k=3)
  serch_list.append(df_serch['input'].tolist())
  gen_list.append(gen_rag)
df_sample['l12_norm_k'] = serch_list
df_sample['l12_norm_gen'] = gen_list

In [37]:
for _, row in df_sample.iterrows():
  print(f"Input text:\n{row['input']}\n")
  print(f"True target:\n{row['final_desc']}\n")
  print(f"all-MiniLM-L6-v2:\n{row['l6_gen']}\n")
  print(f"all-MiniLM-L6-v2 normalized:\n{row['l6_norm_gen']}\n")
  print(f"paraphrase-multilingual-MiniLM-L12-v2:\n{row['l12_gen']}\n")
  print(f"paraphrase-multilingual-MiniLM-L12-v2 normalized:\n{row['l12_norm_gen']}\n")

Input text:
Наименование товара: Брюки классические прямые
Сезон: круглогодичный
Особенности модели: дышащий материал; немнущийся материал; эластичный материал
Тип посадки: средняя
Страна производства: Турция
Вид застежки: молния
Тип карманов: прорезные; косые
Комплектация: брюки - 1 шт.
Декоративные элементы: без стрелок

True target:
Брюки мужские классические демисезонные. Осенние костюмные брюки поразят вас своеи универсальностью, ведь они почти не мнутся и требуют минимального дополнительного ежедневного ухода. Такие повседневные штаны подходят для парнеи и мужчин, позволят быть одновременно стильными и брутальными. Прямые брюки без стрелок идеальны как праздничные для похода на свадьбу или юбилеи и как деловые для похода в офис на работу. Черные брюки будут оценены школьниками и студентами. Даже если раньше вы не носили классику в школу или универ, то сеичас не сможете устоять. Наши всесезонные брюки немного тянутся, имеют передние косые и задние прорезные карманы. Вечерние брюки

В целом качество генерации для всех конфигураций довольно приличное. Серьезные галлюцинации практически отсутсвуют.
Иногда проскакивают мелкие галлюцинации — например:
- выдумывает состав: «100% хлопок», «натуральный шелк»
- приписывает качества: «премиум-материалы», «долговечность», «сохраняет форму»

Нормализованные модели дают более шаблонный и менее детализированный текст  
Ненормализованные модели дают больше конкретики, тексты ближе по стилю к таргету 


Теперь посмотрим на релевантность близжайших примеров

In [38]:
for _, row in df_sample.iterrows():
  print(f"Input text:\n{row['input']}\n")
  print(f"all-MiniLM-L6-v2:\n{row['l6_k']}\n")
  print(f"all-MiniLM-L6-v2 normalized:\n{row['l6_norm_k']}\n")
  print(f"paraphrase-multilingual-MiniLM-L12-v2:\n{row['l12_k']}\n")
  print(f"paraphrase-multilingual-MiniLM-L12-v2 normalized:\n{row['l12_norm_k']}\n")

Input text:
Наименование товара: Брюки классические прямые
Сезон: круглогодичный
Особенности модели: дышащий материал; немнущийся материал; эластичный материал
Тип посадки: средняя
Страна производства: Турция
Вид застежки: молния
Тип карманов: прорезные; косые
Комплектация: брюки - 1 шт.
Декоративные элементы: без стрелок

all-MiniLM-L6-v2:
['Наименование товара: Брюки классические зауженные\nСезон: круглогодичный\nОсобенности модели: дышащий материал\nТип посадки: средняя\nСтрана производства: Китай\nВид застежки: пуговицы; молния\nТип карманов: прорезные\nКомплектация: брюки мужские - 1 шт\nДекоративные элементы: без элементов', 'Наименование товара: Брюки мужские утепленные оверсайз спортивные\nСезон: круглогодичный\nОсобенности модели: дышащий материал; утепленные; с начесом\nТип посадки: средняя\nСтрана производства: Узбекистан\nВид застежки: завязки; шнуровка\nТип карманов: прорезные\nКомплектация: Брюки - 1 шт.\nДекоративные элементы: без элементов; молния; вышивка', 'Наименован

Видно, что `paraphrase-multilingual-MiniLM-L12-v2` дает более релевантные примеры, чем `all-MiniLM-L6-v2`

Например, для «Праздничное платье рубашка на Новый год приталенное» `all-MiniLM-L6-v2` выдает в качестве близжайших примеров:

1. Приталенная рубашка корсетного типа
2. Туника вязаная больших размеров
3. Пальто классическое демисезонное
   
что не совсем релевантно для рассматриваемого примера

Так как качество подобранных примеров определяет стабильность RAG, выбираю paraphrase-multilingual-MiniLM-L12-v2.  
Ненормализованная версия даёт более богатый и рекламный стиль описаний при сохранении приемлемой фактичности, поэтому выбираю paraphrase-multilingual-MiniLM-L12-v2 без нормализации.

In [39]:
# сохраняем индекс
faiss.write_index(idx_3, "drive/MyDrive/proj_cloth_desc_gen/final_idx.index")

In [57]:
# сохраняем эмбеддинги
df_embeddings = pd.DataFrame({
    "text": df_train["input"].tolist(),
    "embedding": [emb.tolist() for emb in emb_3],
    "final_desc": df_train["final_desc"].tolist(),
})
df_embeddings.to_parquet("drive/MyDrive/proj_cloth_desc_gen/embeddings.parquet")

## 3. Генерация текста
Беру сэмпл из 200 примеров из тестовой выборки. Для каждого примера генерирую описание и сохраняю результат в CSV. 

In [48]:
index = faiss.read_index("drive/MyDrive/proj_cloth_desc_gen/final_idx.index")

In [52]:
df_test =  pd.read_csv('drive/MyDrive/proj_cloth_desc_gen/df_sample_pred.csv', index_col =0).reset_index(drop=True)
df_test["input"] = df_test["input"].str.replace("Сгенерируй описание одежды для карточки товара:\n", "", regex=False)

In [58]:
df_embeddings = pd.read_parquet("drive/MyDrive/proj_cloth_desc_gen/embeddings.parquet")
df_embeddings

Unnamed: 0,text,embedding,final_desc
0,Наименование товара: Костюм Деда Мороза\nОсобе...,"[-0.21763770282268524, 0.250986784696579, 0.06...",Предлагаем вашему вниманию идеальныи мужскои в...
1,Наименование товара: Куртка зимняя с капюшоном...,"[-0.16727910935878754, 0.12410808354616165, 0....",DESPORT это качественные и доступные спортивны...
2,Наименование товара: Однотонная футболка поло ...,"[0.22782951593399048, 0.3239396810531616, -0.0...",Рубашка поло с коротким рукавом прямого кроя с...
3,Наименование товара: Зимняя куртка (бушлат) ВК...,"[-0.18706287443637848, 0.22443805634975433, 0....",Куртка зимняя ВКБОВКПО предназначена для испол...
4,Наименование товара: Новогодняя футболка с над...,"[-0.15429887175559998, 0.26661792397499084, -0...",Женская футболка от бренда со стразами это иде...
...,...,...,...
44722,Наименование товара: Топ бандо без лямок\nПокр...,"[-0.10823718458414078, 0.1371346116065979, 0.0...",Топ женскии бандо без чашек от бренда - это кл...
44723,Наименование товара: Толстовка на молнии оверс...,"[-0.15855193138122559, 0.030281798914074898, 0...",Толстовка женская на молнии с принтом диснеи м...
44724,Наименование товара: Прозрачный лонгслив облег...,"[-0.08728830516338348, 0.22507517039775848, 0....",Полупрозрачныи лонгслив это отличныи выбор для...
44725,Наименование товара: Свитер свободный с грибам...,"[-0.12986910343170166, 0.1911398321390152, 0.0...","Свитер изготовлен в России, универсальныи свит..."


In [60]:
model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")

In [59]:
# функция поиска k ближайших примеров 
def retrieve_similar_examples(query, index, model, df, normalize=False, k=3):
    query_emb = model.encode(query, convert_to_numpy=True).reshape(1, -1)
    if normalize:
        query_emb = query_emb / np.linalg.norm(query_emb, axis=1, keepdims=True)

    distances, indices = index.search(query_emb, k)
    return df.iloc[indices[0]]

# функция генерации описания при помощи RAG
def generate_description_rag(input_text, index, model, df, normalize=False, k=3):
    retrieved = retrieve_similar_examples(input_text, index, model, df, normalize, k)

    prompt = "Сгенерируй описание одежды по характеристикам. Не выдумывай того, чего нет.\n"
    for _, row in retrieved.iterrows():
        prompt += f"\nХарактеристики:\n{row['text']}\nОписание:\n{row['final_desc']}\n"

    prompt += f"\nХарактеристики:\n{input_text}\nОписание:\n"

    response = client.chat.completions.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.7,
        top_p=0.95,
        max_tokens=512,
        timeout=60
    )
    return retrieved, response.choices[0].message.content


In [61]:
# генерирую описания на тесте
from tqdm import tqdm

gen_list = []
for i, row in tqdm(df_test.iterrows(), total=len(df_test)):
    try:
      __, gen_rag = generate_description_rag(row["input"], index, model, df_embeddings, normalize=False, k=3)
      gen_list.append(gen_rag)

    except Exception as e:
        print(f"Ошибка на {i}: {e}")
        gen_list.append("")


 80%|███████▉  | 159/200 [49:04<07:30, 10.98s/it]

Ошибка на 158: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 80%|████████  | 160/200 [49:06<05:27,  8.19s/it]

Ошибка на 159: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 80%|████████  | 161/200 [49:08<04:03,  6.24s/it]

Ошибка на 160: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 81%|████████  | 162/200 [49:09<03:05,  4.88s/it]

Ошибка на 161: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 82%|████████▏ | 163/200 [49:11<02:23,  3.87s/it]

Ошибка на 162: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 82%|████████▏ | 164/200 [49:12<01:53,  3.16s/it]

Ошибка на 163: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 82%|████████▎ | 165/200 [49:14<01:33,  2.66s/it]

Ошибка на 164: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 83%|████████▎ | 166/200 [49:16<01:20,  2.36s/it]

Ошибка на 165: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 84%|████████▎ | 167/200 [49:17<01:09,  2.11s/it]

Ошибка на 166: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 84%|████████▍ | 168/200 [49:19<01:02,  1.96s/it]

Ошибка на 167: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 84%|████████▍ | 169/200 [49:20<00:56,  1.83s/it]

Ошибка на 168: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 85%|████████▌ | 170/200 [49:22<00:53,  1.77s/it]

Ошибка на 169: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 86%|████████▌ | 171/200 [49:23<00:49,  1.70s/it]

Ошибка на 170: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 86%|████████▌ | 172/200 [49:25<00:46,  1.68s/it]

Ошибка на 171: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 86%|████████▋ | 173/200 [49:26<00:43,  1.61s/it]

Ошибка на 172: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 87%|████████▋ | 174/200 [49:28<00:40,  1.56s/it]

Ошибка на 173: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 88%|████████▊ | 175/200 [49:30<00:39,  1.58s/it]

Ошибка на 174: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 88%|████████▊ | 176/200 [49:31<00:37,  1.56s/it]

Ошибка на 175: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 88%|████████▊ | 177/200 [49:33<00:37,  1.61s/it]

Ошибка на 176: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 89%|████████▉ | 178/200 [49:34<00:34,  1.56s/it]

Ошибка на 177: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 90%|████████▉ | 179/200 [49:36<00:32,  1.57s/it]

Ошибка на 178: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 90%|█████████ | 180/200 [49:37<00:30,  1.54s/it]

Ошибка на 179: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 90%|█████████ | 181/200 [49:39<00:28,  1.52s/it]

Ошибка на 180: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 91%|█████████ | 182/200 [49:40<00:28,  1.57s/it]

Ошибка на 181: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 92%|█████████▏| 183/200 [49:42<00:26,  1.56s/it]

Ошибка на 182: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 92%|█████████▏| 184/200 [49:43<00:24,  1.53s/it]

Ошибка на 183: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 92%|█████████▎| 185/200 [49:45<00:22,  1.52s/it]

Ошибка на 184: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 93%|█████████▎| 186/200 [49:47<00:21,  1.56s/it]

Ошибка на 185: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 94%|█████████▎| 187/200 [49:48<00:19,  1.53s/it]

Ошибка на 186: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 94%|█████████▍| 188/200 [49:50<00:18,  1.58s/it]

Ошибка на 187: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 94%|█████████▍| 189/200 [49:51<00:17,  1.62s/it]

Ошибка на 188: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 95%|█████████▌| 190/200 [49:53<00:16,  1.61s/it]

Ошибка на 189: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 96%|█████████▌| 191/200 [49:55<00:14,  1.62s/it]

Ошибка на 190: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 96%|█████████▌| 192/200 [49:56<00:12,  1.62s/it]

Ошибка на 191: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 96%|█████████▋| 193/200 [49:58<00:11,  1.67s/it]

Ошибка на 192: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 97%|█████████▋| 194/200 [50:00<00:09,  1.65s/it]

Ошибка на 193: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 98%|█████████▊| 195/200 [50:01<00:08,  1.65s/it]

Ошибка на 194: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 98%|█████████▊| 196/200 [50:03<00:06,  1.60s/it]

Ошибка на 195: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 98%|█████████▊| 197/200 [50:06<00:05,  1.97s/it]

Ошибка на 196: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


 99%|█████████▉| 198/200 [50:07<00:03,  1.86s/it]

Ошибка на 197: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


100%|█████████▉| 199/200 [50:09<00:01,  1.79s/it]

Ошибка на 198: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}


100%|██████████| 200/200 [50:10<00:00, 15.05s/it]

Ошибка на 199: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, read the docs: https://platform.openai.com/docs/guides/error-codes/api-errors.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}





In [62]:
df_test['rag_gen'] = gen_list
df_test.to_csv('drive/MyDrive/proj_cloth_desc_gen/df_sample_pred.csv')