In [5]:
import pandas as pd
import random

# Define maximum token limit for the prompt
MAX_TOKENS = 2048

def generate_prompt_from_excel(excel_file, max_examples=30):
    prompt = "Task: Translate customer requests to positions in the catalog.\n"
    prompt += "Dataset:\n\n"
    examples = []

    df = pd.read_excel(excel_file)
    for _, row in df.iterrows():
        input_text = row['Наименование заказчика']
        output_text = [
            f"Ед. Изм.\t- {row['Ед. Изм.']}",
            f"Простая/составная\t- {row['Простая/составная']}",
            f"Продукт/рукав\t- {row['Продукт/рукав']}",
            f"Длина\t- {row['Длина']}",
            f"Фитинг левый\t- {row['Фитинг левый']}",
            f"Фитинг правый\t- {row['Фитинг правый']}",
        ]
        examples.append((input_text, output_text))

    # Shuffle examples and select a subset
    random.shuffle(examples)
    examples = examples[:max_examples]

    for input_text, output_text in examples:
        prompt += f"Input: {input_text}\n"
        prompt += "Output:\n"
        prompt += '\n'.join(output_text) + '\n\n'

    # Add context
    prompt += "Context: The inputs contain a mix of Russian and English words along with technical specifications like DN sizes, fittings, and standards such as ГОСТ. Ensure the output provides the corresponding product, its unit of measurement, whether it's simple or compound, length, and left and right fittings."

    return prompt

# Example usage:
excel_file = '/app/Fayl_dlya_raboty.xlsx'  # Replace with your Excel file path
prompt = generate_prompt_from_excel(excel_file)
print(prompt)

Task: Translate customer requests to positions in the catalog.
Dataset:

Input: Рукав 15,9-110-1000-0,2-11/11-М27х1,5
Output:
Ед. Изм.	- шт.
Простая/составная	- Составная
Продукт/рукав	- 2SN DN16
Длина	- 1000
Фитинг левый	- DKOL27X1,5DN16
Фитинг правый	- DKOL27X1,5DN16

Input: РВД HDB520-PA420SF9V4A-90-920X/GEVS
Output:
Ед. Изм.	- шт.
Простая/составная	- Составная
Продукт/рукав	- 4SH DN19
Длина	- 920
Фитинг левый	- SFS41,3DN19
Фитинг правый	- SFS41,3(90)DN19

Input: РВД D12 P350 2SN DKOS M24*1,5 L2600 DIN853
Output:
Ед. Изм.	- Шт.
Простая/составная	- Составная
Продукт/рукав	- 2SN-K DN12
Длина	- 2600
Фитинг левый	- DKOS24x1,5DN12
Фитинг правый	- DKOS24x1,5DN12

Input: Фитинг JIC-(Г)-9/16"-18-45-8
Output:
Ед. Изм.	- шт.
Простая/составная	- Простая
Продукт/рукав	- JIC9/16"(45)DN8
Длина	- нет
Фитинг левый	- нет
Фитинг правый	- нет

Input: РВД 2SC-16-280-1500 DKOS(Г) M30х2
Output:
Ед. Изм.	- шт.
Простая/составная	- Составная
Продукт/рукав	- 2SN DN16
Длина	- 1500
Фитинг левый	- DKOS30x2DN16
