In [None]:
import pandas as pd

# Допустим, у вас есть DataFrame с текстовым столбцом 'text'
df = pd.DataFrame({'text': ['пример 1', 'пример 2', 'пример 3']})

# Функция, которая применяет модель к одному элементу (промпту)
def apply_model_to_prompt(text):
    # Здесь код вызова модели по промпту с текстом
    # Например, результат - просто текст с допиской для примера
    return f"Результат модели: {text}"

# Применяем функцию к столбцу 'text'
df['model_result'] = df['text'].apply(apply_model_to_prompt)

print(df)


In [None]:
# Код:
"Напиши оптимальное решение на Python для задачи: [описание]. Используй только чистый код без пояснений."

# Математика:
"Реши задачу: [условие]. Действуй шаг за шагом. Ответ выведи в виде \\boxed{...}"

# Классификация:
"Текст: '{text}'. Выбери один класс: {labels}. Ответь только названием класса."

# Изображение:
"Опиши содержимое изображения. Что на нём изображено? Ответь кратко."

In [None]:

"""
ОЛИМПИАДНЫЙ LLM-ФРЕЙМВОРК: ПРЯМОЙ КОД ДЛЯ КОПИРОВАНИЯ — БЕЗ АБСТРАКЦИЙ
===================================================================================

Цель: 1 задача = 1 копируемый кусок кода.  
Модель = конкретная строка.  
Промпт = конкретный формат.  
Результат = готовый ответ.

"""

# === СЛУЧАЙ 1: ГЕНЕРАЦИЯ КОДА — Llama-3-8B-Instruct ===
# Модель: meta-llama/Meta-Llama-3-8B-Instruct
# Задача: генерация оптимального решения на Python
def solve_code_generation_llama3():
    """
    Генерация кода для олимпиадных задач (Codeforces, AtCoder, LeetCode).
    Модель: Llama-3-8B-Instruct (для локального запуска)
    Промпт: системный + пользовательский (чат-формат)
    """
    import torch
    from transformers import AutoTokenizer, AutoModelForCausalLM

    # Загрузка модели
    model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.float16,
        device_map="auto"
    )

    # Промпт для задачи
    problem_description = """
    Задача: Дан массив целых чисел. Найди максимальное произведение двух чисел.
    Ограничения: 2 <= n <= 10^5, -10^3 <= arr[i] <= 10^3
    Требуется: O(n log n) или O(n) решение на Python
    """

    # Формирование промпта (чат-формат Llama-3)
    prompt = f"""<|begin_of_text|><|start_header_id|>user<|end_header_id|>

    {problem_description}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

    ```python
    def max_product(arr):
        arr.sort()
        n = len(arr)
        # Произведение двух наибольших чисел
        max1 = arr[-1] * arr[-2]
        # Произведение двух наименьших (если оба отрицательные)
        max2 = arr[0] * arr[1]
        return max(max1, max2)

    # Пример использования
    arr = [3, 4, 5, 2]
    print(max_product(arr))  # 20
    ```

    """  # <|eot_id|> — конец ответа для Llama-3

    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=2048).to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=512,
            temperature=0.1,  # детерминированность
            top_p=0.9,
            pad_token_id=tokenizer.eos_token_id
        )
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=False)
    # Извлечение только ответа (после assistant)
    assistant_start = response.find("<|start_header_id|>assistant<|end_header_id|>") + len("<|start_header_id|>assistant<|end_header_id|>")
    code_response = response[assistant_start:].split("<|eot_id|>")[0].strip()
    return code_response


In [None]:

# === СЛУЧАЙ 2: МАТЕМАТИЧЕСКОЕ РАССУЖДЕНИЕ — Mistral-7B-Instruct ===
# Модель: mistralai/Mistral-7B-Instruct-v0.3
# Задача: доказательство, решение уравнений, олимпиадная математика
def solve_math_reasoning_mistral():
    """
    Математические задачи с рассуждением.
    Модель: Mistral-7B-Instruct (хорош для логики и шагов)
    Промпт: [INST]...[/INST] — формат для Mistral
    """
    import torch
    from transformers import AutoTokenizer, AutoModelForCausalLM

    model_name = "mistralai/Mistral-7B-Instruct-v0.3"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.float16,
        device_map="auto"
    )

    problem = """
    Решите уравнение: log₂(x) + log₂(x-3) = 2
    Укажи допустимые значения x и приведи полное решение.
    """

    # Формат для Mistral: [INST]...[/INST]
    prompt = f"""[INST]{problem}[/INST]

    Шаг 1: Найдем ОДЗ. log₂(x) определен при x > 0, log₂(x-3) при x-3 > 0 → x > 3.
    Следовательно, x > 3.

    Шаг 2: Применим свойство логарифмов: log_a(m) + log_a(n) = log_a(mn).
    log₂(x) + log₂(x-3) = log₂(x(x-3)) = log₂(x² - 3x) = 2

    Шаг 3: По определению логарифма: x² - 3x = 2² = 4
    x² - 3x - 4 = 0

    Шаг 4: Решим квадратное уравнение:
    D = 9 + 16 = 25
    x = (3 ± 5)/2 → x₁ = 4, x₂ = -1

    Шаг 5: Проверка ОДЗ: x > 3. Только x = 4 подходит.

    Ответ: x = 4
    Проверка: log₂(4) + log₂(1) = 2 + 0 = 2 ✓
    """

    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=2048).to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=1024,
            temperature=0.1,
            top_p=0.95,
            pad_token_id=tokenizer.eos_token_id
        )
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    # Извлечение ответа (после [/INST])
    if "[/INST]" in response:
        return response.split("[/INST]")[1].strip()
    return response


In [None]:

# === СЛУЧАЙ 3: МАССОВЫЙ ИНФЕРЕНС — vLLM (Mistral-7B) ===
# Модель: mistralai/Mistral-7B-Instruct-v0.3
# Задача: обработка 100+ запросов быстро
def batch_inference_vllm():
    """
    Высокопроизводительный инференс для олимпиад с vLLM.
    Модель: Mistral-7B (быстрый, хорош для параллельного инференса)
    Использование: когда нужно быстро обработать много задач.
    """
    from vllm import LLM, SamplingParams

    model_name = "mistralai/Mistral-7B-Instruct-v0.3"
    llm = LLM(
        model=model_name,
        tensor_parallel_size=torch.cuda.device_count(),
        dtype="half",
        max_model_len=2048
    )

    # Запросы для обработки
    prompts = [
        "[INST]Найди НОД(48, 18)[/INST]",
        "[INST]Реши: 2x + 5 = 13[/INST]",
        "[INST]Что такое бином Ньютона?[/INST]",
        "[INST]Как работает алгоритм Дейкстры?[/INST]"
    ]

    sampling_params = SamplingParams(
        temperature=0.1,
        top_p=0.9,
        max_tokens=256
    )

    outputs = llm.generate(prompts, sampling_params)

    results = []
    for output in outputs:
        generated_text = output.outputs[0].text
        # Извлечение после [/INST]
        if "[/INST]" in generated_text:
            extracted = generated_text.split("[/INST]")[1].strip()
        else:
            extracted = generated_text.strip()
        results.append(extracted)
    
    return results


In [None]:

# === СЛУЧАЙ 4: МУЛЬТИМОДАЛЬНОЕ РАССУЖДЕНИЕ — Qwen-VL ===
# Модель: Qwen/Qwen-VL-Chat
# Задача: анализ изображений с текстом (графики, диаграммы, схемы)
def solve_vision_qwen_vl():
    """
    Визуально-языковое моделирование для задач с изображениями.
    Модель: Qwen-VL (отлично для анализа графиков, диаграмм)
    Вход: изображение + текстовый вопрос
    """
    from transformers import Qwen2VLForConditionalGeneration, Qwen2VLProcessor
    from PIL import Image
    import requests
    from io import BytesIO

    model_name = "Qwen/Qwen2-VL-7B-Instruct"
    processor = Qwen2VLProcessor.from_pretrained(model_name)
    model = Qwen2VLForConditionalGeneration.from_pretrained(
        model_name,
        torch_dtype=torch.bfloat16,
        device_map="auto"
    ).eval()

    # Загрузка изображения (заменить на свой путь)
    # image_url = "https://example.com/graph.png"
    # image = Image.open(requests.get(image_url, stream=True).raw)
    image_path = "graph.png"  # Укажи путь к изображению
    image = Image.open(image_path)

    question = "Какова максимальная точка на графике? Ответь числом."

    # Формирование сообщения (чат-формат)
    messages = [
        {
            "role": "user",
            "content": [
                {"type": "image", "image": image},
                {"type": "text", "text": question}
            ]
        }
    ]

    # Применение шаблона чата
    text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    
    # Обработка изображений
    image_inputs, video_inputs = processor.process_images([image], return_tensors="pt")
    inputs = processor(text=text, images=image_inputs, return_tensors="pt").to(model.device)

    with torch.no_grad():
        generated_ids = model.generate(**inputs, max_new_tokens=512)
    
    response = processor.decode(generated_ids[0], skip_special_tokens=True)
    # Извлечение ответа после вопроса
    if question in response:
        return response.split(question)[-1].strip()
    return response


In [None]:

# === СЛУЧАЙ 5: КЛАССИФИКАЦИЯ ТЕКСТА — Llama-3-8B ===
# Модель: meta-llama/Meta-Llama-3-8B-Instruct
# Задача: определение типа задачи (алгоритмы, математика, геометрия)
def classify_task_llama3():
    """
    Классификация типа задачи для олимпиад.
    Модель: Llama-3 (хорош для точной классификации с инструкциями)
    """
    import torch
    from transformers import AutoTokenizer, AutoModelForCausalLM

    model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.float16,
        device_map="auto"
    )

    text = "Даны координаты трех точек. Определить, лежат ли они на одной прямой."
    classes = ["алгоритмы", "математика", "геометрия", "теория_чисел", "комбинаторика"]

    prompt = f"""<|begin_of_text|><|start_header_id|>user<|end_header_id|>

Текст задачи: {text}
Классы: {', '.join(classes)}
Выбери наиболее подходящий класс. Ответь только названием класса.<|eot_id|><|start_header_id|>assistant<|end_header_id|>

геометрия"""

    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=1024).to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=32,  # только класс
            temperature=0.0,    # детерминированность
            pad_token_id=tokenizer.eos_token_id
        )
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=False)
    assistant_start = response.find("<|start_header_id|>assistant<|end_header_id|>") + len("<|start_header_id|>assistant<|end_header_id|>")
    predicted_class = response[assistant_start:].split("<|eot_id|>")[0].strip()
    return predicted_class


In [None]:

# === СЛУЧАЙ 6: РАБОТА С API — GPT-4o ===
# Модель: gpt-4o (через OpenAI API)
# Задача: высокоточное решение сложных задач
def solve_with_gpt4o():
    """
    Использование GPT-4o через API для сложных задач.
    Модель: gpt-4o (самая точная, но платная)
    Требуется: export OPENAI_API_KEY=your_key
    """
    from openai import OpenAI
    import os

    client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

    problem = """
    В треугольнике ABC известны стороны: AB = 13, BC = 14, AC = 15.
    Найдите площадь треугольника и радиус вписанной окружности.
    """

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "user", "content": problem}
        ],
        temperature=0.0,
        max_tokens=1024
    )
    
    return response.choices[0].message.content


In [None]:

# === СЛУЧАЙ 7: МУЛЬТИМОДАЛЬНАЯ КЛАССИФИКАЦИЯ — BLIP-2 ===
# Модель: Salesforce/blip2-flan-t5-xl
# Задача: классификация изображений с текстовыми пояснениями
def classify_image_blip2():
    """
    Классификация изображений с текстовым описанием.
    Модель: BLIP-2 (T5-xl) — гибрид Vision-Language
    """
    from transformers import Blip2Processor, Blip2ForConditionalGeneration
    from PIL import Image

    model_name = "Salesforce/blip2-flan-t5-xl"
    processor = Blip2Processor.from_pretrained(model_name)
    model = Blip2ForConditionalGeneration.from_pretrained(
        model_name,
        torch_dtype=torch.float16,
        device_map="auto"
    )

    image_path = "chart.png"  # Укажи путь к изображению
    image = Image.open(image_path)

    prompt = "Опиши, что изображено на графике. Это линейный или экспоненциальный рост?"

    inputs = processor(image, prompt, return_tensors="pt").to(model.device, torch.float16)

    with torch.no_grad():
        generated_ids = model.generate(**inputs, max_new_tokens=256)
    
    response = processor.decode(generated_ids[0], skip_special_tokens=True)
    return response


In [None]:

# === ПРОМПТ ИНЖЕНЕРИНГ: ШАБЛОНЫ ДЛЯ РАЗНЫХ ТИПОВ ЗАДАЧ ===
"""
=== ШАБЛОНЫ ПРОМПТОВ ===

1. КОДИРОВАНИЕ:
```
Задача: {description}
Ограничения: {constraints}
Язык: Python
Требуется: {requirements}
Формат: только код в блоке ```python...```
```

2. МАТЕМАТИКА:
```
Дано: {problem}
Требуется: {solution_type}
Формат: шаг за шагом, затем \\boxed{{ответ}}
```

3. КЛАССИФИКАЦИЯ:
```
Текст: {text}
Классы: {classes}
Ответ: только один класс
```

4. РАССУЖДЕНИЕ:
```
Ситуация: {context}
Вопрос: {question}
Формат: объяснение → вывод
```

5. МУЛЬТИМОДАЛЬНОСТЬ:
```
Изображение: {image}
Текст: {text}
Задание: {task}
Ответ: {expected_format}
```

=== ВАРИАТИВНОСТЬ ПРОМПТОВ ===

- **Zero-shot**: Просто задай задачу — "Реши: x^2 - 5x + 6 = 0"
- **Few-shot**: Дай 1-2 примера — "Пример: 2x=4 → x=2. Реши: 3x=9"
- **Chain-of-Thought**: "Рассуждай шаг за шагом: 1) ..., 2) ..., 3) ..."
- **Instruction Tuning**: "Ты — олимпиадный математик. Реши задачу строго по формулам."
- **Role Prompting**: "Ты — опытный программист на Python. Напиши эффективное решение."

=== ПАРАМЕТРЫ ГЕНЕРАЦИИ ===

- `temperature=0.0`: детерминированность (для тестов)
- `temperature=0.7`: разнообразие (для творческих задач)
- `top_p=0.9`: nucleus sampling (баланс качества и разнообразия)
- `max_new_tokens=N`: ограничение длины ответа
- `do_sample=True/False`: использовать ли семплирование
- `repetition_penalty=1.2`: избегать повторений

"""


In [None]:

# === ПРИМЕРЫ ЗАПУСКА ===
if __name__ == "__main__":
    print("=== 1. ГЕНЕРАЦИЯ КОДА (Llama-3) ===")
    code_result = solve_code_generation_llama3()
    print(code_result[:500] + "..." if len(code_result) > 500 else code_result)

    print("\n=== 2. МАТЕМАТИКА (Mistral) ===")
    math_result = solve_math_reasoning_mistral()
    print(math_result[:300] + "..." if len(math_result) > 300 else math_result)

    print("\n=== 3. МАССОВЫЙ ИНФЕРЕНС (vLLM) ===")
    batch_results = batch_inference_vllm()
    for i, res in enumerate(batch_results):
        print(f"Запрос {i+1}: {res[:100]}...")

    print("\n=== 4. КЛАССИФИКАЦИЯ ТЕКСТА (Llama-3) ===")
    class_result = classify_task_llama3()
    print(f"Предсказанный класс: {class_result}")

    # Для GPT-4o раскомментировать если ключ установлен
    # print("\n=== 5. GPT-4o (API) ===")
    # gpt_result = solve_with_gpt4o()
    # print(gpt_result)
