In [1]:
# # Исследование датасета математических задач

from re_rl.tasks.math_task import MathTask
from datasets import Dataset

# Определяем системный промт (можно изменять под свои нужды)
SYSTEM_PROMPT = """
Отвечай в формате:
<reasoning>
...
</reasoning>
<answer>
...
</answer>
"""

# %% [code]
# Функция генерации датасета из случайно сгенерированных математических задач
def get_math_tasks_dataset(num_tasks: int = 100) -> Dataset:
    tasks = []
    for _ in range(num_tasks):
        # Генерируем случайную задачу, требующую решения
        task = MathTask.generate_random_task(only_valid=True)
        result = task.get_result()
        tasks.append({
            'prompt': [
                {'role': 'system', 'content': SYSTEM_PROMPT},
                {'role': 'user', 'content': result["prompt"]}
            ],
            'answer': result["final_answer"],
            'solution_steps': result["solution_steps"],
            'problem': result["problem"]
        })
    return Dataset.from_list(tasks)

# %% [code]
# Генерируем небольшой датасет для исследования
dataset = get_math_tasks_dataset(20)

# Выводим информацию о датасете
print("Информация о датасете:")
print(dataset)
print("\nИмена столбцов:")
print(dataset.column_names)

# %% [code]
# Выведем несколько примеров из датасета
for i in range(3):
    print(f"\n--- Пример {i+1} ---")
    sample = dataset[i]
    print("Постановка задачи:", sample["problem"])
    print("Промт:", sample["prompt"])
    print("Пошаговое решение:")
    for step in sample["solution_steps"]:
        print("  ", step)
    print("Итоговый ответ:", sample["answer"])

# %% [markdown]
# ## Дополнительное исследование
# 
# Можно, например, изучить распределение длин решения, количество шагов и т.д. Здесь приведён пример, как можно получить статистику по количеству шагов в решении.
# 
# ```python
# steps_counts = [len(sample["solution_steps"]) for sample in dataset]
# print("Среднее количество шагов:", sum(steps_counts)/len(steps_counts))
# print("Максимальное количество шагов:", max(steps_counts))
# print("Минимальное количество шагов:", min(steps_counts))
# ```
# 
# Такой анализ поможет понять, насколько детализировано формируется решение задачи и использовать эти данные при дальнейшей настройке обучения.

# %% [code]
# Пример дополнительного анализа: статистика по количеству шагов решения
steps_counts = [len(sample["solution_steps"]) for sample in dataset]
print("Среднее количество шагов:", sum(steps_counts) / len(steps_counts))
print("Максимальное количество шагов:", max(steps_counts))
print("Минимальное количество шагов:", min(steps_counts))


  from .autonotebook import tqdm as notebook_tqdm


Информация о датасете:
Dataset({
    features: ['prompt', 'answer', 'solution_steps', 'problem'],
    num_rows: 20
})

Имена столбцов:
['prompt', 'answer', 'solution_steps', 'problem']

--- Пример 1 ---
Постановка задачи: Решите линейное уравнение: 9x + 1 = 2
Промт: [{'content': '\nОтвечай в формате:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n', 'role': 'system'}, {'content': 'Задача: Решите линейное уравнение: 9x + 1 = 2\n Пожалуйста, решите задачу пошагово.', 'role': 'user'}]
Пошаговое решение:
   Шаг 1: Запишем уравнение: 9⋅x + 1 = 2.
   Шаг 2: Переносим 1 на правую сторону: 9x = 2 - 1 = 1.
   Шаг 3: Делим обе части на 9: x = 1 / 9 = 1/9.
Итоговый ответ: 1/9

--- Пример 2 ---
Постановка задачи: Решите кубическое уравнение: 2x^3 + 7x² - 10x - 6 = 0
Промт: [{'content': '\nОтвечай в формате:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n', 'role': 'system'}, {'content': 'Задача: Решите кубическое уравнение: 2x^3 + 7x² - 10x - 6 = 0\n Пожалуйста, решите зада

In [2]:
from re_rl.tasks.graph_task import GraphTask

# Генерируем одну случайную графовую задачу
task = GraphTask.generate_random_task(only_valid=True, num_nodes=10, edge_prob=0.5)
result = task.get_result()

print("Постановка задачи:")
print(result["problem"])
print("\nПромт:")
print(result["prompt"])
print("\nПошаговое решение:")
for step in result["solution_steps"]:
    print("  ", step)
print("\nИтоговый ответ:")
print(result["final_answer"])

# %% [code]
# Генерируем набор случайных графовых задач для быстрого исследования
num_tasks = 10
tasks = []
for _ in range(num_tasks):
    task = GraphTask.generate_random_task(only_valid=True, num_nodes=10, edge_prob=0.5)
    tasks.append(task.get_result())

print("Сгенерировано задач:", len(tasks))
for i, res in enumerate(tasks):
    print(f"\n--- Задача {i+1} ---")
    print("Постановка задачи:", res["problem"])
    print("Итоговый ответ:", res["final_answer"])

Постановка задачи:
Найди минимальное остовное дерево для данного графа.
Граф задан ребрами с весами: [(0, 1, 1), (0, 3, 2), (0, 4, 5), (0, 7, 8), (0, 8, 9), (0, 9, 4), (1, 6, 6), (2, 4, 8), (2, 5, 9), (2, 6, 3), (2, 7, 10), (4, 6, 4), (4, 8, 3), (4, 9, 5), (5, 8, 7), (6, 7, 2), (6, 9, 3), (7, 9, 2)]

Промт:
Задача: Найди минимальное остовное дерево для данного графа.
Граф задан ребрами с весами: [(0, 1, 1), (0, 3, 2), (0, 4, 5), (0, 7, 8), (0, 8, 9), (0, 9, 4), (1, 6, 6), (2, 4, 8), (2, 5, 9), (2, 6, 3), (2, 7, 10), (4, 6, 4), (4, 8, 3), (4, 9, 5), (5, 8, 7), (6, 7, 2), (6, 9, 3), (7, 9, 2)]
 Пожалуйста, решите задачу пошагово.

Пошаговое решение:
   Найденное минимальное остовное дерево: [(0, 1, {'weight': 1}), (0, 3, {'weight': 2}), (0, 9, {'weight': 4}), (2, 6, {'weight': 3}), (4, 8, {'weight': 3}), (4, 6, {'weight': 4}), (5, 8, {'weight': 7}), (6, 7, {'weight': 2}), (7, 9, {'weight': 2})].

Итоговый ответ:
[(0, 1, {'weight': 1}), (0, 3, {'weight': 2}), (0, 9, {'weight': 4}), (2, 6,