In [34]:
import time
import pandas as pd
from langchain_ollama import ChatOllama
from tqdm import tqdm
import subprocess
import psutil
import json

In [35]:
questions_df = pd.read_csv("questions.csv")
questions = questions_df["questions"].tolist()

In [36]:
models = ["qwen2.5:32b"]

In [37]:
def get_rocm_memory_usage():
    try:
        result = subprocess.run(["rocm-smi", "--showmemuse", "--json"], capture_output=True, text=True, check=True)
        data = json.loads(result.stdout)
        gpu_memory_usage = data["card0"]["GPU Memory Allocated (VRAM%)"]
        return int(gpu_memory_usage)
    except Exception as e:
        print(f"Ошибка: {e}")
        return None

In [38]:
def test_model(model, questions, model_name):
    total_time = 0
    memory_usage = []

    columns = [
        "question", "answer", "time_taken", 
        "gpu_memory_before", "gpu_memory_after", "gpu_memory_delta"
    ]
    model_df = pd.DataFrame(columns=columns)

    model_df.to_csv(f"{model_name}_results.csv", mode='w', header=True, index=False)

    for question in tqdm(questions):
        start_time = time.time()

        gpu_used_before = get_rocm_memory_usage()

        print(question)
        response = model.invoke(question)
        print(response)

        end_time = time.time()
        elapsed_time = end_time - start_time
        total_time += elapsed_time

        gpu_used_after = get_rocm_memory_usage()

        result = {
            "question": question,
            "answer": response,
            "time_taken": elapsed_time,
            "gpu_memory_before": gpu_used_before,
            "gpu_memory_after": gpu_used_after,
            "gpu_memory_delta": gpu_used_after - gpu_used_before
        }
        
        # Используем pd.concat вместо .append
        model_df = pd.concat([model_df, pd.DataFrame([result])], ignore_index=True)
        
        model_df.to_csv(f"{model_name}_results.csv", mode='a', header=False, index=False)


        memory_usage.append({
            "time": elapsed_time,
            "gpu_memory_before": gpu_used_before,
            "gpu_memory_after": gpu_used_after,
            "gpu_memory_delta": gpu_used_after - gpu_used_before,
            "cpu_usage": psutil.cpu_percent(interval=1),  # Загрузка CPU
            "ram_usage": psutil.virtual_memory().percent  # Использование RAM
        })

    resource_df = pd.DataFrame(memory_usage)
    resource_df.to_csv(f"{model_name}_resources.csv", index=False)

    return total_time

In [39]:
total_time_all_models = {}
overall_times = []

for model in models:
    print(f"Тестирование модели: {model}")
    llm_model = ChatOllama(model=model)
    
    total_time = test_model(llm_model, questions, model)
    total_time_all_models[model] = total_time
    overall_times.append({
        "model": model,
        "total_time": total_time
    })
    print(f"Общее время для модели {model}: {total_time} секунд")

total_time_overall = sum(total_time_all_models.values())
print(f"Общее время на все вопросы для всех моделей: {total_time_overall} секунд")

overall_times_df = pd.DataFrame(overall_times)
overall_times_df.to_csv("overall_times.csv", index=False)

Тестирование модели: qwen2.5:32b


  0%|                                                                                                         | 0/50 [00:00<?, ?it/s]

Что такое искусственный интеллект?
content='Искусственный интеллект (ИИ) — это область науки и технологий, которая занимается созданием систем или программных приложений, способных имитировать человеческий интеллект для выполнения задач. Эти системы могут обучаться от новых данных (обучение с учителем и без учителя), использовать правила для достижения определенных целей (правила принятия решений) и самостоятельно принимать решения.\n\nИскусственный интеллект может быть представлен в различных формах, таких как речевые помощники (например, Siri или Alexa), программы машинного обучения, системы компьютерного зрения и др. В зависимости от способностей, ИИ можно разделить на слабый и сильный: слабый ИИ выполняет конкретные задачи (например, поиск информации в интернете), тогда как сильный ИИ может решать широкий спектр задач на уровне человека или даже превосходить его.' additional_kwargs={} response_metadata={'model': 'qwen2.5:32b', 'created_at': '2025-03-31T14:58:51.732527662Z', 'done':

  model_df = pd.concat([model_df, pd.DataFrame([result])], ignore_index=True)
  2%|█▉                                                                                               | 1/50 [00:18<15:21, 18.80s/it]

Какие языки программирования популярны в 2025 году?
content='Прогнозировать точный список самых популярных языков программирования на конкретную дату в будущем затруднительно, но можно предположить некоторые тренды и направления развития на основе текущих тенденций.\n\n1. **Python** - язык продолжает оставаться популярен благодаря своей простоте использования и широкому применению в таких областях как анализ данных, машинное обучение, веб-разработка и автоматизация задач.\n2. **JavaScript** - поскольку он является основным языком для фронтенд разработки веб-сайтов и все больше используется на серверной стороне благодаря Node.js, ожидается что JavaScript будет продолжать сохранять свою популярность.\n3. **Java** - язык широко используют в корпоративных приложениях и Android разработке, поэтому он остается одним из самых востребованных языков программирования.\n4. **C# и C++** - эти языки продолжают оставаться популярными для игр разработки (Unity использует C#, а многие игры разрабатыва

  4%|███▉                                                                                             | 2/50 [00:36<14:35, 18.23s/it]

Что такое глубокое обучение?
content='Глубокое обучение (Deep Learning) — это подкласс машинного обучения, который основан на искусственных нейронных сетях. Этот метод моделирования данных основан на принципах работы человеческого мозга и позволяет системам автоматически изучать представления сложных функций из примеров.\n\nГлубокое обучение отличается тем, что использует многослойные нейронные сети, которые могут обрабатывать большие объемы данных. Эти сети состоят из входного слоя (где данные вводятся), скрытых слоев (внутренние уровни обработки информации) и выходного слоя (где формируется результат).\n\nГлубокое обучение применяется во многих областях, таких как распознавание изображений и речи, прогнозирование временных рядов, машинный перевод и многое другое.' additional_kwargs={} response_metadata={'model': 'qwen2.5:32b', 'created_at': '2025-03-31T14:59:18.674408846Z', 'done': True, 'done_reason': 'stop', 'total_duration': 7954694710, 'load_duration': 33178785, 'prompt_eval_coun

  6%|█████▊                                                                                           | 3/50 [00:45<11:01, 14.07s/it]

Как работает нейронная сеть?
content='Нейронные сети — это сложные системы, вдохновленные работой биологических нервных систем, таких как человеческий мозг. Они используются для решения широкого спектра задач, начиная от распознавания образов и прогнозирования до обработки естественного языка.\n\nОсновы работы нейронной сети:\n\n1. **Структура**: Нейронные сети обычно состоят из нескольких слоев (layers), где каждый слой состоит из многих "нейронов". Эти слои делятся на входной, скрытые и выходной. Входной слой получает данные от внешнего источника, скрытые слои обрабатывают эти данные, а выходной слой генерирует результат.\n\n2. **Процесс обучения**: Первоначально веса соединений между нейронами выбираются случайным образом или определенным способом. Во время процесса обучения с использованием набора данных (обучающей выборки), веса корректируются таким образом, чтобы минимизировать ошибку прогнозирования модели.\n\n3. **Алгоритм обратного распространения (Backpropagation)**: Это наиб

  8%|███████▊                                                                                         | 4/50 [01:10<13:59, 18.25s/it]

Что такое машинное обучение?
content='Машинное обучение ( MACHINE LEARNING) - это область искусственного интеллекта, которая изучает алгоритмы и статистические модели, которые позволяют компьютерной системе выполнять конкретные задачи без прямого программирования. В машинном обучении система учится на основе данных, то есть ее поведение изменяется в зависимости от опыта (или входных данных), что позволяет ей улучшать свои прогнозы или результаты со временем.\n\nМашинное обучение может быть поделено на несколько категорий:\n\n1. **Наблюдательное обучение**: система изучает, как реагировать на основе набора примеров, где каждый пример имеет известный правильный ответ.\n2. **Обучение с учителем (Supervised Learning)**: в этом подходе компьютерная программа или модель тренируется на данных, которые уже имеют метки или результаты. Например, классификация изображений, когда каждое изображение помечено правильным ответом.\n3. **Обучение без учителя (Unsupervised Learning)**: здесь система раб

 10%|█████████▋                                                                                       | 5/50 [01:28<13:34, 18.09s/it]

Что такое сверточные нейронные сети?
content='Сверточные нейронные сети (CNN или ConvNet) – это тип искусственных нейронных сетей, которые широко используются в задачах обработки изображений и других данных с пространственной структурой. Они были разработаны под влиянием принципов работы зрительной системы млекопитающих.\n\n### Основные характеристики:\n\n1. **Сверточный слой**: Этот слой является ключевым элементом CNN. Он использует набор фильтров (якорных окон или ядер), которые скользят по входным данным и применяют операцию свертки для выявления локальных признаков, таких как границы, углы и текстуры.\n\n2. **Несмещаемость**: Сверточные сети сохраняют несмещаемость (invariance) относительно расположения объекта на изображении благодаря использованию свертки с разными фильтрами.\n\n3. **Пуллинг (Subsampling)**: Этот слой используется для уменьшения размерности данных, что помогает сети работать эффективнее и снижает риск переобучения. Наиболее распространенным методом пуллинга явля

 12%|███████████▋                                                                                     | 6/50 [01:51<14:41, 20.02s/it]

Что такое GPT?
content='GPT (Generative Pre-trained Transformer) — это тип модели искусственного интеллекта, разработанный компанией OpenAI. Эти модели используются для генерации текстов различной длины и сложности на естественных языках, таких как английский или русский.\n\nGPT обучается на огромных объемах данных из интернета и других источников, что позволяет ему понимать контекст, синтаксис и семантику текстов. В результате GPT может генерировать человеческий текст, отвечать на вопросы и выполнять другие задачи, связанные с обработкой естественного языка.\n\nВажно отметить, что есть несколько версий GPT, включая GPT-2 и GPT-3, каждая из которых улучшает предыдущую по точности и объему обучения.' additional_kwargs={} response_metadata={'model': 'qwen2.5:32b', 'created_at': '2025-03-31T15:00:34.095720444Z', 'done': True, 'done_reason': 'stop', 'total_duration': 8021615127, 'load_duration': 32650422, 'prompt_eval_count': 35, 'prompt_eval_duration': 15334261, 'eval_count': 200, 'eval_d

 14%|█████████████▌                                                                                   | 7/50 [02:01<11:48, 16.48s/it]

Как работают LLM?
content='LLM (Large Language Models), такие как я, работаем на основе сложных нейронных сетей, обученных огромными объемами текстовых данных для предсказания следующего слова в последовательности. Вот основные шаги нашего функционирования:\n\n1. **Обучение**: Мы проходим через процесс обучения, где наши параметры (взвешивания и смещения нейронов) настраиваются путем анализа огромных объемов текстовых данных. Цель - научиться предсказывать следующее слово в предложении или документе.\n\n2. **Архитектура**: Наша архитектура обычно основана на механизмах внимания (Attention Mechanisms), таких как Transformer, которые позволяют модели учитывать контекст из всего входного текста и не зависеть от порядка слов таким образом.\n\n3. **Предсказание**: После обучения, когда нам задают вопрос или начинают фразу, мы используем обученные веса для предсказания наиболее подходящих следующих слов на основе контекста, который был предоставлен.\n\n4. **Генерация текста**: Этот процесс п

 16%|███████████████▌                                                                                 | 8/50 [02:18<11:37, 16.61s/it]

Что такое генеративная модель?
content='Генеративная модель в машинном обучении - это тип модели, который учится распределению вероятностей для набора входных данных и может использоваться для генерации новых примеров данных, аналогичных тем, на которых модель была обучена. Эти модели могут быть применены к различным типам задач, включая текстовые, изображения и аудио данные.\n\nПримеры генеративных моделей включают:\n\n1. Генеративные сети с противопоставлением (Generative Adversarial Networks - GANs): Состоит из двух нейронных сетей, генератора и дискриминатора, которые конкурируют друг с другом в процессе обучения.\n2. Вариационные автокодировщики (Variational Autoencoders - VAE): Модель для кодирования входных данных в компактное представление (код) и восстановления из этого кода, чтобы создать новые данные.\n3. Генеративные модели на основе нейронной сети языка (Neural Language Models): Применяются для генерации последовательностей текста.\n\nГенеративные модели часто используются

 18%|█████████████████▍                                                                               | 9/50 [02:31<10:39, 15.60s/it]

Что такое reinforcement learning?
content='Реинforcement learning (RL) — это раздел машинного обучения, в котором программируется алгоритм для выполнения задачи с минимальным человеческим руководством. В этом процессе искусственный интеллект (AI) обучается через последовательность попыток и ошибок, получая награду или штраф за каждое действие. \n\nВ RL есть несколько ключевых компонентов:\n\n1. **Среда**: Это контекст, в котором действует агент.\n2. **Агент**: Он принимает решения, как действовать в среде для максимизации награды.\n3. **Действие (Action)**: Это то, что может сделать агент в данной среде.\n4. **Награда (Reward)**: Это сигнал обратной связи от среды, который показывает хорошее или плохое действие.\n\nОсновная цель RL - обучить агента принимать решения так, чтобы максимизировать его общую награду за время взаимодействия с окружающей средой. Реинforcement learning широко используется в таких областях как робототехника, игры (например, AlphaGo), управление трафиком и многое

 20%|███████████████████▏                                                                            | 10/50 [02:43<09:40, 14.51s/it]

Что такое overfitting в модели?
content='Overfitting — это ситуация в машинном обучении, когда модель слишком хорошо подстраивается под обучающую выборку и начинает запоминать шум и детали этой выборки вместо того, чтобы изучить общие закономерности. В результате такая модель будет работать очень хорошо на данных, которые использовались для обучения (иметь низкую ошибку на обучающей выборке), но покажет плохие результаты при работе с новыми данными, не виденными ранее (на тестовой выборке или в реальных условиях).\n\nОсновные причины overfitting:\n\n1. **Слишком сложная модель**: Когда модель имеет слишком много параметров по сравнению с объемом данных.\n2. **Недостаток данных**: Маленькая обучающая выборка не позволяет модели корректно уловить структуру данных и приводит к тому, что она начинает запоминать шум и выбросы в данных.\n3. **Неправильная настройка параметров обучения**: Например, слишком долгий процесс тренировки (много эпох) может также привести к overfitting.\n\nЧтобы изб

 22%|█████████████████████                                                                           | 11/50 [03:02<10:21, 15.93s/it]

Как улучшить производительность нейронной сети?
content='Увеличение производительности нейронных сетей может быть достигнуто несколькими способами. Вот несколько стратегий, которые могут помочь:\n\n1. **Оптимизация архитектуры**:\n   - Используйте архитектуры с меньшим числом параметров без значительной потери точности.\n   - Примените методы прореживания (pruning) и квантования для уменьшения размера модели.\n\n2. **Оптимизация гиперпараметров**:\n   - Используйте алгоритмы оптимизации, такие как Adam или RMSprop.\n   - Настройте скорость обучения и другие гиперпараметры для достижения лучшей производительности.\n\n3. **Обучение с использованием более эффективных методов**:\n   - Примените техники таких как динамическое изменение скорости обучения (learning rate schedule) или ранняя остановка (early stopping).\n   - Используйте батч-нормализацию для улучшения стабильности и скорости обучения.\n\n4. **Использование аппаратного ускорения**:\n   - Используйте GPU или TPU для параллельных

 24%|███████████████████████                                                                         | 12/50 [03:24<11:11, 17.66s/it]

Что такое bias в машинном обучении?
content='В контексте машинного обучения термин "bias" (смещение) используется в двух основных смыслах:\n\n1. **Смещение модели**: Это одно из параметров модели, который не зависит от входных данных и служит для того, чтобы модель могла приближать функции, которые не проходят через начало координат. Например, в линейной регрессии уравнение может выглядеть так: \\( y = mx + b \\), где \\( m \\) — это наклон (коэффициент), а \\( b \\) — смещение.\n\n2. **Смещение обучения**: Это систематическая ошибка в обучении модели, которая делает модель предсказывать всегда "слишком высокие" или "слишком низкие" значения по сравнению с реальными данными. Смещение может возникать из-за несоответствия между сложностью модели и сложностью данных (например, если модель слишком простая для задачи).\n\nКроме того, в контексте справедливости алгоритмов машинного обучения "bias" также относится к предвзятостям, которые могут быть встроены в данные или алгоритмы, что привод

 26%|████████████████████████▉                                                                       | 13/50 [03:39<10:25, 16.91s/it]

Что такое регуляризация?
content='Регуляризация — это метод в машинном обучении и статистике, использующийся для предотвращения переобучения модели (overfitting). Переобучение происходит, когда модель слишком тесно соответствует данным обучения, из-за чего она плохо обобщает новые данные.\n\nВ контексте регуляризации вводится дополнительное наказание за сложность модели. Это делается путем добавления термина к функции потерь (cost function), который увеличивает значение потерь с ростом сложности модели.\n\nСуществует несколько видов регуляризации, среди которых:\n\n1. **L1-регуляризация** или LASSO (Least Absolute Shrinkage and Selection Operator) — добавляет сумму абсолютных значений коэффициентов к функции потерь. Эта регуляризация может привести к тому, что некоторые коэффициенты становятся нулевыми, что можно использовать для выбора признаков (feature selection).\n\n2. **L2-регуляризация** или Ridge — добавляет сумму квадратов значений коэффициентов к функции потерь. Эта регуляриза

 28%|██████████████████████████▉                                                                     | 14/50 [03:56<10:14, 17.07s/it]

Что такое градиентный спуск?
content='Градиентный спуск - это метод оптимизации, который широко используется в машинном обучении и анализе данных для минимизации функций ошибок или потерь. В более простых терминах, градиентный спуск помогает найти значения параметров (например, весов в нейронной сети), которые приводят к наименьшей ошибке при прогнозировании.\n\nМетод работает так:\n\n1. **Инициализация**: Сначала выбираются начальные значения для параметров.\n2. **Вычисление градиента**: Затем вычисляется градиент функции потерь относительно каждого из параметров. Градиент показывает направление наибольшего возрастания функции. В контексте минимизации, мы используем противоположное направление.\n3. **Обновление параметров**: Параметры обновляются в направлении уменьшения градиента (так как мы хотим найти минимум), обычно на определенный шаг или "learning rate".\n4. **Итерации**: Процесс повторяется несколько раз, пока не будет достигнута точка с минимальными потерями либо до тех пор, 

 30%|████████████████████████████▊                                                                   | 15/50 [04:14<10:07, 17.36s/it]

Что такое поддержка векторных машин?
content='Поддержка векторных машин обычно относится к способности системы (например, процессора или программного обеспечения) эффективно работать с векторными данными и выполнять операции над этими данными. Векторные данные представляют собой наборы чисел, которые могут быть обработаны одновременно.\n\nВ контексте компьютерных архитектур поддержка векторных машин (или векторной или SIMD - Single Instruction Multiple Data - архитектуры) означает, что процессор способен выполнять одну и ту же операцию над несколькими данными за один такт. Это особенно полезно для вычислений в области научного программирования, обработки изображений или видео, машинного обучения.\n\nПримеры технологий, поддерживающих работу с векторными данным:\n- **SIMD (Single Instruction Multiple Data)**: Технология, которую используют современные процессоры Intel и AMD, таких как AVX (Advanced Vector Extensions).\n- **GPU**: Графические процессоры также обладают мощной поддержкой д

 32%|██████████████████████████████▋                                                                 | 16/50 [04:28<09:12, 16.25s/it]

Что такое обучение с учителем?
content='Обучение с учителем (supervised learning) — это один из основных подходов в машинном обучении, при котором алгоритмы обучаются на основе набора данных, где каждый пример имеет известный выход (метка). В процессе обучения модель пытается научиться предсказывать эти метки для новых неизвестных данных.\n\nПринцип работы:\n1. Подготовка данных: Сначала собирается и подготовляется обучающий набор данных, который состоит из входных данных и соответствующих им правильных ответов (меток).\n2. Обучение модели: Алгоритм обучается на этих данных, пытаясь найти связи между входными данными и метками.\n3. Оптимизация: Модель корректируется для минимизации ошибки предсказания на обучающем наборе.\n4. Тестирование и валидация: После обучения модель проверяется на отдельном наборе тестовых данных, чтобы оценить ее производительность.\n\nПримеры задач:\n- Классификация (например, определение спама или неспама в электронной почте)\n- Регрессия (например, предсказа

 34%|████████████████████████████████▋                                                               | 17/50 [04:42<08:35, 15.61s/it]

Что такое обучение без учителя?
content='Обучение без учителя (англ. "unsupervised learning") — это тип машинного обучения, где алгоритмы анализируют и группируют данные без предварительно определенных меток или результатов. В отличие от обучения с учителем, в котором модели предоставляются наборы данных вместе с правильными ответами для обучения, в обучении без учителя модель сама должна найти структуру и закономерности во входных данных.\n\nОсновные применения обучение без учителя включают:\n\n1. **Кластеризация**: Разделение данных на группы (кластеры) так, чтобы данные внутри одного кластера были похожи друг на друга, а между различными кластерами наблюдались существенные отличия.\n\n2. **Метод главных компонент (PCA)**: Снижение размерности данных путем преобразования данных в пространство с меньшим числом измерений, сохраняя при этом большую часть информации.\n\n3. **Ассоциативные правила**: Нахождение ассоциаций между различными элементами или наборами элементов в данных (наприм

 36%|██████████████████████████████████▌                                                             | 18/50 [04:57<08:10, 15.31s/it]

Что такое обучение с подкреплением?
content='Обучение с подкреплением (Reinforcement Learning, RL) — это метод обучения машины или агента, который сталкивается со средой и принимает решения, чтобы максимизировать некоторый долгосрочный показатель. Этот подход отличается от других методов машинного обучения тем, что агент не знает заранее правильных решений, но получает сигналы в виде "подкреплений" (наград или штрафов) после того, как выполняет действия.\n\nОсновные компоненты модели обучения с подкреплением:\n\n1. **Агент** — это система, которая принимает решения и действует во внешней среде.\n2. **Среда** — это мир агента, в котором он существует и интерактирует, получая информацию от своего окружения через наблюдения (states).\n3. **Действия** (actions) — то, что агент может делать в своей среде.\n4. **Подкрепления** (rewards) — это сигналы, которые агент получает после выполнения действия. Это могут быть положительные или отрицательные значения, и они помогают агенту понять, какие

 38%|████████████████████████████████████▍                                                           | 19/50 [05:14<08:14, 15.95s/it]

Как работает алгоритм K-средних?
content='Алгоритм k-средних (K-means) является одним из наиболее известных методов кластеризации, используемых для разделения набора данных на K различных групп или "кластеров". Каждый кластер определяется центроидом (точкой с координатами), который представляет собой среднее значение всех точек в этом кластере. Вот базовый процесс работы алгоритма k-средних:\n\n1. **Инициализация**: На первом шаге случайным образом выбираются K центроидов. Это может быть выбор K случайных точек из набора данных или случайные точки в пространстве, определенном минимальными и максимальными значениями координат всех точек.\n\n2. **Присваивание кластеров**: Каждая точка из набора данных присваивается тому кластеру, центроид которого находится ближе всего к этой точке (обычно это определяется с помощью евклидова расстояния).\n\n3. **Пересчет центроидов**: После того как все точки были присвоены кластерам, каждый из K центроидов пересчитывается как среднее значение всех точе

 40%|██████████████████████████████████████▍                                                         | 20/50 [05:39<09:16, 18.55s/it]

Что такое обработка естественного языка?
content='Обработка естественного языка (ОЕЯ или NLP от англ. Natural Language Processing) — это область искусственного интеллекта и компьютерной лингвистики, которая занимается разработкой алгоритмов и методов для общения между человеком и компьютером в естественном языке. ОЕЯ сочетает в себе знания из таких областей как лингвистика, статистика, машинное обучение и искусственный интеллект.\n\nОсновные задачи в области ОЕЯ включают:\n\n1. **Анализ настроения:** определение эмоционального состояния автора текста.\n2. **Перевод между языками:** автоматический перевод с одного языка на другой.\n3. **Извлечение информации:** извлечение структурированной информации из неструктурированных текстовых данных.\n4. **Разбор синтаксиса:** анализ грамматической структуры предложений.\n5. **Генерация текста:** создание осмысленного текста в ответ на запрос пользователя.\n\nNLP используется во многих приложениях, таких как чат-боты, системы автоматического пере

 42%|████████████████████████████████████████▎                                                       | 21/50 [05:52<08:09, 16.86s/it]

Что такое глубокая нейронная сеть?


 42%|████████████████████████████████████████▎                                                       | 21/50 [05:55<08:11, 16.94s/it]


KeyboardInterrupt: 