<a href="https://colab.research.google.com/github/Irina-oss/NewRepo17/blob/master/Untitled6.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
!pip install llama-cpp-python
!pip install pypdf
!pip install PyPDF2
import os
import urllib.request
import textwrap
from tqdm import tqdm
from llama_cpp import Llama
from PyPDF2 import PdfReader  # Импортируем класс PdfReader



In [3]:
# 1. Загрузка текста из PDF-файлов
def load_pdf_text(lecture_file_paths):
    """Загружает текст из PDF-файла."""
    try:
        reader = PdfReader(lecture_file_paths)
        text = ""
        for page in reader.pages:
            text += page.extract_text()
        return text
    except FileNotFoundError:
        print(f"Ошибка: Файл не найден по пути {lecture_file_paths}")
        return None
    except Exception as e:
        print(f"Ошибка при чтении PDF-файла: {e}")
        return None

def load_all_lecture_texts(file_paths):
    """Загружает тексты из нескольких PDF-файлов."""
    all_texts = []
    for lecture_file_paths in file_paths:
        text = load_pdf_text(lecture_file_paths)
        if text:
            all_texts.append(text)
    return all_texts


# 2. Подготовка данных (разбивка на части)
def prepare_data(text, chunk_size=512):
    """Разбивает текст лекции на небольшие фрагменты."""
    chunks = [text[i:i + chunk_size] for i in range(0, len(text), chunk_size)]
    return chunks

In [4]:
# Скачиваем модель (если она еще не скачана)
model_name = "mistral-7b-openorca.gguf2.Q4_0.gguf"
model_url = "https://huggingface.co/TheBloke/Mistral-7B-OpenOrca-GGUF/resolve/main/mistral-7b-openorca.Q4_0.gguf" #Замените на работающий URL
model_path = "./" + model_name

if not os.path.exists(model_path):
    print(f"Downloading {model_name} from {model_url}")
    try:
        req = urllib.request.Request(model_url, headers={'User-Agent': 'Mozilla/5.0'})
        response = urllib.request.urlopen(req)

        total_size = int(response.headers.get('Content-Length', 0))
        block_size = 8192

        with tqdm(total=total_size, unit='B', unit_scale=True, desc=model_name) as t, open(model_path, 'wb') as outfile:
            while True:
                chunk = response.read(block_size)
                if not chunk:
                    break
                outfile.write(chunk)
                t.update(len(chunk))

        print(f"{model_name} downloaded to {model_path}")
    except Exception as e:
        print(f"Error downloading {model_name}: {e}")
        raise

else:
    print(f"{model_name} already exists at {model_path}")

mistral-7b-openorca.gguf2.Q4_0.gguf already exists at ./mistral-7b-openorca.gguf2.Q4_0.gguf


In [5]:
try:
    llm = Llama(model_path=model_path, n_ctx=2048)  # Важно: Установите n_ctx (context window size)
except Exception as e:
    print(f"Ошибка при инициализации Llama: {e}")
    raise

llama_model_loader: loaded meta data with 20 key-value pairs and 291 tensors from ./mistral-7b-openorca.gguf2.Q4_0.gguf (version GGUF V2)
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.name str              = open-orca_mistral-7b-openorca
llama_model_loader: - kv   2:                       llama.context_length u32              = 32768
llama_model_loader: - kv   3:                     llama.embedding_length u32              = 4096
llama_model_loader: - kv   4:                          llama.block_count u32              = 32
llama_model_loader: - kv   5:                  llama.feed_forward_length u32              = 14336
llama_model_loader: - kv   6:                 llama.rope.dimension_count u32              = 128
llama_model_loader: - kv   7:                 llama.attentio

In [6]:
conversation_history = ""

In [11]:
# 4. "Обучение" модели (на самом деле, добавление контекста)
def add_lecture_context(lecture_text, llm, chunk_size=512):  # Передаём llm как аргумент
    """Добавляет текст лекции в контекст модели."""
    chunks = prepare_data(lecture_text, chunk_size)
    for chunk in tqdm(chunks, desc="Adding lecture context"):
        #  Внимание! Важно:  Мы *не* обучаем модель в классическом понимании.
        #  Мы просто добавляем текст лекции в *контекст* модели.
        #  Это позволяет модели отвечать на вопросы, основываясь на этом тексте.

        # Очистка контекста перед добавлением нового.  Если нужно накапливать знания, уберите эту строку.
        #llm.reset()  #  Llama.cpp имеет метод reset()

        #  Добавляем фрагмент текста в контекст. Используем простой промпт.
        prompt = f"Текст лекции: {chunk}\nВопрос: Что это за текст?\nОтвет:"
        try:
            output = llm(prompt, max_tokens=50, stop=["Q:", "\nUser:", "<|file_separator|>"])
            #  Мы можем игнорировать вывод, нас интересует, что текст добавлен в контекст.
        except Exception as e:
            print(f"Ошибка при добавлении контекста: {e}")


# 5. Замена `get_llama_response` для использования контекста лекции
def get_llama_response(prompt, llm): # Передаём llm как аргумент
    """Получает ответ от модели с учетом контекста лекции."""
    try:
        output = llm(prompt, max_tokens=200, stop=["Q:", "\nUser:", "<|file_separator|>"])  # Adjust parameters as needed
        response_text = output['choices'][0]['text'].strip()
        wrapped_text = textwrap.fill(response_text, width=100)
        return wrapped_text
    except Exception as e:
        print(f"Ошибка при получении ответа от Llama: {e}")
        return "Произошла ошибка при генерации ответа."

# 6. Интеграция всего вместе и запуск
if __name__ == "__main__":
    lecture_file_paths = ["/content/Лекция1.1.pdf"]  # Замените на пути к вашим файлам лекций
    all_lecture_texts = load_all_lecture_texts(lecture_file_paths)

    if all_lecture_texts:
        for lecture_text in all_lecture_texts:
            add_lecture_context(lecture_text, llm) # Передаём llm

        while True:
            user_input = input("User: ")
            if user_input.lower() == "exit":
                break
            prompt = f"Q: {user_input}\nAI: "
            response = get_llama_response(prompt, llm) # Передаём llm
            print("AI:", response)
    else:
        print("Не удалось загрузить текст лекции. Проверьте пути к файлам.")

Adding lecture context:   0%|          | 0/14 [00:00<?, ?it/s]Llama.generate: 8 prefix-match hit, remaining 233 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =   63902.95 ms /   233 tokens (  274.26 ms per token,     3.65 tokens per second)
llama_perf_context_print:        eval time =   31411.15 ms /    49 runs   (  641.04 ms per token,     1.56 tokens per second)
llama_perf_context_print:       total time =   95342.02 ms /   282 tokens
Adding lecture context:   7%|▋         | 1/14 [01:35<20:39, 95.35s/it]Llama.generate: 8 prefix-match hit, remaining 244 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =   65992.60 ms /   244 tokens (  270.46 ms per token,     3.70 tokens per second)
llama_perf_context_print:        eval time =   30914.73 ms /    49 runs   (  630.91 ms per token,     1.59 tokens per second)
llama_perf_context_print:  

User: Что такое Информация?


Llama.generate: 1 prefix-match hit, remaining 14 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =    5997.98 ms /    14 tokens (  428.43 ms per token,     2.33 tokens per second)
llama_perf_context_print:        eval time =   93256.83 ms /   148 runs   (  630.11 ms per token,     1.59 tokens per second)
llama_perf_context_print:       total time =   99357.72 ms /   162 tokens


AI: Информация является данными, фактами или знаниями, собираемыми, обрабатываемыми и предоставляемыми
для использования. Информация может быть хранимой в виде текста, изображений, аудио или видео, или
быть представлена в виде статистики, диаграмм или графиков. Ее основная цель - это предоставление
информации, чтобы позволить пользователям принимать решения, расширять свои знания или выполнять
другие полезные действия.
User: что такое информационные технологии?


Llama.generate: 3 prefix-match hit, remaining 15 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =    6098.63 ms /    15 tokens (  406.58 ms per token,     2.46 tokens per second)
llama_perf_context_print:        eval time =   82365.29 ms /   131 runs   (  628.74 ms per token,     1.59 tokens per second)
llama_perf_context_print:       total time =   88552.53 ms /   146 tokens


AI: Информационные технологии (ИТ) представляют собой обширную область, объединяющую различные аспекты
использования компьютеров и других технологий для хранения, обработки, доступ к и обмен информацией.
Это включает в себя программное обеспечение, аппаратное обеспечение, сетевые технологии, интернет,
мобильные технологии, искусственный интеллект и многое другое.
User: exit


In [8]:
def get_llama_response(prompt):
    global conversation_history  # Объявляем, что используем глобальную переменную

    # Добавляем историю разговора в запрос
    full_prompt = conversation_history + prompt

    try:
        output = llm(full_prompt, max_tokens=200, stop=["Q:", "\nUser:", "<|file_separator|>"])  # Adjust parameters as needed
        response_text = output['choices'][0]['text'].strip()

        # Обновляем историю разговора
        conversation_history += prompt + response_text + "\n"

        # Форматируем вывод с использованием textwrap
        wrapped_text = textwrap.fill(response_text, width=100)
        return wrapped_text

    except Exception as e:
        print(f"Ошибка при получении ответа от Llama: {e}")
        return "Произошла ошибка при генерации ответа."

In [9]:
while True:
    user_input = input("User: ")
    if user_input.lower() == "exit":
        break

    # Формируем запрос
    prompt = f"Q: {user_input}\nAI: "

    # Получаем ответ от Llama
    response = get_llama_response(prompt)
    print("AI:", response)

User: Что такое информация?


Llama.generate: 1 prefix-match hit, remaining 14 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =    4381.61 ms /    14 tokens (  312.97 ms per token,     3.20 tokens per second)
llama_perf_context_print:        eval time =   45214.11 ms /    73 runs   (  619.37 ms per token,     1.61 tokens per second)
llama_perf_context_print:       total time =   49646.98 ms /    87 tokens


AI: Информация - это данные, знания или факты, которые передаются от одной или нескольких людей или
источников к другому человеку или к системе. Информация помогает людям принимать решения, учиться и
общаться друг с другом.
User: Информация - это


Llama.generate: 14 prefix-match hit, remaining 82 prompt tokens to eval
llama_perf_context_print:        load time =   67073.88 ms
llama_perf_context_print: prompt eval time =   22909.54 ms /    82 tokens (  279.38 ms per token,     3.58 tokens per second)
llama_perf_context_print:        eval time =   40835.04 ms /    65 runs   (  628.23 ms per token,     1.59 tokens per second)
llama_perf_context_print:       total time =   63780.82 ms /   147 tokens


AI: 1. Данные, знания или факты, которые передаются от одной или нескольких людей или источников к
другому человеку или к системе. 2. Признание или утверждение о чем-то или кем-то.
User: exit
