#### With llama cpp python natively

In [1]:
from llama_cpp import Llama
import json


In [2]:
'''
CPU-only:

llm = Llama(
        model_path="./llama-2-13b-chat.Q4_K_M.gguf",
        max_tokens=512,
        n_ctx=2048,
    )

With GPU: 

llm = Llama(
        model_path="./llama-2-13b-chat.Q4_K_M.gguf",
        n_gpu_layers=59,
        n_batch=512,
        max_tokens=512,
        n_ctx=2048,
        f16_kv=True
    )
'''

llm = Llama(
        model_path="./llama-2-13b-chat.Q4_K_M.gguf",
        n_gpu_layers=8192,
        n_batch=512,
        max_tokens=512,
        n_ctx=2048,
        f16_kv=True
    )

ggml_init_cublas: GGML_CUDA_FORCE_MMQ:   no
ggml_init_cublas: CUDA_USE_TENSOR_CORES: yes
ggml_init_cublas: found 1 CUDA devices:
  Device 0: NVIDIA TITAN RTX, compute capability 7.5


ValueError: Model path does not exist: ./llama-2-13b-chat.Q4_K_M.gguf

In [3]:
prompt = "Tell me about the Roman Empire?"


In [5]:
reply = ""
for token in llm(prompt, stream=True, echo=False):
    item = token["choices"][0]["text"]
    reply += item
    #print(token["choices"][0]["text"])
    #print(item, end=" ")
    print(item, sep=' ', end='', flush=True)


I'd be happy

Llama.generate: prefix-match hit


 to tell you about the Roman Empire! The Roman Empire was a vast and powerful state that lasted for over a thousand years, from 27 BC to 476 AD. It was one of the most influential civilizations in human history, leaving a lasting legacy in fields such as law, architecture, engineering, art, literature, and religion.

Here are some key facts about the Roman Empire:

1. Rise of the Roman Empire: The Roman Empire began as a small city-state in central Italy, but it gradually expanded to include much of Europe, North


llama_print_timings:        load time =     101.96 ms
llama_print_timings:      sample time =      45.68 ms /   128 runs   (    0.36 ms per token,  2801.92 tokens per second)
llama_print_timings: prompt eval time =       0.00 ms /     1 tokens (    0.00 ms per token,      inf tokens per second)
llama_print_timings:        eval time =    2422.39 ms /   128 runs   (   18.92 ms per token,    52.84 tokens per second)
llama_print_timings:       total time =    2753.70 ms


### With Langchain

In [6]:
from langchain.callbacks.manager import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain.chains import LLMChain
from langchain.llms import LlamaCpp
from langchain.prompts import PromptTemplate

In [7]:
template = """Question: {question}

Answer: Let's work this out in a step by step way to be sure we have the right answer."""

prompt = PromptTemplate(template=template, input_variables=["question"])
# Callbacks support token-wise streaming
callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])

In [8]:
llm = LlamaCpp(
    model_path="../llms/llama-2-13b-chat.Q4_K_M.gguf",
    temperature=0.75,
    max_tokens=2000,
    top_p=1,
    callback_manager=callback_manager,
    verbose=True,  # Verbose is required to pass to the callback manager
)

ValidationError: 1 validation error for LlamaCpp
__root__
  Could not load Llama model from path: ./llama-2-13b-chat.Q4_K_M.gguf. Received error Model path does not exist: ./llama-2-13b-chat.Q4_K_M.gguf (type=value_error)

In [7]:
prompt = """
Tell me about the roman empire
"""
llm(prompt)


The Roman Empire was a vast and powerful state that existed in Europe, Africa, and Asia from the 1st century BC to the 5th century AD. It was one of the most influential civilizations in world history, leaving a lasting impact on politics, culture, architecture, engineering, language, and religion.

The Roman Empire began as a small city-state in central Italy, but it grew and expanded through conquest and colonization. At its peak, it covered an area of approximately 5 million square kilometers, stretching from modern-day England and Wales in the north to Egypt in the south, and from modern-day Portugal in the west to present-day Turkey in the east.

The Roman Empire was known for its military might, with a professional army that was one of the most effective fighting forces in the ancient world. Its legions conquered many territories, including the Mediterranean coast, parts of Europe, and large areas of North Africa and the Middle East. The empire also had a highly developed system


llama_print_timings:        load time =     153.41 ms
llama_print_timings:      sample time =     192.30 ms /   540 runs   (    0.36 ms per token,  2808.14 tokens per second)
llama_print_timings: prompt eval time =     152.54 ms /    12 tokens (   12.71 ms per token,    78.67 tokens per second)
llama_print_timings:        eval time =   10315.73 ms /   539 runs   (   19.14 ms per token,    52.25 tokens per second)
llama_print_timings:       total time =   12039.39 ms




### Introduce a Knowledge Base in form of Documents

In [8]:
import os

# Add a folder to Colab called "Knowledge Base" and upload PDF files of your choice into it.
DOCS_PATH = "main_data/"

# retrieve all PDF files in said folder
files = os.listdir(DOCS_PATH)
pdf_files = [os.path.join(DOCS_PATH, file) for file in files if file.endswith(".pdf")]

In [9]:
pdf_files

['main_data/Wahlpflichtmodule_Master-Informatik_WS23_Stand_21-Sep-2023.pdf',
 'main_data/119_ZuSMa_Senat_18012022.pdf',
 'main_data/Infoveranstaltung_Masterstudiengaenge-Informatik_HTWG-Konstanz.pdf',
 'main_data/124_SPOMa_AT_Senat_08112022.pdf',
 'main_data/Modulhandbuch_MSI_SS23_Stand_10-Jan-2023.pdf',
 'main_data/SPO_MSI_SPONr5_Senat_10122019.pdf']

In [10]:
from haystack.nodes import PDFToTextConverter

converter_pdf = PDFToTextConverter(remove_numeric_tables=True, valid_languages=["de"])

doc_pdf_all = [converter_pdf.convert(file_path=path, meta=None)[0] for path in pdf_files]

In [11]:
from haystack.nodes import PreProcessor

# This is a default usage of the PreProcessor.
# The split_length is essential in managing document chunks.
preprocessor = PreProcessor(
    clean_empty_lines=True,
    clean_whitespace=True,
    clean_header_footer=True,
    split_by="word",
    split_length=500,
    split_respect_sentence_boundary=True,
)
docs_default = preprocessor.process(doc_pdf_all)

Preprocessing: 100%|████████████████████████████| 6/6 [00:00<00:00, 17.33docs/s]


In [12]:
from haystack.document_stores import InMemoryDocumentStore

# Setup Document Store
document_store = InMemoryDocumentStore(use_bm25=True)
document_store.write_documents(docs_default)

document_store

Updating BM25 representation...: 100%|█████| 84/84 [00:00<00:00, 4189.72 docs/s]


<haystack.document_stores.memory.InMemoryDocumentStore at 0x7fc1aa9be290>

In [13]:
from haystack.nodes import BM25Retriever

# Initialize Retriever
bm25_retriever = BM25Retriever(document_store=document_store)

In [14]:
query = "Was sind die Zulassungsvorraussetzungen für ein Master Studium?"

In [15]:
from haystack.pipelines import DocumentSearchPipeline
from haystack.utils import print_documents

# If we want to ask questions directly we can use the pre-loaded reader (roberta-base)
p_extractive_premade = DocumentSearchPipeline(bm25_retriever)

docs = p_extractive_premade.run(
        query=query, params={"Retriever": {"top_k": 3}}
)
docs

{'documents': [<Document: {'content': 'Hochschule Konstanz | Brauneggerstr. 55 | 78462 Konstanz | www.htwg-konstanz.de\nHerzlich willkommen bei der\nInformationsveranstaltung\nMaster Informatik (MSI) und\nBusiness Information Technology (BIT)\nan der HTWG Konstanz\x0cHochschule Konstanz\nZugangsvoraussetzungen MSI\n▪\nBachelor- oder Diplom-Abschluss in Informatik oder einem\nverwandten Studium (z.B. WIN oder GIB),\n•\nmindestens 60 ECTS in Fächern aus dem Bereich Informatik\n▪\nAbschlussnote 2,4 oder besser (harte Grenze)\nInformatik (M. Sc.)\x0cHochschule Konstanz\nZugangsvoraussetzungen BIT\n▪\nGrundständiges Hochschulstudium (mind. 180 ECTS) der Informatik\noder Betriebswirtschaftslehre oder verwandter Studiengang\n•\nerster Studienabschluss in Informatik (mind. 100 ECTS) in\no\na) Grundlagen der Informatik, b) Programmierung, c) Algorithmen und Datenstrukturen, d) Datenbanken\n•\nerster Studienabschluss in Betriebswirtschaftslehre (mind. 100 ECTS) in\no\na) Grundlagen der Betriebsw

In [16]:
input = f"""
Answer the question based solely on the given documents and 
by grouping the given documents into a list of bullet points.
Also list your sources for the bulletpoints.
Documents:
{str(docs)}

Question: {query}
"""

In [None]:

llm = LlamaCpp(
    model_path="./vicuna-13b-v1.5.Q4_K_M.gguf", #vicuna-13b-v1.5.Q4_K_M.gguf
    temperature=0.1,
    max_tokens=5000,
    n_gpu_layers=43,
    n_batch=512,
    f16_kv=True,
    n_ctx=5570,
    top_p=1,
    callback_manager=callback_manager,
    verbose=True,  # Verbose is required to pass to the callback manager
)

llama_model_loader: loaded meta data with 19 key-value pairs and 363 tensors from ./vicuna-13b-v1.5.Q4_K_M.gguf (version GGUF V2)
llama_model_loader: - tensor    0:                token_embd.weight q4_K     [  5120, 32000,     1,     1 ]
llama_model_loader: - tensor    1:              blk.0.attn_q.weight q4_K     [  5120,  5120,     1,     1 ]
llama_model_loader: - tensor    2:              blk.0.attn_k.weight q4_K     [  5120,  5120,     1,     1 ]
llama_model_loader: - tensor    3:              blk.0.attn_v.weight q6_K     [  5120,  5120,     1,     1 ]
llama_model_loader: - tensor    4:         blk.0.attn_output.weight q4_K     [  5120,  5120,     1,     1 ]
llama_model_loader: - tensor    5:            blk.0.ffn_gate.weight q4_K     [  5120, 13824,     1,     1 ]
llama_model_loader: - tensor    6:              blk.0.ffn_up.weight q4_K     [  5120, 13824,     1,     1 ]
llama_model_loader: - tensor    7:            blk.0.ffn_down.weight q6_K     [ 13824,  5120,     1,     1 ]
llama_

In [17]:
llm(input)

Llama.generate: prefix-match hit



Answer: The bullet points for the question "Was sind die Zulassungsvorraussetzungen für ein Master Studium?" are as follows:

* Allgemeine Zugangsvoraussetzungen:
	+ Überdurchschnittlichem Erfolg abgeschlossenes grundständiges Hochschulstudium, für das eine Regelstudienzeit von mindestens drei Jahren festgesetzt ist, in einem der im Besonderen Teil für den jeweiligen Masterstudiengang festgelegten Studiengänge oder ein vergleichbarer Abschluss. Für den Abschluss des grundständigen Hochschulstudiums muss ein Umfang von 210 ECTS-Punkten nachgewiesen werden. Die Zulassung ist ausgeschlossen, wenn das grundständige Hochschulstudium nicht mindestens mit der gemäß der im besonderen Teil (§§ 12-26) festgelegten Gesamtnote abgeschlossen wurde.
	+ Nachweise, dass weitere Zugangskriterien nach § 9 i. V. m. §§ 12-26 erfüllt sind.
	+ Erfolgreiche Teilnahme an dem Auswahlverfahren gemäß § 9.
* Spezifische Zulassungsvoraussetzungen für die einzelnen Masterstudiengänge:
	+ Informatik (M. Sc.):
		- B


llama_print_timings:        load time =     153.41 ms
llama_print_timings:      sample time =     208.02 ms /   562 runs   (    0.37 ms per token,  2701.64 tokens per second)
llama_print_timings: prompt eval time =    3787.81 ms /  3523 tokens (    1.08 ms per token,   930.09 tokens per second)
llama_print_timings:        eval time =   15998.00 ms /   561 runs   (   28.52 ms per token,    35.07 tokens per second)
llama_print_timings:       total time =   21461.54 ms


'\nAnswer: The bullet points for the question "Was sind die Zulassungsvorraussetzungen für ein Master Studium?" are as follows:\n\n* Allgemeine Zugangsvoraussetzungen:\n\t+ Überdurchschnittlichem Erfolg abgeschlossenes grundständiges Hochschulstudium, für das eine Regelstudienzeit von mindestens drei Jahren festgesetzt ist, in einem der im Besonderen Teil für den jeweiligen Masterstudiengang festgelegten Studiengänge oder ein vergleichbarer Abschluss. Für den Abschluss des grundständigen Hochschulstudiums muss ein Umfang von 210 ECTS-Punkten nachgewiesen werden. Die Zulassung ist ausgeschlossen, wenn das grundständige Hochschulstudium nicht mindestens mit der gemäß der im besonderen Teil (§§ 12-26) festgelegten Gesamtnote abgeschlossen wurde.\n\t+ Nachweise, dass weitere Zugangskriterien nach § 9 i. V. m. §§ 12-26 erfüllt sind.\n\t+ Erfolgreiche Teilnahme an dem Auswahlverfahren gemäß § 9.\n* Spezifische Zulassungsvoraussetzungen für die einzelnen Masterstudiengänge:\n\t+ Informatik (M