In [22]:
from langchain.callbacks.manager import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain_community.llms import LlamaCpp



# Callbacks support token-wise streaming
callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])

# Make sure the model path is correct for your system!
llm = LlamaCpp(
    model_path="./LeoLM/leo-hessianai-7b-chat-ams-merged-16bit-q8_0.gguf",
    #model_path="./LeoLM/leo-mistral-hessianai-7b-ams-merged-16bit-q5_k_m.gguf",
    #model_path="./LeoLM/leo-mistral-hessianai-7b-ams-merged-16bit-q4_k_m.gguf",
    #model_path="./LeoLM/leo-mistral-hessianai-7b-ams-merged-16bit-f16.gguf",
    #model_path="./LeoLM/leo-mistral-hessianai-7b-ams-merged-16bit-q8_0.gguf",
    temperature=0.75,
    max_tokens=2000,
    top_p=1,
    callback_manager=callback_manager,
    verbose=True,  # Verbose is required to pass to the callback manager
    chat_format="llama-2",
)

llama_model_loader: loaded meta data with 23 key-value pairs and 291 tensors from ./LeoLM/leo-hessianai-7b-chat-ams-merged-16bit-q8_0.gguf (version GGUF V3 (latest))
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.name str              = .
llama_model_loader: - kv   2:                       llama.context_length u32              = 8192
llama_model_loader: - kv   3:                     llama.embedding_length u32              = 4096
llama_model_loader: - kv   4:                          llama.block_count u32              = 32
llama_model_loader: - kv   5:                  llama.feed_forward_length u32              = 11008
llama_model_loader: - kv   6:                 llama.rope.dimension_count u32              = 128
llama_model_loader: - kv   7:                 llama.attention

In [20]:
from langchain.prompts import PromptTemplate


prompt_template = PromptTemplate.from_template(
    "{SystemPrompt} <|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant\n"
)

system_prompt = """<|im_start|>system
Dies ist eine Unterhaltung zwischen einem intelligenten, hilfsbereitem KI-Assistenten und einem Nutzer.
Der Assistent gibt ausführliche, hilfreiche und ehrliche Antworten.<|im_end|>
"""


prompt = "Erkläre mir wie die Fahrradwegesituation in Hamburg ist."

prompt_template.format(SystemPrompt="system_prompt", prompt="chickens")

'system_prompt <|im_start|>user\nchickens<|im_end|>\n<|im_start|>assistant\n'

In [None]:
system_prompt = """<|im_start|>system
Dies ist eine Unterhaltung zwischen einem intelligenten, hilfsbereitem KI-Assistenten und einem Nutzer.
Der Assistent gibt ausführliche, hilfreiche und ehrliche Antworten.<|im_end|>
"""
prompt_format = "<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant\n"
prompt = "Erkläre mir wie die Fahrradwegesituation in Hamburg ist."


llm_chain = LLMChain(prompt=prompt, llm=llm)

In [8]:
from langchain_core.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a helpful AI bot. Your name is {name}."),
        ("user", "Hello, how are you doing?"),
        ("ai", "I'm doing well, thanks!"),
        ("human", "{user_input}"),
    ]
)

messages = chat_template.format_messages(name="Bob", user_input="What is your name?")

In [21]:
from langchain.schema import AIMessage, HumanMessage, SystemMessage

prompt = SystemMessage(content="Du bist ein Berufsberatungsbot der Agentur für Arbeit. Du berätst Menschen bei der Berufswahl. Du bist freundlich und hilfsbereit.")
print(prompt)

new_prompt = (
    #prompt + HumanMessage(content="hi") + AIMessage(content="what?") + "{input}"
    prompt + "{input}"

)
print(new_prompt)

content='Du bist ein Berufsberatungsbot der Agentur für Arbeit. Du berätst Menschen bei der Berufswahl. Du bist freundlich und hilfsbereit.'
input_variables=['input'] messages=[SystemMessage(content='Du bist ein Berufsberatungsbot der Agentur für Arbeit. Du berätst Menschen bei der Berufswahl. Du bist freundlich und hilfsbereit.'), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input'], template='{input}'))]


In [15]:
print(new_prompt.format_messages(input="Hallo, ich bin mike, 15 jahre alt und möchte gerne eine ausbildung machen. Ich war nicht so gut in der Schule, aber ich bin handwerklich begabt. Was für Berufe gibt es da?"))
print(new_prompt)

[SystemMessage(content='Du bist ein Berufsberatungsbot der Agentur für Arbeit. Du berätst Menschen bei der Berufswahl. Du bist freundlich und hilfsbereit.'), HumanMessage(content='Hallo, ich bin mike, 15 jahre alt und möchte gerne eine ausbildung machen. Ich war nicht so gut in der Schule, aber ich bin handwerklich begabt. Was für Berufe gibt es da?')]
input_variables=['input'] messages=[SystemMessage(content='Du bist ein Berufsberatungsbot der Agentur für Arbeit. Du berätst Menschen bei der Berufswahl. Du bist freundlich und hilfsbereit.'), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input'], template='{input}'))]


In [18]:
chain = LLMChain(llm=llm, prompt=new_prompt)

chain.run("Hallo, ich bin mike, 15 jahre alt und möchte gerne eine ausbildung machen. Ich war nicht so gut in der Schule, aber ich bin handwerklich begabt. Was für Berufe gibt es da?")

Llama.generate: prefix-match hit


<dummy00007> 
<dummy00006> assistant
Es gibt viele verschiedene Ausbildungsmöglichkeiten! Für Menschen mit körperlichen Einschränkungen oder Handicaps bietet sich ein Praktikum im Rahmen eines Volontariats an, z.B. in einem fachspezifischen Betrieb oder Werkstatt oder Inklusionsbetrieb (für Menschen mit Lernschwierigkeiten) Es gibt auch eine Reihe von freien Gewerben für die kein Befähigungsnachweis erforderlich ist; Die aktuelle bundeseinheitliche Liste der freien Gewerbe sowie die Liste der reglementierten Gewerbe ist jeweils auf der Website des Bundesministeriums für Digitalisierung und Wirtschaft (BMDW) abrufbar.<dummy00007> 



llama_print_timings:        load time =     786.13 ms
llama_print_timings:      sample time =      35.56 ms /   165 runs   (    0.22 ms per token,  4640.18 tokens per second)
llama_print_timings: prompt eval time =   10525.22 ms /    98 tokens (  107.40 ms per token,     9.31 tokens per second)
llama_print_timings:        eval time =   45467.14 ms /   164 runs   (  277.24 ms per token,     3.61 tokens per second)
llama_print_timings:       total time =   56710.77 ms /   262 tokens


'<dummy00007> \n<dummy00006> assistant\nEs gibt viele verschiedene Ausbildungsmöglichkeiten! Für Menschen mit körperlichen Einschränkungen oder Handicaps bietet sich ein Praktikum im Rahmen eines Volontariats an, z.B. in einem fachspezifischen Betrieb oder Werkstatt oder Inklusionsbetrieb (für Menschen mit Lernschwierigkeiten) Es gibt auch eine Reihe von freien Gewerben für die kein Befähigungsnachweis erforderlich ist; Die aktuelle bundeseinheitliche Liste der freien Gewerbe sowie die Liste der reglementierten Gewerbe ist jeweils auf der Website des Bundesministeriums für Digitalisierung und Wirtschaft (BMDW) abrufbar.<dummy00007> \n'

In [9]:
print(messages)

[SystemMessage(content='You are a helpful AI bot. Your name is Bob.'), HumanMessage(content='Hello, how are you doing?'), AIMessage(content="I'm doing well, thanks!"), HumanMessage(content='What is your name?')]
