In [1]:
import ollama
from langchain.vectorstores.faiss import FAISS
from langchain.embeddings import OllamaEmbeddings

In [2]:
documents = [
  "Llamas are members of the camelid family meaning they're pretty closely related to vicuñas and camels",
  "Llamas were first domesticated and used as pack animals 4,000 to 5,000 years ago in the Peruvian highlands",
  "Llamas can grow as much as 6 feet tall though the average llama between 5 feet 6 inches and 5 feet 9 inches tall",
  "Llamas weigh between 280 and 450 pounds and can carry 25 to 30 percent of their body weight",
  "Llamas are vegetarians and have very efficient digestive systems",
  "Llamas live to be about 20 years old, though some only live for 15 years and others live to be 30 years old",
]

In [3]:
oembed = OllamaEmbeddings(model="mxbai-embed-large")
db = FAISS.from_texts(documents, oembed)


In [7]:
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain
from langchain_ollama.llms import OllamaLLM

model = OllamaLLM(model="mistral:latest")
memory = ConversationBufferMemory(
        memory_key='chat_history', return_messages=True)
conversation_chain = ConversationalRetrievalChain.from_llm(
    llm=model,
    retriever=db.as_retriever(),
    memory=memory,
    verbose=False
)

In [8]:
user_question = "What animals are llamas related to?"
print(conversation_chain.invoke({'question': user_question}))

{'question': 'What animals are llamas related to?', 'chat_history': [HumanMessage(content='What animals are llamas related to?'), AIMessage(content=' Llamas are related to camelids, which is a family that includes vicuñas and camels.')], 'answer': ' Llamas are related to camelids, which is a family that includes vicuñas and camels.'}


In [24]:
from pypdf import PdfReader 
  
# creating a pdf reader object 
reader = PdfReader('./pdf_examples/Putevoditel_po_Ubershreyku.pdf') 
  
# printing number of pages in pdf file 
print(len(reader.pages)) 
  
# getting a specific page from the pdf file
raw_text = "\n".join([p.extract_text() for p in reader.pages])

from langchain.text_splitter import CharacterTextSplitter

text_spliteer = CharacterTextSplitter(separator='\n',
                                        chunk_size=1024, chunk_overlap=256,
                                        length_function=len)
chunks = text_spliteer.split_text(raw_text)

print(len(chunks))
chunks[0]

66
412


'TM®\nМРА ЧНЫЙ МИР ОПАСНЫХ ПРИКЛЮЧЕНИЙ\nСОДЕРЖАНИЕ\nДОБРО ПОЖАЛОВАТЬ  \nВ\xa0УБЕРШРЕЙК  ������������������������������������������� 4\nИстория  ����������������������������������������������������������������������� 5\nДрахенфельс  ��������������������������������������������������������������� 5\nМагнус Благочестивый  ������������������������������������������������� 6\nОсаждённый Убершрейк  ���������������������������������������� 6\nИмператор наносит удар  ���������������������������������������� 7\nЛетопись Убершрейка ��������������������������������������������������� 8\nУбершрейк сегодня  ����������������������������������������������������� 10\nКакой сейчас год?  �������������������������������������������������� 10\nПравители города  ������������������������������������������������������� 10\nАльтдорфцы  ������������������������������������������������������������� 10\nГ ородской совет  ������������������������������������������������������ 11'

In [30]:
chunks[50]

'1940 К.\xa0И.\nОтравленный пир.  Великий чародей Кон -\nстант Драхенфельс использует магию, что -\nбы отравить на\xa0пиру всех членов правящей \nУбершрейком династии Брунеров. По -\nмимо Брунеров погибают представители \nмногих других дворянских семей Рейклан -\nда и\xa0 сам Император Каролус Абернауэр. \nЮнгфройды стремительно занимают го -\nрод и\xa0 замок Чёрной Скалы. Немногочис -\nленные выжившие отпрыски Дома Бруне -\nров находят убежище в\xa0герцогстве Вальфен.\n2009 К.\xa0И.\nРейкстаг официально признаёт Юнгфрой -\nдов новыми правителями Убершрей -\nка. Этот декрет вызывает закономерное \nи\xa0вполне обоснованное негодование Валь -\nфенов, заключивших брачный союз с\xa0 До -\nмом Брунеров и\xa0посему полагающих себя \nих\xa0полноправными наследниками.\n2010 К.\xa0И.\nВ\xa0 результате неудачных переговоров \nо\xa0 разделе Убершрейка герцог Випрехт \nфон Вальфен объявляет о\xa0разрыве вассаль -\nных отношений с\xa0князьями Рейкланда.\n2012 К.\xa0И.\nВойска герцога Випрехта осажд

In [36]:
oembed = OllamaEmbeddings(model="mxbai-embed-large")
db = FAISS.from_texts(chunks[:70], oembed)
model = OllamaLLM(model="llama3.1:8b")
memory = ConversationBufferMemory(
        memory_key='chat_history', return_messages=True)
conversation_chain = ConversationalRetrievalChain.from_llm(
    llm=model,
    retriever=db.as_retriever(),
    memory=memory,
    verbose=False
)
user_question = "Что посторили гномы в Убершрейке?"
print(conversation_chain.invoke({'question': user_question}))

{'question': 'Как гномы повлияли на историю УБЕРШРЕЙКА?', 'chat_history': [HumanMessage(content='Как гномы повлияли на историю УБЕРШРЕЙКА?'), AIMessage(content='Гномов внутри городских стен и даже есть собственный квартал. \n\n(возможно, это все что можно вытащить из предоставленного текста)')], 'answer': 'Гномов внутри городских стен и даже есть собственный квартал. \n\n(возможно, это все что можно вытащить из предоставленного текста)'}


In [37]:
user_question = "Что посторили гномы в Убершрейке?"
print(conversation_chain.invoke({'question': user_question})['answer'])

The text doesn't explicitly state what the gnomes did in Uberchreak, but it mentions that "Подкрепление, присланное гномами из карака Азгараз, разбито." which means "The reinforcement sent by the gnomes from the fortress of Azgaaraz was defeated."

So, to answer your question: The gnomes were involved in a battle or military campaign in Uberchreak, but it was unsuccessful as their reinforcements were defeated.


In [34]:
user_question = "Как гномы повлияли на историю УБЕРШРЕЙКА? Ответь на английском"
print(conversation_chain.invoke({'question': user_question}))

{'question': 'Как гномы повлияли на историю УБЕРШРЕЙКА? Ответь на английском', 'chat_history': [HumanMessage(content=' Когда началась Третья Парравонская война.?'), AIMessage(content='2308\u200a–\u200a2310 К.\xa0И.\n(Война длилась с 2308 по 2310 год после создания Империи)'), HumanMessage(content='Как гномы повлияли на историю УБЕРШРЕЙКА?'), AIMessage(content='According to the text, the gnomes:\n\n* Proklyadili podzemnuju kanalizaciju s mnogokratnym zadelem na budushche (translated to "they also laid out an underground sewer system with multiple branching points for future use").\n* Helped rebuild Ubershreyk in 1221 K.I. (after it was destroyed by skavens).\n* Refused to help Ubershreyk when it was being attacked by the orcs in 2303 K.I., but later agreed to help with its reconstruction.\n* Were involved in a disagreement about the height of the wall that would be built around Ubershreyk as part of an agreement between the emperor and the king of the Azgaaroth, Zaladrin (it was suppose

In [21]:
user_question = "What model arcitecture do the author of the article used?"
print(conversation_chain.invoke({'question': user_question}))

{'question': 'What model arcitecture do the author of the article used?', 'chat_history': [HumanMessage(content='What this article is about?'), AIMessage(content='This article appears to be a research paper discussing the use of deep convolutional neural networks (CNNs) for image classification, particularly on large-scale datasets such as ImageNet. The authors describe their architecture and methods for achieving record-breaking results on a challenging dataset using supervised learning. They also discuss the benefits of overlapping pooling in CNNs and provide results comparing different pooling schemes.\n\nMore specifically, this article seems to be about the development and evaluation of a deep learning model for image classification tasks, with an emphasis on scalability and performance on large datasets.'), HumanMessage(content='What model arcitecture do the author of the article used?'), AIMessage(content='The authors used an architecture with eight learned layers, consisting of 

In [23]:
user_question = "Can you explain what is Local Response Normalization?"
print(conversation_chain.invoke({'question': user_question})['answer'])

Local Response Normalization (LRN) is a technique used to reduce overfitting in neural networks, particularly in Convolutional Neural Networks (CNNs). It involves normalizing the output of neurons within a small spatial neighborhood, typically centered around each neuron. The normalization process is based on the maximum activity among neighboring neurons, and it helps to prevent any single neuron from dominating the output.

In the context provided, LRN is described as being implemented in the form of lateral inhibition inspired by real neurons, creating competition for big activities amongst neuron outputs computed using different kernels. It is applied after applying the ReLU nonlinearity in certain layers and has been shown to reduce top-1 and top-5 error rates by 1.4% and 1.2%, respectively.
