
Resources:
- [Massive Text Embedding Benchmark (MTEB) Leaderboard](https://huggingface.co/spaces/mteb/leaderboard)

In [1]:
from sentence_transformers import SentenceTransformer
import pickle

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model = SentenceTransformer('all-MiniLM-L6-v2')

In [3]:
#Our sentences we like to encode
sentences = ['This framework generates embeddings for each input sentence',
    'Sentences are passed as a list of string.',
    'The quick brown fox jumps over the lazy dog.']

#Sentences are encoded by calling model.encode()
embeddings = model.encode(sentences)

#Print the embeddings
for sentence, embedding in zip(sentences, embeddings):
    print(f"Sentence: {sentence}")
    print(f"Embedding: {embedding[:10]}")
    print(f"Embedding shape: {embedding.shape}\n")

Sentence: This framework generates embeddings for each input sentence
Embedding: [-0.01371739 -0.04285153 -0.0156286   0.01405375  0.03955379  0.1217963
  0.02943335 -0.03175242  0.03549597 -0.07931399]
Embedding shape: (384,)

Sentence: Sentences are passed as a list of string.
Embedding: [ 0.05645249  0.05500242  0.03137961  0.03394853 -0.03542472  0.08346678
  0.09888007  0.00727543 -0.00668654 -0.0076581 ]
Embedding shape: (384,)

Sentence: The quick brown fox jumps over the lazy dog.
Embedding: [ 0.04393355  0.05893442  0.04817839  0.0775481   0.02674441 -0.03762956
 -0.00260509 -0.05994305 -0.00249598  0.02207284]
Embedding shape: (384,)



In [4]:
model_multi_lang = SentenceTransformer("distiluse-base-multilingual-cased-v1")

In [5]:
#Our sentences we like to encode
ge_sentences = [
    "Bei Beendigung eines Arbeits- oder Ausbildungsver hältnisses sind Sie verpflichtet, sich spätestens drei Monate vorher arbeitsuchend zu melden.",
    "Erfahren Sie von der Beendigung weniger als drei Monate vor her, müssen Sie sich innerhalb von drei Tagen melden.",
    "Sie können sich online, persönlich, telefonisch oder schriftlich arbeitsuchend melden.",
    "Melden Sie sich nicht rechtzeitig, droht eine Sperrzeit.",
    "Bei einem betrieblichen oder schulischen Ausbildungsverhältnis gilt die Pflicht zur Meldung nicht."]

#Sentences are encoded by calling model_multi_lang.encode()
ge_embeddings = model_multi_lang.encode(ge_sentences)

#Print the embeddings
for sentence, embedding in zip(ge_sentences, ge_embeddings):
    print(f"Sentence: {sentence}")
    print(f"Embedding: {embedding[:10]}")
    print(f"Embedding shape: {embedding.shape}\n")

Sentence: Bei Beendigung eines Arbeits- oder Ausbildungsver hältnisses sind Sie verpflichtet, sich spätestens drei Monate vorher arbeitsuchend zu melden.
Embedding: [ 0.02625179  0.01115136 -0.01026822 -0.06133845  0.02682867 -0.03840181
  0.04899191  0.09285875  0.02274641 -0.02847939]
Embedding shape: (512,)

Sentence: Erfahren Sie von der Beendigung weniger als drei Monate vor her, müssen Sie sich innerhalb von drei Tagen melden.
Embedding: [-0.03790323 -0.01957224  0.0362604  -0.03070089 -0.00417996 -0.0769087
  0.08025548  0.0462033   0.06243161  0.02552238]
Embedding shape: (512,)

Sentence: Sie können sich online, persönlich, telefonisch oder schriftlich arbeitsuchend melden.
Embedding: [-0.08799731  0.02537259 -0.0224913  -0.06667131  0.03407011  0.02214984
  0.01853287 -0.02886866  0.00283347 -0.02214039]
Embedding shape: (512,)

Sentence: Melden Sie sich nicht rechtzeitig, droht eine Sperrzeit.
Embedding: [-0.04047302 -0.02856058 -0.00867569  0.01239634 -0.03007405 -0.0286623

# Store and load embeddings

In [6]:
#Store sentences & embeddings
with open("embeddings/embeddings.pkl", "wb") as fOut:
    pickle.dump({"sentences": ge_sentences, "embeddings": ge_embeddings}, fOut, protocol=pickle.HIGHEST_PROTOCOL)

In [7]:
#Load sentences & embeddings
with open("embeddings/embeddings.pkl", "rb") as fIn:
    stored_data = pickle.load(fIn)
    stored_sentences = stored_data['sentences']
    stored_embeddings = stored_data['embeddings']

In [8]:
stored_sentences

['Bei Beendigung eines Arbeits- oder Ausbildungsver hältnisses sind Sie verpflichtet, sich spätestens drei Monate vorher arbeitsuchend zu melden.',
 'Erfahren Sie von der Beendigung weniger als drei Monate vor her, müssen Sie sich innerhalb von drei Tagen melden.',
 'Sie können sich online, persönlich, telefonisch oder schriftlich arbeitsuchend melden.',
 'Melden Sie sich nicht rechtzeitig, droht eine Sperrzeit.',
 'Bei einem betrieblichen oder schulischen Ausbildungsverhältnis gilt die Pflicht zur Meldung nicht.']

# import pdf

In [1]:
# import openai
# import environ
from llama_index import SimpleDirectoryReader
from llama_index import VectorStoreIndex
# from llama_index.tools import QueryEngineTool, ToolMetadata
# from llama_index.query_engine import SubQuestionQueryEngine
# from llama_hub.wikipedia.base import WikipediaReader
# import wikipedia
# 
# import nest_asyncio
# nest_asyncio.apply()
from IPython.display import Markdown, display

In [2]:
doc_path = "docs/merkblatt-fuer-arbeitslose_ba036520.pdf"

doc = SimpleDirectoryReader(input_files=[doc_path]).load_data()

In [11]:
len(doc)

103

In [12]:
doc[:5]

[Document(id_='f6d428aa-e07b-47a9-bc28-7ba903ae2a5d', embedding=None, metadata={'page_label': '1', 'file_name': 'merkblatt-fuer-arbeitslose_ba036520.pdf'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, hash='2d9a660e58719a47a0a844e0a4f2e1aeab80a2910c2e579c81af05daf01afe99', text='49466_BA_MB_1.indd   1 10.02.2015   13:20:58Agentur für Arbeit  \nMusterstadthausen  Merkblatt\n1Merkblatt für\nArbeitslose \nIhre Rechte –\nIhre Pflichten ', start_char_idx=None, end_char_idx=None, text_template='{metadata_str}\n\n{content}', metadata_template='{key}: {value}', metadata_seperator='\n'),
 Document(id_='b49564a9-0edc-47fd-b284-9a2797bb717c', embedding=None, metadata={'page_label': '2', 'file_name': 'merkblatt-fuer-arbeitslose_ba036520.pdf'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, hash='96291ef98137c571c20b29d30df5a6c087563271148520a97ce911686ac9592a', text='3 \nIhre Agentur für Arbeit hält eine Fülle von \n Informati

In [13]:
doc[5].metadata

{'page_label': '6', 'file_name': 'merkblatt-fuer-arbeitslose_ba036520.pdf'}

In [14]:
display(Markdown(f"{doc[5].text}"))

7Das Wichtigste vorweg:
12 Punkte, die Sie sich merken sollten!
• Bei Beendigung eines Arbeits- oder Ausbildungsver ­
hältnisses sind Sie verpflichtet, sich spätestens drei 
Monate vorher arbeitsuchend zu melden. Erfahren 
Sie von der Beendigung weniger als drei Monate vor ­
her, müssen Sie sich innerhalb von drei Tagen mel ­
den. Sie können sich online, persönlich, telefonisch 
oder schriftlich arbeitsuchend melden. Melden Sie 
sich nicht rechtzeitig, droht eine Sperrzeit. Bei einem 
betrieb  lichen oder schulischen Ausbildungsverhältnis 
gilt die Pflicht zur Meldung nicht.
Weitere Hinweise dazu finden Sie in » Abschnitt 1 .
• Arbeitslosengeld wird frühestens von dem Tag an 
 gezahlt, an dem Sie sich online im Fachportal der 
Bundesagentur für Arbeit (auf » arbeitsagentur.de 
» Menü » Alle eServices anzeigen » Arbeitslos 
melden ) oder persönlich bei Ihrer Agentur für Arbeit 
arbeitslos melden.
• Um Beschäftigungslosigkeit nicht eintreten zu lassen 
oder zu beenden, sind Sie verpflichtet, eigenverant ­
wortlich nach einer Beschäftigung zu suchen, eine 
zumutbare Beschäftigung aufzunehmen oder an 
 einer beruflichen Eingliederungsmaßnahme teilzu ­
nehmen.
Auf Verlangen der Agentur für Arbeit müssen Sie Ihre 
Eigenbemühungen nachweisen. Weitere Hinweise 
dazu finden Sie in » Abschnitt 2.4 .Das Wichtigste vorweg

In [3]:
index = VectorStoreIndex.from_documents(doc)

******
Could not load OpenAI model. Using default LlamaCPP=llama2-13b-chat. If you intended to use OpenAI, please check your OPENAI_API_KEY.
Original error:
No API key found for OpenAI.
Please set either the OPENAI_API_KEY environment variable or openai.api_key prior to initialization.
API keys can be found or created at https://platform.openai.com/account/api-keys

******


gguf_init_from_file: invalid magic number 67676a74
error loading model: llama_model_loader: failed to load model from /tmp/llama_index/models/llama-2-13b-chat.ggmlv3.q4_0.bin

llama_load_model_from_file: failed to load model


AssertionError: 

In [None]:
index

<llama_index.indices.vector_store.base.VectorStoreIndex at 0x7f1570b49d50>

In [None]:
query_engine = index.as_query_engine(similarity_top_k=3)

In [None]:
def display_response(query: str):
    """
    Get the answer from the query engine.

    Args:
        query (str): A query with the prompt.

    Returns:
        It returns the response in a llama_index.response.schema.Response object
    """
    response = query_engine.query(query)
    display(Markdown(f"{response}"))
    return response

In [None]:
response_tmp = display_response("Was müssen ich tun, wenn Arbeitslosigkeit eintritt?")

Sie müssen sich spätestens am 1. Tag der Arbeitslosigkeit arbeitslos melden. Dies kann entweder online über das Fachportal der Bundesagentur für Arbeit oder persönlich bei Ihrer Agentur für Arbeit erfolgen. Die Arbeitslosmeldung ist eine unverzichtbare Voraussetzung, um Arbeitslosengeld zu erhalten. Wenn Sie sich nicht arbeitslos gemeldet haben und arbeitsunfähig erkranken, kann dies dazu führen, dass Sie keinen Anspruch auf Arbeitslosengeld oder Krankengeld haben.

In [None]:
type(response_tmp)

llama_index.response.schema.Response

In [None]:
response_tmp.source_nodes

[NodeWithScore(node=TextNode(id_='cb683289-771b-4cc9-9235-179e98ad677e', embedding=None, metadata={'page_label': '14', 'file_name': 'merkblatt-fuer-arbeitslose_ba036520.pdf'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='ac23cf58-1b56-4a41-8ba3-c706cacc6c75', node_type=None, metadata={'page_label': '14', 'file_name': 'merkblatt-fuer-arbeitslose_ba036520.pdf'}, hash='d994f52cf96c202b238856eab75913c940d1697b245fc7e02d247f772ba32895')}, hash='d994f52cf96c202b238856eab75913c940d1697b245fc7e02d247f772ba32895', text='152. Was müssen Sie tun, wenn Arbeitslosigkeit eintritt?\n2.  Was müssen Sie tun, wenn \nArbeitslosigkeit eintritt?\n2.1 Arbeitslos melden\nLeistungen können Sie nur erhalten, wenn Sie der \n zuständigen Agentur für Arbeit Ihre Arbeitslosigkeit \n gemeldet haben; damit gilt gleichzeitig das Arbeits -\nlosengeld als beantragt. Sie können sich hierzu online \n arbeitslos melden. Sie benötige

In [None]:
response_tmp = display_response("Wann muss ich mich für den Bezug von Arbeitslosengeld anmelden?")

Sie müssen sich spätestens drei Monate vor Beendigung Ihres Arbeits- oder Ausbildungsverhältnisses arbeitsuchend melden, um Anspruch auf Arbeitslosengeld zu haben. Wenn Sie weniger als drei Monate vorher von der Beendigung erfahren, müssen Sie sich innerhalb von drei Tagen melden. Sie können sich online, persönlich, telefonisch oder schriftlich arbeitsuchend melden.

In [None]:
response_tmp = display_response("Wie hoch ist das Arbeitslosengeld, das ich bekomme?")

Die Höhe des Arbeitslosengeldes hängt von verschiedenen Faktoren ab, wie dem beitragspflichtigen Arbeitsentgelt, der Lohnsteuerklasse und der Anzahl der zu berücksichtigenden Kinder. Es gibt einen allgemeinen Leistungssatz von 60 Prozent des Leistungsentgelts, der gewährt wird, wenn kein Kind zu berücksichtigen ist. Wenn Sie oder Ihr Ehegatte oder Lebenspartner mindestens ein Kind haben, können Sie einen erhöhten Leistungssatz von 67 Prozent erhalten. Es ist wichtig zu beachten, dass die genaue Höhe des Arbeitslosengeldes individuell berechnet wird und in Ihrem Bewilligungsbescheid angegeben ist. Sie können auch das Selbstberechnungsprogramm für Arbeitslosengeld auf der Website der Arbeitsagentur nutzen, um die Höhe Ihres Arbeitslosengeldes zu berechnen.

In [None]:
a1 = display_response("Wie viel Arbeitslosengeld Sie bekommen")

Die Höhe des Arbeitslosengeldes hängt von verschiedenen Faktoren ab, wie dem beitragspflichtigen Arbeitsentgelt, der Lohnsteuerklasse und der Frage, ob ein Kind zu berücksichtigen ist. Die genaue Berechnung erfolgt durch die Agentur für Arbeit auf Grundlage dieser Informationen. Es wird tägliches Arbeitslosengeld gezahlt, und wenn es für einen vollen Kalendermonat zu zahlen ist, wird dieser mit 30 Tagen angesetzt. Um die Höhe des Arbeitslosengeldes selbst zu berechnen, können Sie das Selbstberechnungsprogramm für Arbeitslosengeld auf der Website der Arbeitsagentur nutzen.

In [None]:
response = query_engine.query("Wie viel Arbeitslosengeld Sie bekommen?")
display(Markdown(f"{response}"))

The amount of Arbeitslosengeld (unemployment benefit) that you will receive depends on several factors, including your previous earnings, the applicable tax class, and whether you have any children. The Arbeitsagentur (employment agency) will calculate your daily Arbeitslosengeld based on these factors. The exact amount will be specified in your approval notice, which will also include the calculation details. You can also use the self-calculation program for Arbeitslosengeld on the Arbeitsagentur website to estimate the amount you will receive.

In [None]:
a1 = display_response("Quanti soldi ricevo come sussidio di disoccupazione?")

La quantità di denaro che ricevi come sussidio di disoccupazione dipende da diversi fattori, come il tuo reddito precedente, la tua situazione familiare e la durata del periodo di disoccupazione. La tua agenzia per il lavoro calcolerà un tasso giornaliero di sussidio basato sul tuo reddito precedente e su altri fattori pertinenti. Tuttavia, senza ulteriori informazioni specifiche sul tuo caso, non posso fornire una cifra esatta. Ti consiglio di contattare direttamente la tua agenzia per il lavoro per ottenere informazioni precise sul sussidio di disoccupazione che potresti ricevere.