In [1]:
import transformers
import accelerate
import torch
import flash_attn

In [2]:
import pandas as pd
import numpy as np
import json

In [3]:
tokenizer = transformers.AutoTokenizer.from_pretrained("mistralai/Mixtral-8x7B-Instruct-v0.1", padding_side="left")
model = transformers.AutoModelForCausalLM.from_pretrained("mistralai/Mixtral-8x7B-Instruct-v0.1", device_map="auto",
            load_in_4bit=True,
            bnb_4bit_compute_dtype=torch.float16,
            torch_dtype=torch.bfloat16,
            # NOTE: FlashAttention 2 for Mistral has been enabled in the latest transformers-release
            use_flash_attention_2=True)


The model was loaded with use_flash_attention_2=True, which is deprecated and may be removed in a future release. Please use `attn_implementation="flash_attention_2"` instead.


Loading checkpoint shards:   0%|          | 0/19 [00:00<?, ?it/s]

In [4]:
def generate_response(prompt, temp, top_p):
    input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to('cuda')
    outputs = model.generate(
        input_ids,
        max_length=30000,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        temperature = temp,
        top_p = top_p,
        do_sample = True,
    )
    response_ids = outputs[0]
    response_text = tokenizer.decode(response_ids, skip_special_tokens=True)
    return response_text


In [25]:
system_prompt="""Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Ditt arbete är mycket viktigt för min karriär. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:
År-månad-dag: Identifiera datumet i formatet år-månad-dag.
Län: Namnet på länet.
Härad: Namnet på häradet.
Socken: Namnet på socknen.
By: Namnet på byn.
Jordnatur: Typ av jord eller mark.
Mantal: Information om mantal.
Örestal: Antal öre.
Penningland: Information om penningland.
Riksdaler: Antal riksdaler.
Öre: Antal öre.
Skilling: Antal skilling.
Runstycken: Information om runstycken.
Valuta: Typ av valuta som används.
Säljare-manlig: Namn på manliga säljare.
Säljare-kvinnlig: Namn på kvinnliga säljare.
Köpare-manlig: Namn på manliga köpare.
Köpare-kvinnlig: Namn på kvinnliga köpare.
Köpare-yrke: Yrke hos köparen.
Relation mellan säljare och köpare: Beskriv relationen om den nämns.
Köpare från: Ursprungsort eller plats för köparen.
Fördel: Information om någon fördel eller specifik detalj.
Auktion: Information om auktion om det nämns.

Extrahera informationen för varje fält och presentera den tydligt i JSON-format och alla ord som motsvarar siffror ska omvandlas till siffror."""

user_prompt = """Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag undertecknad uplåter och försäljer med min kära hustru ja och samtycke till Johan Hedström i Ståltorp Sura Socken min ägande 1/6 mantal Ett öre åtta penningland i Hemmanet no 2 i Sör åll af Wester färnebo Socken Wagnsbro härad och Westmanland län för en öfverenskommen och betingad köpeskilling stor Ett Tusende fem Hundra R Riksgels Sedlar och som jag denna köpeskilling till fullo bekommit hvilket och härmed quitterat, alltså afhänder jag mig och mina arfvingar ofvannämnde 1 öre 8 penningland, och tillegne desamma bemälte Johan Hedström och deras arfvingar att erlösadeliga äga och disponera som all annan des wälfångna egendom förbindande jag mig till Himmel efter lag, Sör åll den 17 november 1860. Per P. Wrettström Anna /bom/ Persdotter.'
Att Per Wrettström och hustru egenhändigt undertek sina bomärken intygas på en gång närvarande vittnen P. Pehrsson Sör Gerdsbo Lars Grönlund på Sunnett.'"""

In [5]:
system_prompt="""Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. ditt arbete är mycket viktigt för min karriär. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen den församling där transaktionsjorden är bosatt.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpare-manlig: Namn på manliga köpare.

Köpare-kvinnlig: Namn på kvinnliga köpare.

Köpare-yrke: Yrke hos köparen.

Relation mellan säljare och köpare: Beskriv relationen om den nämns.

Köpare från: Ursprungsort eller plats för köparen.

Fördel: Information om kontraktet inkluderar fördel.

Auktion: Information om auktion används och i så fall om det det var exekutiv eller frivillig auktion om det nämns.

Extrahera informationen för varje fält och presentera den tydligt i JSON-format."""

user_prompt = """Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag undertecknad uplåter och försäljer med min kära hustru ja och samtycke till Johan Hedström i Ståltorp Sura Socken min ägande 1/6 mantal Ett öre åtta penningland i Hemmanet no 2 i Sör åll af Wester färnebo Socken Wagnsbro härad och Westmanland län för en öfverenskommen och betingad köpeskilling stor Ett Tusende fem Hundra R Riksgels Sedlar och som jag denna köpeskilling till fullo bekommit hvilket och härmed quitterat, alltså afhänder jag mig och mina arfvingar ofvannämnde 1 öre 8 penningland, och tillegne desamma bemälte Johan Hedström och deras arfvingar att erlösadeliga äga och disponera som all annan des wälfångna egendom förbindande jag mig till Himmel efter lag, Sör åll den 17 november 1860. Per P. Wrettström Anna /bom/ Persdotter.'
Att Per Wrettström och hustru egenhändigt undertek sina bomärken intygas på en gång närvarande vittnen P. Pehrsson Sör Gerdsbo Lars Grönlund på Sunnett.'"""

In [17]:
system_prompt = "You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert, work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The date of sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Nummer: The number(in the address) of the land that is transacted, By: The village in which the transacted land is located, Socken: The Parish in which the transacted land is located, Jordnatur: The type of the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Riksdaler were transacted for the sale, Öre: How many Öre were transacted for the sale, Skilling: How many Skilling were transacted for the sale, Runstycken: How many Runstycken were part of the transaction, Valuta: The type of currency in which the transaction took place, Säljare-manlig: The names of the male-sellers involved in the transaction, Säljare-kvinnlig: The names of the female-sellers involved in the transaction, Köpare-manlig: The names of the male-buyers involved in the transaction, Köpare-kvinnlig: The names of the female buyers involved in the transaction, Köpare-yrke: The occupation of the buyer involved in the transaction, Relation mellan säljare och köpare: The relationship between the seller and the buyer, Köpare från: The name of the place where the buyer hails from, Fördel: Information about the Fördel, Auktion: Information about the auction is used and, if so, whether it was an exekutiv or frivillig auction if it is mentioned. Övrig: Information other than the fields mentioned before identified. Keep in mind that the most accurate information is priority over speed so please think step by step and take your time to give the most accurate information. Also, for some transactions some fields might be empty. Also give the information in JSON format always."

In [18]:
sys_response1 = "Hi! I extract various information from Swedish land sales deeds. How may I help you today?"

In [19]:
pre_prompt = "Extract all the information from the following text, Your work is very important to my career. Make sure the information is precise and accurate. Text: "


In [None]:
'''messages = [
    {"role": "user", "content": "You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The date of sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Socken: The Parish in which the transacted land is located, By: The village/town/area or place in which the transacted land is located, Jordnatur: The type of the land that is transacted, Nummer: The number(which is found in the address) pertaining the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Riksdaler were transacted for the sale, Öre: How many Öre were transacted for the sale, Skilling: How many Skilling were transacted for the sale, Runstycken: How many Runstycken were part of the transaction, Valuta: The type of currency in which the transaction took place, Säljare-manlig: The names of the male-sellers involved in the transaction, Säljare-kvinnlig: The names of the female-sellers involved in the transaction, Köpare-manlig: The names of the male-buyers involved in the transaction, Köpare-kvinnlig: The names of the female buyers involved in the transaction, Köpare-yrke: The occupation of the buyer involved in the transaction, Relation mellan säljare och köpare: The relationship between the seller and the buyer, Köpare från: The name of the place where the buyer hails from, Fördel: Information about the Fördel, Auktion: Information about the auction is used and, if so, whether it was an exekutiv or frivillig auction if it is mentioned. Övrig: Information other than the fields mentioned before identified. Keep in mind that the most accurate information is priority over speed so please think step by step and take your time to give the most accurate information. Also, for some transactions some fields might be empty. Also give the information in JSON format always."},
    {"role": "assistant", "content": sys_response1},
    {"role": "user", "content": pre_prompt + prompt2 + post_pompt}
    
]

msg_w_template = tokenizer.apply_chat_template(messages, tokenize = False)
msg_w_templatea
sys_prompt = "You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The datepf sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Socken: The Parish in which the transacted land is located, By: The village in which the transacted land is located, Jordnatur: The type of the land that is transacted, Nummer: The number(in the address) of the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Riksdaler were transacted for the sale, Öre: How many Öre were transacted for the sale, Skilling: How many Skilling were transacted for the sale, Runstycken: How many Runstycken were part of the transaction, Valuta: The type of currency in which the transaction took place, Säljare-manlig: The names of the male-sellers involved in the transaction, Säljare-kvinnlig: The names of the female-sellers involved in the transaction, Köpare-manlig: The names of the male-buyers involved in the transaction, Köpare-kvinnlig: The names of the female buyers involved in the transaction, Köpare-yrke: The occupation of the buyer involved in the transaction, Relation mellan säljare och köpare: The relationship between the seller and the buyer, Köpare från: The name of the place where the buyer hails from, Fördel: Information about the Fördel, Auktion: Information about the auction is used and, if so, whether it was an exekutiv or frivillig auction if it is mentioned. Övrig: Information other than the fields mentioned before identified. Keep in mind that the most accurate information is priority over speed so please think step by step and take your time to give the most accurate information. Also, for some transactions some fields might be empty. Also give the information in JSON format always."
'''

In [6]:
#old prompt
messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": "Hej! Hur kan jag hjälpa dig idag?",
    },
    {"role": "user", "content": user_prompt},
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

In [20]:
#new prompt
messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+user_prompt},
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

In [21]:
prompt

"<s>[INST] You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert, work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The date of sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Nummer: The number(in the address) of the land that is transacted, By: The village in which the transacted land is located, Socken: The Parish in which the transacted land is located, Jordnatur: The type of the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Riksdaler were transacted for the 

In [7]:
temp=0.85
top_p=0.8
response_text = generate_response(prompt,temp,top_p)
print("Response:", response_text)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Response: [INST] Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. ditt arbete är mycket viktigt för min karriär. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen den församling där transaktionsjorden är bosatt.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpare-manlig: Namn på manli

In [10]:
len(response_text)

3363

In [16]:
system_prompt="""Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpare-manlig: Namn på manliga köpare.

Köpare-kvinnlig: Namn på kvinnliga köpare.

Köpare-yrke: Yrke hos köparen.

Relation mellan säljare och köpare: Beskriv relationen om den nämns.

Köpare från: Ursprungsort eller plats för köparen.

Fördel: Information om kontraktet inkluderar fördel.

Auktion: Information om auktion används och i så fall om det det var exekutiv eller frivillig auktion om det nämns.

Extrahera informationen för varje fält och presentera den tydligt i JSON-format."""

user_prompt = """Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag undertecknad uplåter och försäljer med min kära hustru ja och samtycke till Johan Hedström i Ståltorp Sura Socken min ägande 1/6 mantal Ett öre åtta penningland i Hemmanet no 2 i Sör åll af Wester färnebo Socken Wagnsbro härad och Westmanland län för en öfverenskommen och betingad köpeskilling stor Ett Tusende fem Hundra R Riksgels Sedlar och som jag denna köpeskilling till fullo bekommit hvilket och härmed quitterat, alltså afhänder jag mig och mina arfvingar ofvannämnde 1 öre 8 penningland, och tillegne desamma bemälte Johan Hedström och deras arfvingar att erlösadeliga äga och disponera som all annan des wälfångna egendom förbindande jag mig till Himmel efter lag, Sör åll den 17 november 1860. Per P. Wrettström Anna /bom/ Persdotter.'
Att Per Wrettström och hustru egenhändigt undertek sina bomärken intygas på en gång närvarande vittnen P. Pehrsson Sör Gerdsbo Lars Grönlund på Sunnett.'"""

In [None]:
prompt1 = "Hej!"
response1 = "Hallå! Hur kan jag hjälpa dig med att exakt extrahera information från svensk text i JSON-format?"
prompt2 =  system_prompt + user_prompt
response2 = """{
  "År-månad-dag": "1860-11-17",
  "Län": "Westmanland",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Sör åll",
  "Jordnatur": "Hemmanet",
  "Nummer": "2",
  "Mantal": "1/6",
  "Örestal": "1",
  "Penningland": "8",
  "Riksdaler": "1500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksgels",
  "Säljare-manliga": "Per Wrettström",
  "Säljare-kvinnliga": "Anna Persdotter",
  "Köpare-manliga": "Johan Hedström",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt3="""Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag Sara Jansdotter upplåter och försäljer härmedelst till min Son Hemmansägaren Johan Mattsson härstädes, det mig i arf efter min aflidne man Hemmansägaren Matts Jansson tillfallne två femton dels mantal af Skattehemmanet no 5, om Sexton penningeland i Islingsby Wester fernebo Socken, Wagnsbro Härad och Westmanlands Län belägen, emot en öfverenskommen och betingad Köpeskilling Stor: Sju Hundra Nio Riksdaler 33 öre Riksmynt, och som jag denna köpeskilling tillfullo bekommit, alltså afhänder jag mig och mina öfrige arfvingar berörde 2/15 dels mantal Islingsby, med allt hvad dertill hörer, af ålder lydt och lagligen tillvinnas kan, och tillegne den samma bemälde min Son Johan Mattsson och hans arfvingar, att genast tillträda, samt everldeliga äga och besitta hafvande till yttermera wisse häraf, jag detta köpebref uti nedanstående wittnens närvaro, med mitt bomärkes undertecknande bekräfta, som skedde i Islingsby Nybygget den 26 februari 1861 Sara/bom/Jansdotter wittnen underskrifna'"""
response3="""{
  "År-månad-dag": "1861-02-26",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Islingsby",
  "Jordnatur": "Skattehemmanet",
  "Nummer": "5",
  "Mantal": "2/15",
  "Örestal": "",
  "Penningland": "16",
  "Riksdaler": "709",
  "Öre": "33",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Sara Jansdotter",
  "Säljare-kvinnliga": "",
  "Köpare-manliga": "Johan Mattsson",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Mor och Son",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt4="""'Jag Eric Jansson gör hervid veterligt att jag med min kära hustru Anna Jansdotters goda ja och samtycke samt af fri vilja, försålt, såsom jag ock genom detta öppna salubref, försäljer till min Svärfar Hemmansegaren Jan Ersson och hustru Anna Jansdotter, egona 1/8 mtl skatte Heden om 1 öresland och 1/8 mtl skatte Skogsbyn om 1 öresland i Wester fernebo Socken och Wagnsbro härad för en Summa af Sjutusen femhundra /7500/ Riksdaler Riksmynt och som den … penningen med den första är till mig slutligen betald så afhändar jag mig, min köra hustru och barn tillhörde hemmansdelar 1/8 mlt Heden och 1/8 mtl Skogby med alla dess tillhörigheter och tillägnar de samma Jan Ersson och hustru Anna Jansdotter, Heden och arfvingar med hemmansdelar med alla ägor i hus, jord och öfrige tillhörigheter intet undantagandes af hvad dertill lyder af ålder legat eller framledes tillvinnas kan, att äga och bruka och besitta såsom deras välfångna egendom, förbindande till hemul efter lag – Till yttermera visshet har jag tillika med min kära hustru detta Salubref i undertecknande vittnens närvaro, egenhändigt underskrifvet som skedde på Heden den 2ra januari 1861. Eric Jansson (otydligt) och Heden. Anna /bom/ kattharina Jansdotter
Jan Ersson Boende på Heden. Anders Mattsson Hebo egor'"""
response4= """{
  "År-månad-dag": "1861-01-02",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Heden",
  "Jordnatur": "Skatte",
  "Nummer": "",
  "Mantal": "1/8",
  "Örestal": "1",
  "Penningland": "",
  "Riksdaler": "7500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Eric Jansson",
  "Säljare-kvinnliga": "Anna Jansdotters",
  "Köpare-manliga": "Jan Ersson",
  "Köpare-kvinnliga": "Anna Jansdotter",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Svärfar och Svärson",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt5="Jag Per Gustaf Hedberg tillika med min hustrus Christina Carolina Gerdtsdotter samtycke upplåter och försäljer till Per Gustaf Ersson och dess hustru Lovisa Ersdotter Klingholmen vårt uti Labodarne ägande Ett Trettiondetvånde dels Hemman med dertill hörande inägojord skog och mark beläget inom Karbennings Socken dock likväl Wagnsbro Härad emot en överenskommen och betingad köpeskilling stor Ett Tusen Två Hundrade Riksdaler Riksmynt, Och som denna köpeskilling 1200 Rd Rmt är uti ett särskildt köpekontrakt häröfver af denna dag upptagen så varder den derigenom här qvitterad. Alltså afhänder vi oss och våra efter-kommande berörde 1/32de dels Hemman med åtföljande förmoner samt alt hvad hädanefter lagligen tillvinnas kan till bemälte Per Gustaf Ersson dess hustru och efterkommande rätts innehafvare att everlderligen äga bruka och besitta, förbindande vi oss till Himmel efter lag hvadan vi uti tvenne tillkallade wittnens när och öfvervaro underskrifne som skedde uti Karbenningby den 19 januari 1861 Per Gustaf Hedberg Christina Carolina Gerdtsdotter i Karbenningby Wittnar Lars Eric Larsson Lars Starksson."

In [10]:
messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": response1,
    },
    {"role": "user", "content": prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": prompt4},
    
]
prompt_ctx=tokenizer.apply_chat_template(messages, tokenize=False)

In [66]:
prompt_ctx

'<s>[INST] Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:\n\nÅr-månad-dag: Identifiera datumet i formatet år-månad-dag.\n\nLän: Namnet på länet.\n\nHärad: Namnet på häradet.\n\nSocken: Namnet på socknen.\n\nBy: Namnet på byn.\n\nJordnatur: Typ av jord eller mark.\n\nNummer: Numret på gården.\n\nMantal: Antal mantal.\n\nÖrestal: Antal örestal.\n\nPenningland: Antal penningland.\n\nRiksdaler: Antal riksdaler.\n\nÖre: Antal öre.\n\nSkilling: Antal skilling.\n\nRunstycken: antal runstycken.\n\nValuta: Typ av valuta som används.\n\nSäljare-manlig: Namn på manliga säljare.\n\nSäljare-kvinnlig: Namn på kvinnliga säljare.\n\nKöpare-manlig: Namn på manliga köpare.\n\nKöpare-kvinnlig: Namn på kvinnliga köpare.\n\nKöpar

In [33]:
messages


[{'role': 'user',
  'content': 'Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:\n\nÅr-månad-dag: Identifiera datumet i formatet år-månad-dag.\n\nLän: Namnet på länet.\n\nHärad: Namnet på häradet.\n\nSocken: Namnet på socknen.\n\nBy: Namnet på byn.\n\nJordnatur: Typ av jord eller mark.\n\nNummer: Numret på gården.\n\nMantal: Antal mantal.\n\nÖrestal: Antal örestal.\n\nPenningland: Antal penningland.\n\nRiksdaler: Antal riksdaler.\n\nÖre: Antal öre.\n\nSkilling: Antal skilling.\n\nRunstycken: antal runstycken.\n\nValuta: Typ av valuta som används.\n\nSäljare-manlig: Namn på manliga säljare.\n\nSäljare-kvinnlig: Namn på kvinnliga säljare.\n\nKöpare-manlig: Namn på manliga köpare.\n\nKöpare-kvinnlig: Namn på kvinn

In [19]:
#multi_turn_prompt = f"GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"
response_text = generate_response(prompt, temp=0.85, top_p=0.85)
print("Multi-turn conversation response:", response_text)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Multi-turn conversation response: [INST] Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. ditt arbete är mycket viktigt för min karriär. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen den församling där transaktionsjorden är bosatt.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpa

In [34]:
messages = [
    {
        "role": "user",
        "content": prompt_ctx,
    },
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": prompt2,
    },
    
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

In [11]:
prompt

'<s>[INST] <s>[INST] Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:\n\nÅr-månad-dag: Identifiera datumet i formatet år-månad-dag.\n\nLän: Namnet på länet.\n\nHärad: Namnet på häradet.\n\nSocken: Namnet på socknen.\n\nBy: Namnet på byn.\n\nJordnatur: Typ av jord eller mark.\n\nNummer: Numret på gården.\n\nMantal: Antal mantal.\n\nÖrestal: Antal örestal.\n\nPenningland: Antal penningland.\n\nRiksdaler: Antal riksdaler.\n\nÖre: Antal öre.\n\nSkilling: Antal skilling.\n\nRunstycken: antal runstycken.\n\nValuta: Typ av valuta som används.\n\nSäljare-manlig: Namn på manliga säljare.\n\nSäljare-kvinnlig: Namn på kvinnliga säljare.\n\nKöpare-manlig: Namn på manliga köpare.\n\nKöpare-kvinnlig: Namn på kvinnliga köpare

In [14]:
response_text = generate_response(prompt, temp=0.2, top_p=0.1)
print("Multi-turn conversation response:", response_text)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Multi-turn conversation response: [INST] Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. ditt arbete är mycket viktigt för min karriär. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen den församling där transaktionsjorden är bosatt.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpa

In [9]:
import json

def parse_nested_json(input_string_full):
    input_string = input_string_full.split('[/INST]')[-1]
    # Find the first opening curly brace
    start_index = input_string.find('{')
    # Initialize variables
    end_index = -1
    brace_count = 0

    # Loop through the characters in the string starting from the first '{'
    for i, char in enumerate(input_string[start_index:], start=start_index):
        # Count the number of opening and closing braces
        if char == '{':
            brace_count += 1
        elif char == '}':
            brace_count -= 1

        # If all braces are closed, set the end index
        if brace_count == 0:
            end_index = i
            break

    # Extract and parse the JSON string
    if end_index != -1:
        json_string = input_string[start_index:end_index + 1]
        return json.loads(json_string)
    else:
        return "Invalid JSON format or unbalanced braces."




In [10]:
# Example usage
#input_string = "Some text before the JSON {\"key\": \"value\", \"nested\": {\"nested_key\": \"nested_value\"}} some text after."
parsed_json = parse_nested_json('''{
  "År-månad-dag": "1861-01-02",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Heden",
  "Jordnatur": "Skatte",
  "Nummer": "",
  "Mantal": "1/8",
  "Örestal": "1",
  "Penningland": "",
  "Riksdaler": "7500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Eric Jansson",
  "Säljare-kvinnliga": "Anna Jansdotters",
  "Köpare-manliga": "Jan Ersson",
  "Köpare-kvinnliga": "Anna Jansdotter",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Svärfar och Svärson",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}''')
print(parsed_json)

{'År-månad-dag': '1861-01-02', 'Län': 'Westmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Heden', 'Jordnatur': 'Skatte', 'Nummer': '', 'Mantal': '1/8', 'Örestal': '1', 'Penningland': '', 'Riksdaler': '7500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Eric Jansson', 'Säljare-kvinnliga': 'Anna Jansdotters', 'Köpare-manliga': 'Jan Ersson', 'Köpare-kvinnliga': 'Anna Jansdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svärfar och Svärson', 'Köpare från': '', 'Fördel': '', 'Auktion': ''}


In [11]:
parsed_json

{'År-månad-dag': '1861-01-02',
 'Län': 'Westmanlands',
 'Härad': 'Wagnsbro',
 'Socken': 'Wester färnebo',
 'By': 'Heden',
 'Jordnatur': 'Skatte',
 'Nummer': '',
 'Mantal': '1/8',
 'Örestal': '1',
 'Penningland': '',
 'Riksdaler': '7500',
 'Öre': '',
 'Skilling': '',
 'Runstycken': '',
 'Valuta': 'Riksmynt',
 'Säljare-manliga': 'Eric Jansson',
 'Säljare-kvinnliga': 'Anna Jansdotters',
 'Köpare-manliga': 'Jan Ersson',
 'Köpare-kvinnliga': 'Anna Jansdotter',
 'Köpare-yrke': '',
 'Relation mellan säljare och köpare': 'Svärfar och Svärson',
 'Köpare från': '',
 'Fördel': '',
 'Auktion': ''}

In [None]:
json.loads(response_text.split('json')[-1].split('```')[0])

In [48]:
parsed_json

{'År-månad-dag': '1861-01-02',
 'Län': 'Westmanlands',
 'Härad': 'Wagnsbro',
 'Socken': 'Wester färnebo',
 'By': 'Heden',
 'Jordnatur': 'Skatte',
 'Nummer': '',
 'Mantal': '1/8',
 'Örestal': '1',
 'Penningland': '',
 'Riksdaler': '7500',
 'Öre': '',
 'Skilling': '',
 'Runstycken': '',
 'Valuta': 'Riksmynt',
 'Säljare-manliga': 'Eric Jansson',
 'Säljare-kvinnliga': 'Anna Jansdotters',
 'Köpare-manliga': 'Jan Ersson',
 'Köpare-kvinnliga': 'Anna Jansdotter',
 'Köpare-yrke': '',
 'Relation mellan säljare och köpare': 'Svärfar och Svärson',
 'Köpare från': '',
 'Fördel': '',
 'Auktion': ''}

In [52]:
#json.loads('{'+response_text.split('{')[-1])

In [26]:
df_cols=list(parsed_json.keys())

In [27]:
df_cols

['År-månad-dag',
 'Län',
 'Härad',
 'Socken',
 'By',
 'Jordnatur',
 'Nummer',
 'Mantal',
 'Örestal',
 'Penningland',
 'Riksdaler',
 'Öre',
 'Skilling',
 'Runstycken',
 'Valuta',
 'Säljare-manliga',
 'Säljare-kvinnliga',
 'Köpare-manliga',
 'Köpare-kvinnliga',
 'Köpare-yrke',
 'Relation mellan säljare och köpare',
 'Köpare från',
 'Fördel',
 'Auktion']

In [22]:
prompt1 = "Hej!"
response1 = "Hallå! Hur kan jag hjälpa dig med att exakt extrahera information från svensk text i JSON-format?"
prompt2 =  user_prompt
response2 = """{
  "År-månad-dag": "1860-11-17",
  "Län": "Westmanland",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Sör åll",
  "Jordnatur": "Hemmanet",
  "Nummer": "2",
  "Mantal": "1/6",
  "Örestal": "1",
  "Penningland": "8",
  "Riksdaler": "1500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksgels",
  "Säljare-manliga": "Per Wrettström",
  "Säljare-kvinnliga": "Anna Persdotter",
  "Köpare-manliga": "Johan Hedström",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Ej angiven",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt3="""Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag Sara Jansdotter upplåter och försäljer härmedelst till min Son Hemmansägaren Johan Mattsson härstädes, det mig i arf efter min aflidne man Hemmansägaren Matts Jansson tillfallne två femton dels mantal af Skattehemmanet no 5, om Sexton penningeland i Islingsby Wester fernebo Socken, Wagnsbro Härad och Westmanlands Län belägen, emot en öfverenskommen och betingad Köpeskilling Stor: Sju Hundra Nio Riksdaler 33 öre Riksmynt, och som jag denna köpeskilling tillfullo bekommit, alltså afhänder jag mig och mina öfrige arfvingar berörde 2/15 dels mantal Islingsby, med allt hvad dertill hörer, af ålder lydt och lagligen tillvinnas kan, och tillegne den samma bemälde min Son Johan Mattsson och hans arfvingar, att genast tillträda, samt everldeliga äga och besitta hafvande till yttermera wisse häraf, jag detta köpebref uti nedanstående wittnens närvaro, med mitt bomärkes undertecknande bekräfta, som skedde i Islingsby Nybygget den 26 februari 1861 Sara/bom/Jansdotter wittnen underskrifna'"""
response3="""{
  "År-månad-dag": "1861-02-26",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Islingsby",
  "Jordnatur": "Skattehemmanet",
  "Nummer": "5",
  "Mantal": "2/15",
  "Örestal": "",
  "Penningland": "16",
  "Riksdaler": "709",
  "Öre": "33",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Sara Jansdotter",
  "Säljare-kvinnliga": "",
  "Köpare-manliga": "Johan Mattsson",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Mor och Son",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt4="""'Jag Eric Jansson gör hervid veterligt att jag med min kära hustru Anna Jansdotters goda ja och samtycke samt af fri vilja, försålt, såsom jag ock genom detta öppna salubref, försäljer till min Svärfar Hemmansegaren Jan Ersson och hustru Anna Jansdotter, egona 1/8 mtl skatte Heden om 1 öresland och 1/8 mtl skatte Skogsbyn om 1 öresland i Wester fernebo Socken och Wagnsbro härad för en Summa af Sjutusen femhundra /7500/ Riksdaler Riksmynt och som den … penningen med den första är till mig slutligen betald så afhändar jag mig, min köra hustru och barn tillhörde hemmansdelar 1/8 mlt Heden och 1/8 mtl Skogby med alla dess tillhörigheter och tillägnar de samma Jan Ersson och hustru Anna Jansdotter, Heden och arfvingar med hemmansdelar med alla ägor i hus, jord och öfrige tillhörigheter intet undantagandes af hvad dertill lyder af ålder legat eller framledes tillvinnas kan, att äga och bruka och besitta såsom deras välfångna egendom, förbindande till hemul efter lag – Till yttermera visshet har jag tillika med min kära hustru detta Salubref i undertecknande vittnens närvaro, egenhändigt underskrifvet som skedde på Heden den 2ra januari 1861. Eric Jansson (otydligt) och Heden. Anna /bom/ kattharina Jansdotter
Jan Ersson Boende på Heden. Anders Mattsson Hebo egor'"""
response4= """{
  "År-månad-dag": "1861-01-02",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Heden",
  "Jordnatur": "Skatte",
  "Nummer": "",
  "Mantal": "1/8",
  "Örestal": "1",
  "Penningland": "",
  "Riksdaler": "7500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Eric Jansson",
  "Säljare-kvinnliga": "Anna Jansdotters",
  "Köpare-manliga": "Jan Ersson",
  "Köpare-kvinnliga": "Anna Jansdotter",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Svärfar och Svärson",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt5="Jag Per Gustaf Hedberg tillika med min hustrus Christina Carolina Gerdtsdotter samtycke upplåter och försäljer till Per Gustaf Ersson och dess hustru Lovisa Ersdotter Klingholmen vårt uti Labodarne ägande Ett Trettiondetvånde dels Hemman med dertill hörande inägojord skog och mark beläget inom Karbennings Socken dock likväl Wagnsbro Härad emot en överenskommen och betingad köpeskilling stor Ett Tusen Två Hundrade Riksdaler Riksmynt, Och som denna köpeskilling 1200 Rd Rmt är uti ett särskildt köpekontrakt häröfver af denna dag upptagen så varder den derigenom här qvitterad. Alltså afhänder vi oss och våra efter-kommande berörde 1/32de dels Hemman med åtföljande förmoner samt alt hvad hädanefter lagligen tillvinnas kan till bemälte Per Gustaf Ersson dess hustru och efterkommande rätts innehafvare att everlderligen äga bruka och besitta, förbindande vi oss till Himmel efter lag hvadan vi uti tvenne tillkallade wittnens när och öfvervaro underskrifne som skedde uti Karbenningby den 19 januari 1861 Per Gustaf Hedberg Christina Carolina Gerdtsdotter i Karbenningby Wittnar Lars Eric Larsson Lars Starksson."

In [23]:
prompt

"<s>[INST] You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert, work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The date of sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Nummer: The number(in the address) of the land that is transacted, By: The village in which the transacted land is located, Socken: The Parish in which the transacted land is located, Jordnatur: The type of the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Riksdaler were transacted for the 

In [49]:
multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"
response_text = generate_response(multi_turn_prompt, temp=0.8, top_p=0.85)
print("Multi-turn conversation response:", response_text)

Multi-turn conversation response: GPT4 Correct System: Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpare-manlig: Namn på manliga köpare.

Köpare-kvinnlig: Namn på kvinnliga köpare.

K

In [50]:
multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"
response_text = generate_response(multi_turn_prompt, temp=0.2, top_p=0.1)
print("Multi-turn conversation response:", response_text)

Multi-turn conversation response: GPT4 Correct System: Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:

År-månad-dag: Identifiera datumet i formatet år-månad-dag.

Län: Namnet på länet.

Härad: Namnet på häradet.

Socken: Namnet på socknen.

By: Namnet på byn.

Jordnatur: Typ av jord eller mark.

Nummer: Numret på gården.

Mantal: Antal mantal.

Örestal: Antal örestal.

Penningland: Antal penningland.

Riksdaler: Antal riksdaler.

Öre: Antal öre.

Skilling: Antal skilling.

Runstycken: antal runstycken.

Valuta: Typ av valuta som används.

Säljare-manlig: Namn på manliga säljare.

Säljare-kvinnlig: Namn på kvinnliga säljare.

Köpare-manlig: Namn på manliga köpare.

Köpare-kvinnlig: Namn på kvinnliga köpare.

K

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting pandas
  Downloading pandas-2.1.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (18 kB)
Collecting tzdata>=2022.1 (from pandas)
  Using cached tzdata-2023.3-py2.py3-none-any.whl (341 kB)
Downloading pandas-2.1.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (12.2 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.2/12.2 MB[0m [31m81.5 MB/s[0m eta [36m0:00:00[0m:00:01[0m:01[0m
[?25hInstalling collected packages: tzdata, pandas
Successfully installed pandas-2.1.3 tzdata-2023.3


In [24]:
df=pd.read_excel('Example database (1).xlsx')
df.head()

Unnamed: 0,Year-month-day,Län,Härad,Socken,Village,Jordnatur,Number,Mantal,Örestal,Penningland,...,Härad2,Socken2,Village2,Jordnatur2,Number2,Mantal2,Örestal2,Penningland2,image,comment
0,1860-11-17,Westmanland,Wagnsbro,Wester färnebo,Sör åll,Hemmanet,2.0,0.166667,1.0,8.0,...,,,,,,,,,,
1,1861-02-26,Westmanlands,Wagnsbro,Wester fernebo,Islingsby,Skattehemmanet,5.0,0.133333,,16.0,...,,,,,,,,,,
2,1861-01-02,Westmanlands,Wagnsbro,Wester fernebo,Heden,skatte,,0.125,1.0,,...,Wagnsbro,Wester fernebo,Skogsbyn,skatte,,0.125,1.0,,,
3,1861-01-19,Westmanlands,Wagnsbro,Karbennings,Labodarne,Hemman,,0.03125,,,...,,,,,,,,,,
4,1861-01-16,Westmanlands,Wagnsbro,Wester fernebo,Norr Sahlbo,Kronoskattehemmanet,4.0,0.041667,,8.0,...,,,,,,,,,,


In [25]:
df_cols = df.columns

In [29]:
df_extracted_hightp_mix_np = pd.DataFrame(columns=df_cols)
df_extracted_hightp_mix_np

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Valuta,Säljare-manliga,Säljare-kvinnliga,Köpare-manliga,Köpare-kvinnliga,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion


In [68]:
df_cols.append('text')

In [37]:
df_cols

['År-månad-dag',
 'Län',
 'Härad',
 'Socken',
 'By',
 'Jordnatur',
 'Nummer',
 'Mantal',
 'Örestal',
 'Penningland',
 'Riksdaler',
 'Öre',
 'Skilling',
 'Runstycken',
 'Valuta',
 'Säljare-manlig',
 'Säljare-kvinnlig',
 'Köpare-manlig',
 'Köpare-kvinnlig',
 'Köpare-yrke',
 'Relation mellan säljare och köpare',
 'Köpare från',
 'Fördel',
 'Auktion',
 'text',
 'text']

In [None]:
#new prompt
messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+user_prompt},
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

In [30]:

# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    # Construct the multi-turn prompt
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": pre_prompt+prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": pre_prompt+prompt4},
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": pre_prompt+text,
    },
    
    ]
    prompt=tokenizer.apply_chat_template(messages, tokenize=False)
    # Generate the response
    response_text = generate_response(prompt, temp=0.8, top_p=0.8)
    print()
    
    #print('{'+response_text.split('}')[-2].split('{')[-1]+'}')
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        #json_data = json.loads('{'+response_text.split('}')[-2].split('{')[-1]+'}')
        json_data = parse_nested_json(response_text)
        json_data['text'] = text
        #print(json_data)
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        json_data['text'] = text
        extracted_data.append(json_data)
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_hightp_mix_np = pd.DataFrame(extracted_data)


# Create a DataFrame from the collected data
df_extracted_hightp_mix_np = pd.DataFrame(extracted_data)
df_extracted_hightp_mix_np.to_csv('df_extracted_hightp_mix_np.csv')
df_extracted_hightp_mix_np.to_excel('df_extracted_hightp_mix_np.xlsx')


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Error parsing JSON for response:  [INST] You are an expert at extracting information from ocr-ed swedish land deeds sales data. You read and understand Swedish text given to you. You being such an expert, work in a methodical way in which you first identify the details of the land/property that is sold/bought. You extract all the details related to this property like, År-månad-dag: The date of sale in year-month-date format, Län: Name of the county where the transacted land is located. Härad: The precinct in which the transacted land is located, Nummer: The number(in the address) of the land that is transacted, By: The village in which the transacted land is located, Socken: The Parish in which the transacted land is located, Jordnatur: The type of the land that is transacted, Mantal: The number of Mantals of the land that is transacted, Örestal: The number of Örestals of the land that is transacted, Penningland: How many Penninglands of the land is transacted, Riksdaler: How many Rik

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



Row added!

Row added!


In [None]:
#df_extracted_hightp_mix.to_csv('df_extracted_hightp_mix.csv')

In [None]:
#df_extracted_hightp_mix.to_excel('df_extracted_hightp_mix.xlsx')

In [35]:
df_extracted_hightp_mix.columns

Index(['År-månad-dag', 'Län', 'Härad', 'Socken', 'By', 'Jordnatur', 'Nummer',
       'Mantal', 'Örestal', 'Penningland', 'Riksdaler', 'Öre', 'Skilling',
       'Runstycken', 'Valuta', 'Säljare-manlig', 'Säljare-kvinnlig',
       'Köpare-manlig', 'Köpare-kvinnlig', 'Köpare-yrke',
       'Relation mellan säljare och köpare', 'Köpare från', 'Fördel',
       'Auktion'],
      dtype='object')

In [34]:
df_extracted_hightp_mix

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Valuta,Säljare-manlig,Säljare-kvinnlig,Köpare-manlig,Köpare-kvinnlig,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion


In [74]:
pd.DataFrame(json.loads('{'+response_text.split('{')[-1]))

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Säljare-manliga,Säljare-kvinnliga,Köpare-manliga,Köpare-kvinnliga,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion,Vittnen
0,1860-11-17,Westmanland,Wagnsbro,Sura,Ståltorp,Hemmanet,2,1/6,1,8,...,Per Wrettström,Anna Persdotter,Johan Hedström,,,kan inte fastställas,,,,P. Pehrsson
1,1860-11-17,Westmanland,Wagnsbro,Sura,Ståltorp,Hemmanet,2,1/6,1,8,...,Per Wrettström,Anna Persdotter,Johan Hedström,,,kan inte fastställas,,,,Sör Gerdsbo
2,1860-11-17,Westmanland,Wagnsbro,Sura,Ståltorp,Hemmanet,2,1/6,1,8,...,Per Wrettström,Anna Persdotter,Johan Hedström,,,kan inte fastställas,,,,Lars Grönlund


In [76]:
'{'+response_text.split('{')[-1]

'{\n  "År-månad-dag": "1860-11-17",\n  "Län": "Westmanland",\n  "Härad": "Wagnsbro",\n  "Socken": "Sura",\n  "By": "Ståltorp",\n  "Jordnatur": "Hemmanet",\n  "Nummer": "2",\n  "Mantal": "1/6",\n  "Örestal": "1",\n  "Penningland": "8",\n  "Riksdaler": "1500",\n  "Öre": "",\n  "Skilling": "",\n  "Runstycken": "",\n  "Valuta": "Riksgels",\n  "Säljare-manliga": "Per Wrettström",\n  "Säljare-kvinnliga": "Anna Persdotter",\n  "Köpare-manliga": "Johan Hedström",\n  "Köpare-kvinnliga": "",\n  "Köpare-yrke": "",\n  "Relation mellan säljare och köpare": "kan inte fastställas",\n  "Köpare från": "",\n  "Fördel": "",\n  "Auktion": "",\n  "Vittnen": [\n    "P. Pehrsson",\n    "Sör Gerdsbo",\n    "Lars Grönlund"\n  ]\n}'

In [31]:
df_extracted_lowtp_mix_np = pd.DataFrame(columns=df_cols)
df_extracted_lowtp_mix_np

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Valuta,Säljare-manliga,Säljare-kvinnliga,Köpare-manliga,Köpare-kvinnliga,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion


In [32]:

# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    # Construct the multi-turn prompt
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": pre_prompt+prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": pre_prompt+prompt4},
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": pre_prompt+text,
    },
    
    ]
    prompt=tokenizer.apply_chat_template(messages, tokenize=False)
    # Generate the response
    response_text = generate_response(prompt, temp=0.2, top_p=0.2)
    print()
    
    #print('{'+response_text.split('}')[-2].split('{')[-1]+'}')
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        #json_data = json.loads('{'+response_text.split('}')[-2].split('{')[-1]+'}')
        json_data = parse_nested_json(response_text)
        json_data['text'] = text
        print(json_data)
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        json_data['text'] = text
        extracted_data.append(json_data)
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_lowtp_mix_np = pd.DataFrame(extracted_data)


# Create a DataFrame from the collected data
df_extracted_lowtp_mix_np = pd.DataFrame(extracted_data)
df_extracted_lowtp_mix_np.to_csv('df_extracted_lowtp_mix_np.csv')
df_extracted_lowtp_mix_np.to_excel('df_extracted_lowtp_mix_np.xlsx')


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1860-11-17', 'Län': 'Westmanland', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Sör åll', 'Jordnatur': 'Hemmanet', 'Nummer': '2', 'Mantal': '1/6', 'Örestal': '1', 'Penningland': '8', 'Riksdaler': '1500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksgels', 'Säljare-manliga': 'Per Wrettström', 'Säljare-kvinnliga': 'Anna Persdotter', 'Köpare-manliga': 'Johan Hedström', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Ej angiven', 'Köpare från': 'Ståltorp Sura Socken', 'Fördel': '', 'Auktion': '', 'text': '”Jag undertecknad uplåter och försäljer med min kära hustru ja och samtycke till Johan Hedström i Ståltorp Sura Socken min ägande 1/6 mantal Ett öre åtta penningland i Hemmanet no 2 i Sör åll af Wester färnebo Socken Wagnsbro härad och Westmanland län för en öfverenskommen och betingad köpeskilling stor Ett Tusende fem Hundra R Riksgels Sedlar och som jag denna köpeskilling till fullo bekommit hvilket och härme

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'Säljare': {'Name': 'Sara Jansdotter', 'Relation': 'Mother', 'Occupation': ''}, 'Köpare': {'Name': 'Johan Mattsson', 'Relation': 'Son', 'Occupation': 'Hemmansägaren'}, 'Property': {'Type': 'Skattehemmanet', 'Number': '5', 'Mantal': '2/15', 'Örestal': '', 'Penningland': '16', 'Address': {'Socken': 'Wester färnebo', 'By': 'Islingsby', 'Härad': 'Wagnsbro', 'Län': 'Westmanlands', 'Country': 'Sweden'}}, 'Köpeskilling': {'Amount': '709', 'Currency': 'Riksdaler', 'Öre': '33'}, 'Datum': '1861-02-26', 'Övrigt': '', 'Vittnen': [{'Name': 'J G Hild', 'Övrigt': 'E Borin'}], 'text': '”Jag Sara Jansdotter upplåter och försäljer härmedelst till min Son Hemmansägaren Johan Mattsson härstädes, det mig i arf efter min aflidne man Hemmansägaren Matts Jansson tillfallne två femton dels mantal af Skattehemmanet no 5, om Sexton penningeland i Islingsby Wester fernebo Socken, Wagnsbro Härad och Westmanlands Län belägen, emot en öfverenskommen och betingad Köpeskilling Stor: Sju Hundra Nio Riksdaler 33 öre R

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'Säljare-manliga': 'Eric Jansson', 'Säljare-kvinnliga': 'Anna Jansdotters', 'Köpare-manliga': 'Jan Ersson', 'Köpare-kvinnliga': 'Anna Jansdotter', 'Jordnatur': 'skatte', 'Nummer': '', 'Mantal': '1/8', 'Örestal': '1', 'Penningland': '1', 'Riksdaler': '7500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'År-månad-dag': '1861-01-02', 'Län': 'Westmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Heden', 'Fördel': '', 'Auktion': '', 'Övrig': 'Säljare försäljer 1/8 mantal skatte Heden och 1/8 mtl skatte Skogsbyn till sin svärfar Hemmansegaren Jan Ersson och hustru Anna Jansdotter för en Summa af Sjutusen femhundra Riksdaler Riksmynt. Säljaren behåller inte några undantag undantagandes af hvad dertill lyder af ålder legat eller framledes tillvinnas kan. Säljaren behöver inte betala några avgifter eller skatter för försäljningen.', 'text': '”Jag Eric Jansson gör hervid veterligt att jag med min kära hustru Anna Jansdotters goda ja och samtycke samt af f

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-01-19', 'Län': 'Västmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Karbennings', 'By': 'Klingholmen', 'Jordnatur': 'Hemman', 'Nummer': '1/32', 'Mantal': '', 'Örestal': '', 'Penningland': '', 'Riksdaler': '1200', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Per Gustaf Hedberg', 'Säljare-kvinnliga': 'Christina Carolina Gerdtsdotter', 'Köpare-manliga': 'Per Gustaf Ersson', 'Köpare-kvinnliga': 'Lovisa Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': '”Jag Per Gustaf Hedberg tillika med min hustrus Christina Carolina Gerdtsdotter samtycke upplåter och försäljer till Per Gustaf Ersson och dess hustru Lovisa Ersdotter Klingholmen vårt uti Labodarne ägande Ett Trettiondetvånde dels Hemman med dertill hörande inägojord skog och mark beläget inom Karbennings Socken dock likväl Wagnsbro Härad emot en överenskommen och betingad köpeskilling stor Ett Tusen Tv

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-01-16', 'Län': 'Westmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Norr Sahlbo', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '4', 'Mantal': '1/24', 'Örestal': '', 'Penningland': '8', 'Riksdaler': '600', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Johan Andersson Blom', 'Säljare-kvinnliga': 'Christina Mattsdotters', 'Köpare-manliga': 'Matts Östling', 'Köpare-kvinnliga': '', 'Köpare-yrke': 'Sockensskräddaren', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': 'Norr Sahlbo', 'Fördel': '', 'Auktion': '', 'text': '”Jag Johan Andersson Blom upplåter och försäljer härmedelst, med min kära hustrus Christina Mattsdotters ja och samtycke, till vår son Sockensskräddaren Matts Östling i Norr Sahlbo, det mig och min hustru tillhöriga, uti Wester fernebo Socken Wagnsbro härad och Westmanlands Län belägna Kronoskattehemmanet No 4 Norr Sahlbo, Ett Tjugofjerdedels mantal om åtta penningland, hus o

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-03-30', 'Län': 'Westmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Tvärhandsbäcken', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '', 'Mantal': '1/48', 'Örestal': '', 'Penningland': '4', 'Riksdaler': '400', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Anders Larsson', 'Säljare-kvinnliga': 'Lovisa Larsdotter', 'Köpare-manliga': 'Lars Strandberg', 'Köpare-kvinnliga': 'Stina Mattsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Jag Anders Larsson upplåter och försäljer härmedelst med min kära hustrus Lovisa Larsdotter ja och samtycke till Lars Strandberg på Bremossen och dess Hustru Stina Mattsdotter, de mig tillhöriga, uti Kronoskattehemmanet Tvärhandsbäcken i Wester fernebo Socken, Wagnsbro härad och Westmanlands Län belägna 1/48 dels mantal om fyra /4/ penningland jord, emot en öfverenskommen och betingad köpeskilling stor 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-03-20', 'Län': 'Westerås', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Norr Åhl', 'Jordnatur': 'Skatte', 'Nummer': '1', 'Mantal': '1/5', 'Örestal': '', 'Penningland': '20 4/5', 'Riksdaler': '3135', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Johan Dahlman', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Anders Jansson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Tappebo', 'Fördel': '', 'Auktion': 'Frivillig', 'Auctionsförrättare': 'Johan Dahlman', 'Auctionplats': 'Norr Åhl', 'Auctiondatum': '1861-05-01', 'Vittnen': 'Olof Ersson i Åhlbo, Anders Larsson i Islingsby', 'text': ' Jag Johan Dahlman anmodad Auctionsförrättare göre härmed wetterligt att vid den frivilliga auction å 1/5 mant om 20 4/5 dels penningl. af Skattehemmanet no 1 beläget i Norr Åhl Wester fernebo Socken, Wagnsbro härad, Westerås Län hvilken blivit af mig denna dag förrättad, stadnade Ska

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-03-30', 'Län': 'Westmanlands', 'Härad': 'Wagnsbro', 'Socken': 'Wester färnebo', 'By': 'Söder Gerdsbo', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '1', 'Mantal': '1/16', 'Örestal': '', 'Penningland': '21', 'Riksdaler': '500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Johan Larsson', 'Säljare-kvinnliga': 'Anna Isaksdotters', 'Köpare-manliga': 'Johan Söder', 'Köpare-kvinnliga': 'Wilhelmina Broberg', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svärson och svärdotter', 'Köpare från': '', 'Fördel': 'Enligt särskildt upprättat Contract', 'Auktion': '', 'text': 'Jag Johan Larsson med min kära hustru Anna Isaksdotters ja och samtycke, upplåter och försäljer till vår måg och dotter Soldaten Johan Söder, och hans hustru Wilhelmina Broberg, vårt egande Ett sextondels /1/16/ mantal om Tjugoett penningeland i Kronoskattehemmanet No 1 Söder Gerdsbo i V. fernebo Socken Wagnsbro härad och Westmanlands Län, emot en öfv

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-01-22', 'Län': 'Westmanlands', 'Härad': 'Wåla', 'Socken': 'Nora', 'By': 'Fallet', 'Jordnatur': 'Kronoskatte hemmanet', 'Nummer': '', 'Mantal': '4300/350', 'Örestal': '', 'Penningland': '', 'Riksdaler': '450', 'Öre': '30', 'Skilling': '5', 'Runstycken': '5 5/7', 'Valuta': 'Banco', 'Säljare-manliga': 'Eric Jansson', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Enkan Brita Månsdotter', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Förälder och barn', 'Köpare från': 'Nora Socken', 'Fördel': '', 'Auktion': '', 'text': '"Jag Eric Jansson uplåter och försäljer härmed till En-\nkan Brita Månsdotter i Fallet Nora socken mina pupiller\neric och Anders Erssöners ärfda 3 209/350 penningeland samt till\nskulden anslagne 1 91/350 penningeland, eller tillsammans\n4 300/350 penningeland uti Kronoskatte hemmanet Fallet be¬\nläget i Nora Socken, Wåla Härad och Westmanlands Län för\nen köpeskilling stor 450 Riksdaler 30 skilling 5 5/7 runstycken 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-09-27', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Högsbo', 'Jordnatur': 'Krono skatte', 'Nummer': '1', 'Mantal': '1/8', 'Örestal': '', 'Penningland': '', 'Riksdaler': '1000', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco sedlar', 'Säljare-manliga': 'Undertecknad', 'Säljare-kvinnliga': 'min kära hustrus', 'Köpare-manliga': 'Handelsmannen Herr Joh. Fredr. Björkman', 'Köpare-kvinnliga': 'dess hustru', 'Köpare-yrke': 'Handelsmannen', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': 'fördels man Måns Olsson varder bibehållen vid de ägor han enligt Contract av detta Hemman innehafver', 'Auktion': '', 'text': '"Undertecknad uplåter och försäljer härmed med min\nkära hustrus goda ja och samtycke till Handelsmannen\nHerr Joh. Fredr. Björkman och dess hustru i Högsbo\nvårt ärfda Ett åttandels mantal krono skatte\nNo 1 i Högsbo By, Målmargården kallad i Nora Soc¬\nka Wåhla Härad af Westmanlands län  belägne Hemm

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-02-24', 'Län': 'Westmanlands', 'Härad': '', 'Socken': 'Nora', 'By': 'Dahlen', 'Jordnatur': 'Krono skatte hemmanet', 'Nummer': '', 'Mantal': '19 1/5', 'Örestal': '', 'Penningland': '', 'Riksdaler': '866', 'Öre': '32', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Olof Olsson', 'Säljare-kvinnliga': 'Greta Jansdotter', 'Köpare-manliga': 'Anders Persson', 'Köpare-kvinnliga': 'Catharina Bengtsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Thorsbacka No', 'Fördel': 'Jonas Larsson', 'Auktion': '', 'text': '" I kraft af detta vårt öppna köpebref uplåter och \nförsäljer jag Olof Olsson tillika med min kr. Hustru Greta\nJansdotter och samtycke vårt egande nitton 19 och ett \nfemtedels penningeland uti Krono skatte hemmanet\nDahlen beläget i Nora Socken och Westmanlands Höfdin¬\ngedöme med hus och jord till förre Bonden Anders Persson\noch dess k. Hustru Cajsa Bengtsdotter i Thorsbacka No¬\nra socken för en 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-07-12', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Wåhla', 'By': 'Berg', 'Jordnatur': 'Bondeland', 'Nummer': '1', 'Mantal': '1/3', 'Örestal': '', 'Penningland': '1 öre 5 1/3', 'Riksdaler': '1133', 'Öre': '16', 'Skilling': '', 'Runstycken': '', 'Valuta': 'rd sexton skilling banco', 'Säljare-manliga': 'Pehr Larsson', 'Säljare-kvinnliga': 'Gustava Catharina Pehrsdotter', 'Köpare-manliga': 'Lars Olsson', 'Köpare-kvinnliga': 'Anna Anders dotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Wreta Öster Wåhla socken', 'Fördel': 'Eric Andersson på Berga ägor, Lars Andersson på Bergs ägor', 'Auktion': '', 'text': 'Jag Per Larsson i Berg Öst. Wåhla Socken gör allom här¬\nde kunnigt och vetterligt det jag af fri vilja och moget\nbetänkande uplåter och försäljer såsom jag igenom det-\nta öppna köpe bref försålt mitt egende 1/3dels mantal No 1.\nBerg om ett öre fem och ett tredjedels penningeland be¬\nläget i Wåhla socken och Härad a

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-10-08', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Brunvala', 'Jordnatur': 'Kronoskatte hemmanet', 'Nummer': '', 'Mantal': '1/16', 'Örestal': '', 'Penningland': '9', 'Riksdaler': '416', 'Öre': '32', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco sedlar', 'Säljare-manliga': 'Jan Nilsson', 'Säljare-kvinnliga': 'Greta Ersdotter', 'Köpare-manliga': 'Olof Larsson', 'Köpare-kvinnliga': 'Brita Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svåger', 'Köpare från': 'Brunwalla', 'Fördel': '', 'Auktion': '', 'text': 'I kraft af detta vårt öppna köpebref uplåter och för\nsäljer jag Jan Nilsson tillika med min Kära hustru Gre\nta Ersdotter i Tingvastbo, Huddunge Sn ja och\nsamtycke, min Hustrus ärfda 1/16 dels Mantal om nio¬\npenningeland i Kronoskatte hemmanet Brunval¬\nla, beläget i Nora socken Wåhla Härad och West¬\nmanlands  Höfdingedömme för en betingad och\nöfverenskommen köpesumma stor fyra hun-\ndra sexton /416/ Rd 32

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-10-06', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Harbo', 'By': 'Brattberg', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '2', 'Mantal': '17/60', 'Örestal': '', 'Penningland': '14 8/9', 'Riksdaler': '800', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Jan Jansson', 'Säljare-kvinnliga': 'Anna Andersdotter', 'Köpare-manliga': 'Per Ersson', 'Köpare-kvinnliga': 'Anna Persdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Brattberg', 'Fördel': '', 'Auktion': '', 'text': 'Genom detta öppna köpebref gör Undertecknades\nhärigenom kunnigt och vetterligt det vi af fri\nvilja och maget betänkande upplåter och försäljer min\nAnna Andersdotters uti 17/60 dels Kronoskattehem¬\nmanet No 2. Brattberg Harbo socken efter min af\nliden Moder Carin Ridstler närfda 14 8/9 penninge-\nland, till Nämndeman Per Ersson i berörde Brattberg\nemot en betingad och öfverenskommen köpeskilling Åtta\nHundradt /8

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-07-07', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'ÖsterWåhla', 'By': 'Helganbo', 'Jordnatur': 'Kronoskatte hemman', 'Nummer': '', 'Mantal': '1/8', 'Örestal': '', 'Penningland': '22', 'Riksdaler': '966', 'Öre': '33', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler, Skilling, Bancomynt', 'Säljare-manliga': 'Lars Olsson', 'Säljare-kvinnliga': 'Anna Andersdotter', 'Köpare-manliga': 'Anders Olsson', 'Köpare-kvinnliga': 'Ingrid Pehrsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Uplanda samma socken', 'Fördel': 'Enkan Lisa Bengtsdotter', 'Auktion': '', 'text': 'Gör  allom härmed kunnigt och vetterligt, thet jag\nLars Olsson och hustru Anna Andersdotter i Wreta\nÖsterWåhla socken upplåter och försäljer såsom vi\nigenom detta öppna köpebref upplåtit och försåldt till Bon¬\nden och förra Nämndemannen Anders Olsson och dess\nhustru Ingrid Pehrsdotter i Uplanda samma socken, vårt egan¬\nde ett åttondedels Mantal krono

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-10-22', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Wåhla', 'By': 'Ettingaby', 'Jordnatur': 'Utjord', 'Nummer': '', 'Mantal': '', 'Örestal': '', 'Penningland': '4', 'Riksdaler': '200', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Bancosedlar', 'Säljare-manliga': 'Jan Jansson', 'Säljare-kvinnliga': 'Brita (bom) Christina Persdotter', 'Köpare-manliga': 'Anders Carlsson', 'Köpare-kvinnliga': 'Margaretha Cajsa Lindström', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Upplanda', 'Fördel': '', 'Auktion': '', 'text': '"För allom dem som detta vårt öppna köpebref händer\nförekomma, se höra, läsa eller sig föreläsas låta, göra wi\nhärmed vetterligt det vi af fri vilja och berådt mod  upp¬\nlåtit och försåldt vår egande Utjord i Ettinga, hälften\nom Fyra penningeland, beläget i Wåhla socken, Wåhla\nHärad af Westmanlands Län för en betingad och öfverenskom¬\nmen köpeskilling två Hundrade Riksdaler Bancosedlar,\nwhilken köpe

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-02-20', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Boda', 'Jordnatur': 'Skattejord', 'Nummer': '', 'Mantal': '', 'Örestal': '', 'Penningland': '3', 'Riksdaler': '133', 'Öre': '16', 'Skilling': '1', 'Runstycken': '', 'Valuta': 'Riksdaler banco', 'Säljare-manliga': 'Olof Olsson', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Nils Persson', 'Köpare-kvinnliga': 'Lena Olsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Jag Olof Olsson upplåter och försäljer till Utjord-\nBrukaren Nils Persson på Boda Utjord och dess Hustru\nLena Olsdotter, den mig tillhörige skattejord af Bo¬\nda i Nora socken Wåhla Härad och Westmanlands\nlän, utgörande Tre penningeland emot en öfverenskommern\noch betingad köpe skilling stor (133) Rd 16 skl Ett\nhundrade Trettiotre Riksdaler Sexton skillingar\nbanco, och som jag denna dag till fullo bekommit\nalltså afhänder jag mig och mina arfvingar

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-11-04', 'Län': 'Nora', 'Härad': 'Nora', 'Socken': 'Holm', 'By': 'Holm', 'Jordnatur': 'Kronoskatte hemmanet', 'Nummer': '1', 'Mantal': '1/7', 'Örestal': '', 'Penningland': '50.3', 'Riksdaler': '50', 'Öre': '3', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler Banko', 'Säljare-manliga': 'Olof Olsson i Backarby, Lars Person i Holm, Anders Jansson i Holm', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Pehr Andersson', 'Köpare-kvinnliga': 'Brita Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Föräldrar och barn', 'Köpare från': 'Holm', 'Fördel': '', 'Auktion': '', 'text': 'Jämlikt Wåhla wällofl. Häradsrätts utslag af den \n30de Julii detta år upplåter och försäljer vi under\ntecknade dels i egen och dels i egenskap af förmyndare\nwåra pupillers efter  deras aflidne moder Cajsa An-\ndersdotter tillfallande arfslotte enligt arfskiftes af den\n12te Oktober sidlidet år 1850 Till dess kära fader\noch stjuffader bonden Pehr Andersson och des kära 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-03-12', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Brunwalla', 'Jordnatur': 'Kronoskotte hemmanet', 'Nummer': '1', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '12', 'Riksdaler': '10800', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler Banco', 'Säljare-manliga': 'Anders Jansson', 'Säljare-kvinnliga': 'Brita Bengtsdotter', 'Köpare-manliga': 'Jan Andersson', 'Köpare-kvinnliga': 'Carin Andersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Med sundt förnust och moget betänkande  och fri\nvilja upplåte och försälja undertecknade till vår\nson Jan Andersson och dess Kära hustru Carin an\ndersdotter vårt egande ett fjerdedels mantal om ett\nöre 12 penningland i Kronoskotte hemmanet No 1\nBrunwalla i Nora socken, Wåhla Härad och West¬\nmanlands län emot en öfverens kommen och till fullo\nuppburen köpeskilling stor Ett Tusende åtta Hun¬\ndr

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-02-19', 'Län': '', 'Härad': '', 'Socken': 'Söderby Alunda', 'By': '', 'Jordnatur': 'frälse skatte', 'Nummer': 'No 1, No 5', 'Mantal': 'Ettfjerdedels Mantal, Ett tolftedels mantal', 'Örestal': '1, 16', 'Penningland': '', 'Riksdaler': '1720', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Rsdr Banco', 'Säljare-manliga': 'Eric Ersson', 'Säljare-kvinnliga': 'Greta Stina Ers Dotter', 'Köpare-manliga': 'Nils Persson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': 'Söderby', 'Fördel': '', 'Auktion': '', 'text': 'jag Eric Ersson med min kära hustrus Gretastina Ers\nDotters ja och samtycke försäljer hermädelst till Bon¬\nde sonen Nils Persson i Söderby våra egande hemmans\ndelar Ettfjerdedels Mantal frälse skatte No 1 om 1 Öre 18. penl.\noch Ett tolftedels mantal frälseskatte No 5 om 16. penl.\neller tillsamman Ettredjedels mantal om 2. öre 10. penl\nSöderby Alunda Socken, emot en öfverenskommen oc

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'Säljare-manliga': 'Jan Andersson', 'Säljare-kvinnliga': 'Christina Andersdotters', 'Köpare-manliga': 'Pehr Jansson', 'Köpare-kvinnliga': 'Carolina Persdotter', 'Jordnatur': '', 'Nummer': '', 'Mantal': '', 'Örestal': '', 'Penningland': '', 'Riksdaler': '3000', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Rdr Rmt', 'År-månad-dag': '1861-07-27', 'Län': 'Westmanlands', 'Härad': 'Wangsbro', 'Socken': 'Vester Fernebo', 'By': 'Domarbo', 'Fördel': '', 'Auktion': '', 'text': 'Köpebref\nJag Jan Andersson i Häggebäcken gör härmed\nvetterligt, att hafva med min kära hustru Christina\nAndersdotters Goda ja och samtycke samt af fri¬\nvilja och mogett betänkande försålt, såsom jag och\nnu genom detta öppna salubref försäljer, till\nHemmans ägaren Per Jonsson och låns hustru\nCarolina Persdotter i Rotfallet, Karbennings\nsocken, vårt ägande Ett öresland Domarbo\nbeläget inom Vester Fernebo socken, Wangsbro\nHärad och Westmanlands län, för en af Oss öfver¬\nens kommen köpesumma stor bestå

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-05-07', 'Län': 'Uppsala län', 'Härad': 'Ruheds härad', 'Socken': 'Lilla Klockarbo', 'By': '', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '1', 'Mantal': '1/24', 'Örestal': '', 'Penningland': '8', 'Riksdaler': '500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Olof Olsson', 'Säljare-kvinnliga': 'Christina Mattsdotter', 'Köpare-manliga': 'Anders Andersson', 'Köpare-kvinnliga': 'Anna Olsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svärson och svärfar', 'Köpare från': '', 'Fördel': 'Fördels förmåner enligt Köpe Contract', 'Auktion': '', 'text': 'Köpebref: Jag Olof Olsson med min kära hustrus dertill lemnade ja och samtycke upplåta och försäljer härmedelst det till vår måg och dotter Anders Andersson och dess hustru Anna Olsdotter vårt ägade Ett Tjugofjerdedels (1/24) mantal om åtta penningland af Kronoskattehemmanet No 1 i Lilla Klockarbo, emot en öfverenskommen köpesumma af Femhundrade Riksdaler Rik

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-09-17', 'Län': 'Örebro', 'Härad': 'Wagnsbro', 'Socken': 'Hjulsjö', 'By': 'Hjönshyttan', 'Jordnatur': 'hemmanet', 'Nummer': '1', 'Mantal': '1/8', 'Örestal': '', 'Penningland': '1', 'Riksdaler': '2950', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksmynt', 'Säljare-manliga': 'Olof Hansson', 'Säljare-kvinnliga': 'Anna Jansdotter', 'Köpare-manliga': 'Jan Andersson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Hjulsjö socken', 'Fördel': '', 'Auktion': '', 'text': 'Jag Olof Hansson går härmedelst vetterligt\njag med min kära hustrus ja och samtycke wår\ni Häggebäcken och Wagnsbro Härad belägne\nfastighet Ett öresland af hemmanet No 1 Mellan\ngården kallad med all befintlig åbyggnad med\nsärskilde undantag och köpevilkor villket wi\nförsålt till Jan Andersson från Hjulsjö socken\nHjönshyttan af Örebro Län för en väl öfverens¬\nkommer köpesumma stor Två Tusende Niohundrade\nFemtio Rdr Riksmynt villka 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1851-11-24', 'Län': 'Westmanland', 'Härad': 'Wåhla', 'Socken': 'Harbo', 'By': 'Käbbo', 'Jordnatur': 'Krono-skatte hemmanet', 'Nummer': '2', 'Mantal': '7 1/3', 'Örestal': '', 'Penningland': '', 'Riksdaler': '250', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksgäldssedlar', 'Säljare-manliga': 'Lars Jansson', 'Säljare-kvinnliga': 'Elisabeth Pehrsdotters', 'Köpare-manliga': 'Pehr Ersson', 'Köpare-kvinnliga': 'Margaretha Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Bröder', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Jag Lars Jansson, Domarbo Belinge socken upplåter\noch försäljer härmedelst med min kära Hustrus Elisabeth\nPehrsdotters ja och samtycke Till våra Bröders barn nemli¬\ngen till Pehr Ersson i Käbbo och hans syster Margaretha\nErsdotter igenom dess Lagligen tillförordnade förmyndare\nBonden Anders Ersson i Öhn Harbo socken vårt i arf\ntillfallna 7 1/3 penningeland Hus och jord uti Krono¬\nskatte hemmanet No 2 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1861-10-25', 'Län': 'Westerås', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Buckarby', 'Jordnatur': 'Skattehemmanet', 'Nummer': '3', 'Mantal': '1/12', 'Örestal': '', 'Penningland': '16', 'Riksdaler': '580', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Konungens befallningshavande', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Olof Jönsson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Auktion', 'Köpare från': 'Buckarby', 'Fördel': '', 'Auktion': 'Executive Auction', 'text': 'Sedan vid en den  25 Oktober innevarande år enligt\nkonungens befallningsafvandes Kungörelse vid\nSöder Åsbo Gästgifvargård af undertecknad Hans\nlänsman, på grund af förordnande förrättad exsicutive\nAuction å ett tolftedels mantal om 16 penningeland\ni Skattehemmanet No 3 Buckarby, beläget i Nora soc¬\nken Wåhla härad och Westerås län, tillhörigt Bon¬\nden Olof Olsson dersammastädes, men för lagfart skuld-\ngäldande från 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1832-03-15', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Öster-Wåhla', 'By': 'Åby', 'Jordnatur': 'Krono skatte hemman', 'Nummer': '3', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '', 'Riksdaler': '3200', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksgälds', 'Säljare-manliga': 'Jan Persson, Per Staffansson, Olof Söderberg, Gustaf Persson', 'Säljare-kvinnliga': 'Christina Larsdotter, Carin Persdotter, Anna Persdotter', 'Köpare-manliga': 'Eric Ersson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Åby, Öster-Wåhla socken', 'Fördel': '', 'Auktion': '', 'text': 'Gör allom härmed kunnigt och wetterligt, det\nvi undertecknade arfvingar efter aflidne hemmansega-\nren Per Jönsson i Åby, upplåtes och härigenom för¬\nsäljer varit efter vår aflidne Fader ivärfde Ett\nQuart mantal Krono skatte hemman No 3. Åby i Öster-\nWåhla socken, till Bonden Eric Ersson i Åby, sistnämn-\nde socken, för en öfverens

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-03-16', 'Län': 'Westmanlands', 'Härad': 'Wåla', 'Socken': 'Nora', 'By': 'Holm', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '1', 'Mantal': '1/3', 'Örestal': '', 'Penningland': '4', 'Riksdaler': '2000', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banko', 'Säljare-manliga': 'Anders Carlsson', 'Säljare-kvinnliga': 'Anna Larsdotter', 'Köpare-manliga': 'Anders Adersson', 'Köpare-kvinnliga': 'Anna Andersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svärfar och Svärson', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Jag Anders Carlsson med min hustrus goda ja och\nsamtycke, upplåter och försäljer härmedelst till min¬ måg och dotter Bondesonen, Anders Adersson och dess hus¬ \ntru Anna Andersdotter i Holm Nora sn mitt uti_x000B_nämnde by egande 1/3 mantal om ett öres och fyra \npenningeland i hemmanet No 1 beläget i Nora so- \nken Wåla Härad och Westmanlands Län för en öfverenskommen köpeskilling stor två tusende Riks- \ndale

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-06-08', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Bjurvalla', 'By': '', 'Jordnatur': '', 'Nummer': '', 'Mantal': '2/5', 'Örestal': '', 'Penningland': '5 3/25', 'Riksdaler': '350', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler riksgälds daler', 'Säljare-manliga': 'Bonden Eric Olsson', 'Säljare-kvinnliga': 'Brita Ersdotters', 'Köpare-manliga': 'Jan Ersson', 'Köpare-kvinnliga': 'Anna Jansdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Bror och svägerska', 'Köpare från': 'Klostret', 'Fördel': '', 'Auktion': '', 'text': '"Med sundt förnuft af fri vilja och moget betänkan de upplåter och försäljer jag Eric Olsson med min kära hustrus Brita Ersdotters goda ja och samtycke våra ega- der i arf tillfallna fem /5/ 3/25 tedels penningeland i 2/5te dels mantal kronoskatte No 3 Bjurwalla til vår broder och svägerska bonden Jan Ersson och dess Hustra Anna Jansdotter i Klostret för en betingad och till fullo uppburen köpeskilling

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-01-10', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': '', 'By': '', 'Jordnatur': 'Kronoskattehemmanet', 'Nummer': '1', 'Mantal': '8', 'Örestal': '', 'Penningland': '16', 'Riksdaler': '663', 'Öre': '32', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Bonden unga Jan', 'Säljare-kvinnliga': 'Stina Olsdotter', 'Köpare-manliga': 'Jan Ersson', 'Köpare-kvinnliga': 'Anna Jansdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Svärson och svärfar', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': '"Genom detta öppna köpebref göra undertecknade härige- nom kunnigt och vetterligt, att vi med sundt förnuft och moget betänkande upplåtit och försålt till vår måg och dotter Bonden Jan Ersson och hustru Anna Jansdotter i Klostret wåra i Kronoskattehemmanet No 1. Klostret dels ärfda och dels inköpta åtta penningeland eller Ett sextondel man - tal, beläget i Wåhla socken, och Härad i Westmanlands Län för en öfverenskommen och t

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-05-01', 'Län': 'Westerås', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Norr Åsbo', 'Jordnatur': 'Kronoskatte', 'Nummer': '3/8', 'Mantal': '', 'Örestal': '', 'Penningland': '5', 'Riksdaler': '2050', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'rsd riksgäldssedlar', 'Säljare-manliga': 'Olof Lundewall', 'Säljare-kvinnliga': 'Ewa Lowisa Lundewall född Björkman', 'Köpare-manliga': 'Lars Olsson', 'Köpare-kvinnliga': 'Malin Olsdotter', 'Köpare-yrke': 'Gästgifvaren', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': 'Per Jacobsson, Olof Carlsson, Olof Persson, Anders Jacobs-son', 'Auktion': '', 'text': 'Jag Olof Lundewall, med min kära hustrus ja och samtyc-\nke, upplåter och försäljer vår i Norr Åsbo by, Nora socken\nWåhla Härad af Westerås län egande hemmansdel\n3/8 mantal Kronoskatte om Ett öresland 5 penningeland till\nförre Nämndemannen Gästgifvaren Lars Olsson och dess hus-\ntru Malin Olsdotter i Söder Åsbo mot en överenskommen köpe-

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-02-12', 'Län': 'Uppsala län', 'Härad': 'Huddunge härad', 'Socken': 'Harbo socken', 'By': 'Rödje', 'Jordnatur': 'Kronoskattehemman', 'Nummer': '1/4', 'Mantal': '8 58/75', 'Örestal': '', 'Penningland': '', 'Riksdaler': '733', 'Öre': '16', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Jan Olsson, Per Persson', 'Säljare-kvinnliga': 'Christina Persdotter', 'Köpare-manliga': 'Olof Persson', 'Köpare-kvinnliga': 'Anna Larsdotter', 'Köpare-yrke': 'bond', 'Relation mellan säljare och köpare': 'bror och svägerska', 'Köpare från': 'Rödje, Harbo socken', 'Fördel': 'fördelar för Jan Olsson och Per Persson', 'Auktion': '', 'text': 'Jag Jan Olsson i Norrbo Harbo socken upplåter och för-\nHärigenom med min kära hustrus Christina Pers-\nDotter ja och samtycke vår arfvejord å såväl mödra\nSom färden sidan, bestående af 8 23/75 dels pennin-\nGeland, hus och jord uti Kronoskattehemment Röd-\nJe Huddunge samt även jag Per Persson i Rödje för-\nsäljer mina i

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-03-02', 'Län': 'Westmanlands', 'Härad': 'Wåhla', 'Socken': 'Nora', 'By': 'Gäddsjö', 'Jordnatur': '', 'Nummer': '7/12', 'Mantal': '', 'Örestal': '2', 'Penningland': '15', 'Riksdaler': '5141', 'Öre': '42', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksgälds', 'Säljare-manliga': 'Jöns Ågren', 'Säljare-kvinnliga': 'hustrus goda ja', 'Köpare-manliga': 'Carl Ågren', 'Köpare-kvinnliga': 'Stina Gustafsdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': 'Gäddsjö', 'Fördel': 'Enligt särskilt upprättadt fördelskontrakt', 'Auktion': '', 'text': 'Jag Jöns Ågren i  Gäddsjö med min hustrus goda ja\noch samtycke upplåter och försäljer till vår son Carl\nÅgren och dess hustru Stina Gustafsdotter i Gäddsjö\nNora socken och uti nämnde by och socken tillhörande\n7/12 dels mantal om 2 öres och 15 penningeland kronoskatte\njemte underlydande utjord i Nordmyra samt 2 Öres och 8 pen-\ningeland, och andelen i Östnäs utäng, beläget i Nora so

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-01-18', 'Län': 'Upsala', 'Härad': 'Olands härad', 'Socken': 'Alunda', 'By': 'Sunds by', 'Jordnatur': 'Kronoskatte hemman', 'Nummer': '2 - 1/2', 'Mantal': '4 öre 12 penningland', 'Örestal': '', 'Penningland': '', 'Riksdaler': '1033', 'Öre': '16', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Rdr Banco', 'Säljare-manliga': 'M. Didriksson', 'Säljare-kvinnliga': 'C. Didriksson', 'Köpare-manliga': 'Pehr Ahlund', 'Köpare-kvinnliga': 'Lotta Jansdotter', 'Köpare-yrke': 'Socken skräddaren', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Marmas af Alunda Socken', 'Fördel': '', 'Auktion': '', 'text': 'Köpsbref\nTill Socken Skräddaren Pehr Ahlund och hans hu¬\nstru Lotta Jansdotter i Marma af Alunda Socken,\nupplåter och försälja undertecknade härmed mitt\negande Kronoskatte hemman under No 2 - 1/2 mantal \nom 4 öre 12 penningsland uti Sunds by af före¬\nnämnde Socken, Olands härad och Upsala län, emot\nen oss emellan öfverenskommen och betingad köpe\nskilling sto

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1843-04-10', 'Län': 'Upsala', 'Härad': 'Olands', 'Socken': 'Ekeby', 'By': 'Dyflinge', 'Jordnatur': 'Krono Skatte', 'Nummer': '1, 2', 'Mantal': '3/16', 'Örestal': '', 'Penningland': '21', 'Riksdaler': '', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Eric Hansson', 'Säljare-kvinnliga': 'Carin Mattsdotters och förmyndaren för mina Barn med mitt förre gifte Greta Persdotter', 'Köpare-manliga': 'Eric Ersson', 'Köpare-kvinnliga': '', 'Köpare-yrke': 'Bonden', 'Relation mellan säljare och köpare': 'Ingen', 'Köpare från': 'Dyflinge', 'Fördel': 'Ja', 'Auktion': '', 'text': '"Undertecknade gör veterligt, jag Eric Hansson\nmed min rara syster Carin Mattsdotters och förmynd\naren för mina Barn med mitt förre gifte\nGreta Persdotter, Bonden Jan Jansson i\nDyflinge, ja och samtycke, härmedelst upplåter\noch bortbyter mitt och bemälte mina Barns ge\nmensamte ägande Ett Sextondels mantal \nNo 1 om Ett Öresland och Ett åttondels man\ntal No 2 om 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-02-15', 'Län': 'Upsala', 'Härad': 'Olands Härad', 'Socken': 'Bärsta', 'By': 'Stafby', 'Jordnatur': 'Krono skatte utjord', 'Nummer': '', 'Mantal': '', 'Örestal': '1', 'Penningland': '1.5', 'Riksdaler': '1150', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco mynt', 'Säljare-manliga': 'Pehr Ersson', 'Säljare-kvinnliga': 'Anna Majja Ers Dotter', 'Köpare-manliga': 'Anders Rikard Lindgren', 'Köpare-kvinnliga': 'Chattonia Anders Dotter', 'Köpare-yrke': 'Svärvas Mästaren', 'Relation mellan säljare och köpare': 'Säljare är sambygd med köparen', 'Köpare från': 'Skolby Alunda Soken', 'Fördel': '', 'Auktion': '', 'text': 'För allom dem, Som detta vårt öpna Salubref\nLeser eller Låter sig förelesas, gör jag Pehr Ersson\ni Skebårgo, med min Hustru Anna Majja Ers\nDotter, ja och Samtyke det vi af fri villja och\nväl berådt med uplåter och förselljer vårt ägon¬\nde Hemman Krono skatte utjorden om Ett och ett\nhalft Öresland. beläget uti Bärsta by\nStafby soken. Ol

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-04-20', 'Län': 'Upsala', 'Härad': 'Ohlands', 'Socken': 'Alunda', 'By': 'Golfsta', 'Jordnatur': 'Frälseskatte hemman', 'Nummer': '8', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '2.12', 'Riksdaler': '1160', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Matts Bom Mattsson', 'Säljare-kvinnliga': 'Ana Bom Stina Mattsdr', 'Köpare-manliga': 'Eric Persson', 'Köpare-kvinnliga': 'Anna Greta Anders dotter', 'Köpare-yrke': 'Soldaten', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Ströja Rasbo Socken', 'Fördel': '', 'Auktion': '', 'text': 'Göres härmed kunnit och wetterligt att vi under\ntecknade uplåter och försäljer härigenom till Soldaten\nEric Persson, at och dess Hustru Anna Greta\nAnders dotter, uti Ströja Rasbo Socken, wårt\nÄgande 1/4 dels Mtl Frälseskatte hemman No 8.\nom Två Öre 12. penningsland, beläget uti Golfsta\nBy Alunda Socken, Ohlands Härad och Upsala\nLän och dess för en Betingadt och öfverenskom¬\nmen 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-04-08', 'Län': 'Upsala', 'Härad': 'Olands', 'Socken': 'Alunda', 'By': 'Haberga', 'Jordnatur': 'Frelseskatte', 'Nummer': '2', 'Mantal': '1/3', 'Örestal': '', 'Penningland': '1', 'Riksdaler': '2800', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler Banco', 'Säljare-manliga': 'Eric Andersson', 'Säljare-kvinnliga': 'Brita Stina MattsDotter', 'Köpare-manliga': 'Jan Andersson', 'Köpare-kvinnliga': 'Greta Anders Dotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Haberga Alunda Socken', 'Fördel': 'Enligt denna dag upprättade Förmåns Contrakt', 'Auktion': '', 'text': 'Jag Undertecknad med minkäro Hustrus\ngoda ja och Samtycke, Uplåter och försäljer vårt\negande Frelseskatte heman 1/3 Mantal uti No¬\n2 om 1 Öre 20 penningeland i Haberga by i Alun¬\nda Socken Olands Härad och Upsala Län, Till\nGestgivaren gl: Jan Andersson och hans Hustru\nGreta Anders Dotter i Haberga Alunda Socken\nför en öfverenskommen och betingad i K

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-04-16', 'Län': 'Upsala', 'Härad': 'Olands', 'Socken': 'Alunda', 'By': 'Haberga', 'Jordnatur': 'Frelseskatte', 'Nummer': '4', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '1', 'Riksdaler': '1900', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Jan Andersson', 'Säljare-kvinnliga': 'Hustrus', 'Köpare-manliga': 'Anders Andersson', 'Köpare-kvinnliga': 'Carin Lisa Pers Dotter', 'Köpare-yrke': 'Gestgifvaren', 'Relation mellan säljare och köpare': 'Styfson', 'Köpare från': 'Haberga och Alunda Socken', 'Fördel': '', 'Auktion': '', 'text': 'Göre wetterligt att jag Undertecknade med min\nkära Hustrus gode ja och samtycke upplåter och försäl¬\njer vårt egande Frelseskatte 1/4 dels Mantal No 4 om\n1 öre 12 penningeland - belegd i Haberga By Alunda,\nSocken Olands Härad och Upsala Län Till min\nStyfson Gestgifvaren Anders Andersson och hans\nHustru Carin Lisa Pers Dotter i Haberga och\nAlunda Socken för en öfverenskommens och betingad\nK

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-03-14', 'Län': 'Uppsala', 'Härad': 'Olands', 'Socken': 'Wittja å Tuna', 'By': '', 'Jordnatur': 'Krono Skatte', 'Nummer': '3', 'Mantal': '1/4', 'Örestal': '2', 'Penningland': '9', 'Riksdaler': '1300', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco mynt', 'Säljare-manliga': 'Anders Ericsson', 'Säljare-kvinnliga': 'Christina Eleonora JansDotter', 'Köpare-manliga': 'Per Olsson', 'Köpare-kvinnliga': 'Anna Chatthrina Ols Dotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': 'Brobohl. Bladåkers socken', 'Fördel': '', 'Auktion': '', 'text': 'För attom dem som detta vårt öppna salu\nBref leser eller låter Sig förelesas gör jag Anders Ericsson\nmed min Hustru Christina Eleonora JansDotter\ni Wettja å ja och samtycke och vi af fri hvilja och\nberått mod Upplåter och förseljer vårt egende hem¬\nman 1/4. dels mantal. Krono Skatte No 3. om 2 öre\n9. penningeland beleget: uti Wittja å Tuna socken\nOlands Härad af Uppsala län till B

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-06-15', 'Län': 'Upsala', 'Härad': 'Ohlands', 'Socken': 'Ekeby', 'By': 'Ingvasta', 'Jordnatur': 'Kronoskatte hemmanet', 'Nummer': '1, 4', 'Mantal': '15/64', 'Örestal': '', 'Penningland': '2 1/2', 'Riksdaler': '2000', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Matts Andersson', 'Säljare-kvinnliga': 'Lena Jonsdotter', 'Köpare-manliga': 'Anders Mattsson', 'Köpare-kvinnliga': 'tillkommande hustrun till Anders Mattsson', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': '', 'Fördel': 'några serskilta föreskrifne fördels vilckor att åtnjuta uti Bägges vår Lisstid', 'Auktion': '', 'text': 'Göres härmed kunnigt och wetterligt att vi undertecknade\nupplåter och försäljer härigenom till vår kära. Son\nAnders Mattsson och dess tillkommande hustru, våra¬\nhemmans andelar 15/64 dels Mtl uti Kronoskatte hemmanet,\nNo 1. om 2 1/2 Öresland samt 1/4 dels mtl. Kronoskatte\nhemman No 4. om 2 1/2 Öresland 

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-03-14', 'Län': 'Uppsala', 'Härad': 'Olands', 'Socken': 'Alunda', 'By': 'Lyen', 'Jordnatur': '', 'Nummer': '1', 'Mantal': '1/12', 'Örestal': '', 'Penningland': '8', 'Riksdaler': '333', 'Öre': '16', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco mynt', 'Säljare-manliga': 'Eric Ersson', 'Säljare-kvinnliga': 'Greta Charin Pehrs dotters', 'Köpare-manliga': 'Pehr Pehrsson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Förvaltare till omyndig', 'Köpare från': 'Lyen', 'Fördel': 'Livstids', 'Auktion': '', 'text': 'För utom vill dem detta mitt öppna Salu Bref läser eller Låten Sig före\nlesas gör jag Eric Ersson i Söderby. Som Lagligen till förordnade förmyndare\nför afl. Bonden Pehr Mattsson i Lyen Äfterlemnade omyndige dotter\nGreta Charin Pehrs dotter, herigenom kunnigt och Witterligit det jag\naf fri wilja och  Welberedt mod uplåter och förälljer förbemälte Greta\nCharin Pehrs Dotters ärvda jord 1/12 dels Mantal om 8. penningel

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-07-27', 'Län': 'Upsala', 'Härad': 'Ohlands', 'Socken': 'Alunda', 'By': 'Gela', 'Jordnatur': 'Kronoskatte hemman', 'Nummer': '1', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '2', 'Riksdaler': '', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler Banco', 'Säljare-manliga': 'And Lundgren', 'Säljare-kvinnliga': 'Cajsa Greta Pehrs dotter', 'Köpare-manliga': 'Petter Lundgren', 'Köpare-kvinnliga': 'Brita Stina Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och Son', 'Köpare från': 'Forssne Alunda Socken', 'Fördel': 'Förutom några särskilt föreskrivna fördel förmåner att åtnjuta i båda vår livstid', 'Auktion': '', 'text': 'Göres härmed kunnit och Wetterligt att vi undertecknade\nuplåter och försäljer härigenom till vår kära Son Bon\nden Petter Lundgren och dess hustru Brita Stina Ers\ndotter uti Forssne Alunda Socken, vårt ägande 1/4 dels\nMtl Kronoskatte hemman, No 1 om Två Öresland\nbeläget uti Gela By, Alunda Socken, Ohla

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-07-27', 'Län': 'Upsala', 'Härad': 'Ohlands', 'Socken': 'Alunda', 'By': 'Gela', 'Jordnatur': 'Kronoskatte hemman', 'Nummer': '1', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '2', 'Riksdaler': '500', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'And Lundgren', 'Säljare-kvinnliga': 'Cajsa Greta Pers dotter', 'Köpare-manliga': 'Jan Eric Andersson', 'Köpare-kvinnliga': 'Charlotta Lundgren', 'Köpare-yrke': 'Rusthållaren', 'Relation mellan säljare och köpare': 'Föräldrar och svärson', 'Köpare från': 'Wäskinge Ekeby Socken', 'Fördel': '', 'Auktion': '', 'text': 'Göres härmed kunnit och wetterligt att vi nu underteckna\nde uplåter och, försäljer härigenom, till vår kära dotter\nCharlotta Lundgren och dess man Rusthållaren Jan¬\nEric Andersson uti Wäskinge Ekeby Socken, vårt ägande\n1/4 dels mtl Kronoskatte hemman No 1 om Två Öresland\nbelägit uti Gela By, Alunda Socken Ohlands Härad\noch Upsala Län; och det för en betingad och han

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1849-10-30', 'Län': 'Upsala', 'Härad': 'Sn olands härad', 'Socken': 'Mytslinge', 'By': '', 'Jordnatur': '', 'Nummer': '4', 'Mantal': '1/8', 'Örestal': '', 'Penningland': '21', 'Riksdaler': '700', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Matts Jansson', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Anders Andersson', 'Köpare-kvinnliga': 'Anna Lisa Jans Dotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Syster och Svåger', 'Köpare från': 'Ekeby Lena Sn', 'Fördel': 'Enligt fördels Contract af den 28 marti 1847', 'Auktion': '', 'text': '"Jag Matts Jansson med mina förälldrars uplåtelse och samtycke\ngör hermed kunigt och vitterligt, dett jag uplåtes och försäljer herigensom\nmig i arf tillfallne 1/8 dels mantal om 21 penninge Land uti Mytslinge\nAlunda Sn olands härad och Upsala Län beläget Till min Syster\noch Svåger arendatorn Anders Andersson och dess hustru Anna Lisa Jans\nDotter uti Ekeby Lena Sn För en öfvere

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-05-10', 'Län': 'Uppsala', 'Härad': 'Alunda', 'Socken': 'Sn', 'By': 'Svista', 'Jordnatur': 'Krono Skatte hemman', 'Nummer': '1/2', 'Mantal': '', 'Örestal': '', 'Penningland': '', 'Riksdaler': '3000', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banco', 'Säljare-manliga': 'Olof Persson', 'Säljare-kvinnliga': 'Lena Persdotter', 'Köpare-manliga': 'Anders Jonsson', 'Köpare-kvinnliga': '', 'Köpare-yrke': 'dräng', 'Relation mellan säljare och köpare': 'Säljare är foster-son till köparen', 'Köpare från': 'Svista', 'Fördel': '', 'Auktion': '', 'text': 'Köpe Bref\n\nSedan vi undertecknade ägare af 1/2 mantal No 1 Svista i\nAlunda Sn Krono Skatte hemman, på sådant sätt som\ndenna dagens upprättade köpa Contract utvisar öfver\nlåtit vår eganderätt dertill till wår antagne foster-\nson drängen Anders Jonsson i Svista för en betingad\nKöpe Summa Tre Tusende Riksdaler Banco att betalas\npå sådant sätt som vårt öfverlåtelsebref förskrif¬\nver uton betingad fördels ut

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-10-10', 'Län': 'Uppsala', 'Härad': 'Alunda', 'Socken': 'Wäsby', 'By': '', 'Jordnatur': 'Frälse skatte hemman', 'Nummer': '6', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '2', 'Riksdaler': '', 'Öre': '9', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksdaler Banco', 'Säljare-manliga': "Per Persson (as guardian for his wife's children)", 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Pehr Eric Persson', 'Köpare-kvinnliga': '', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Brother', 'Köpare från': 'Furby', 'Fördel': 'A share of the purchase price will go to the father, Per Andersson', 'Auktion': '', 'text': 'Till följe af Härads Rättens genom Resulation\nå Sommartinget den 9de sistlidne Augusti mig dertill\nmeddelade tillåtelse, försäljer jag såsom förmyndare för\naflidne Per Perssons hustru Brita Matts Dotters i Klef\nomyndige Barn hermädelst å deras vägnar den genom\narfskifte efter förbemälte deras moder tillfallne Ettfjer¬\ndedels Mantal frälse ska

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1850-11-15', 'Län': 'Upsala', 'Härad': 'Olands', 'Socken': 'Alunda', 'By': 'Wäsby', 'Jordnatur': 'Frälseskattehemman', 'Nummer': '6', 'Mantal': '1/4', 'Örestal': '', 'Penningland': '2 öres 9', 'Riksdaler': '1200', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'banko', 'Säljare-manliga': 'Jan Mattsson', 'Säljare-kvinnliga': 'Maja Söderbergs', 'Köpare-manliga': 'Per Jansson', 'Köpare-kvinnliga': 'hans tillkommande hustru', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Far och son', 'Köpare från': '', 'Fördel': 'Arflott, lifstidsundantag', 'Auktion': '', 'text': 'Köpebref\nJag undertecknad Jan Mattsson, med min kära\nHustrus, Maja Söderbergs, ja och samtycke, upp en\nlåter och försäljer härmedelst till vår son, Bonde¬\nsonen Per Jansson i Wasby och hans tillkommande\nhustru, vårt egande Frälseskattehemman No 6\n1/4 mantal om 2 öres - och 9 penningeland, beläget\nWäsby by, Alunda socken, Olands Härad och\nUpsala Län, emot en öfverenskommen köpeskil¬\

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'Säljare': {'Name': 'Pehr Jakobsson, Johan Andersson, Stina Pehrsdotter, Per Andersson (foster father)', 'Role': "Förmyndare (guardian) for the deceased farmer Jacob Jacobsson's underage daughters Margreta Anna, Catharina and Brita Jakobsdotter, and for Stina Pehrsdotter, the widow of the deceased farmer Jakob Jakobsson"}, 'Köpare': {'Name': 'Jakob Jakobsson', 'Role': 'Buyer'}, 'Property': {'Type': '1/4 mantal No 1 in Svina Harbo Socken Wåhla Härad and Vistmanslan', 'Size': '1 öre 4 penningeland'}, 'Sale Date': '1853-02-18', 'Auction Date': '1852-01-02', 'Price': {'Currency': 'Riksdaler Banco', 'Amount': '800'}, 'Witnesses': ['Pehr Jakobsson i Järlebo', 'Jan Andersson, husband of Cristina Jakobsdotter', 'Stina Pehrsdotter, widow of Jakob Jakobsson', 'Per Andersson i Wästby Bälinge Sn, foster father', 'Matts Mattsson i Ökne', 'Erik Ols- son i Jerlebo', 'Jan Jönsson i Stuna Bälinge', 'Pehr Olofsson i Svina'], 'text': 'Genom detta öppna köpebref försäljer undertecknad\ni egenskap af För

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1853-06-17', 'Län': 'Nora', 'Härad': 'förene med Wagnsbro', 'Socken': 'Stalbo', 'By': 'uti förene meda By', 'Jordnatur': 'Krono skatte hemmanet', 'Nummer': '2', 'Mantal': '1/12', 'Örestal': '', 'Penningland': '12 8/12 dels', 'Riksdaler': '666', 'Öre': '32', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banko', 'Säljare-manliga': 'Anders Ersson', 'Säljare-kvinnliga': '', 'Köpare-manliga': 'Eric Ersson', 'Köpare-kvinnliga': 'Anna Ersdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': '', 'Köpare från': '', 'Fördel': '', 'Auktion': '', 'text': 'Jag Anders Ersson uti Stalbo Nora sn. uplåtter och för\nSellger mitt Egande 1/12 dels mantall om 12 8/12 dels pennin¬\ngeland uti Krono skatte hemmanet No 2 uti förennemda\nBy, ått Bonden Eric Ersson å hans hustru Anna Ers-\nsdoter i Berörde Stalbo för en öfverenskommen köppe\nskilling 666 Riksdaler 32 skl Banko och som jag\nDen första penningen med den sista till fullo nöije an-\nnammat hafver för den Skuld, så afhe

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'År-månad-dag': '1852-10-10', 'Län': 'Wesmanlands', 'Härad': 'Wåla', 'Socken': 'Wåhla', 'By': 'Bjurwalla', 'Jordnatur': 'Krono skatte', 'Nummer': '3', 'Mantal': '5 3/25', 'Örestal': '', 'Penningland': '', 'Riksdaler': '350', 'Öre': '', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Riksgälds Sedlar', 'Säljare-manliga': 'Eric Olsson', 'Säljare-kvinnliga': 'Brita Ersdotters', 'Köpare-manliga': 'Olof Ersson', 'Köpare-kvinnliga': 'Anna Persdotter', 'Köpare-yrke': '', 'Relation mellan säljare och köpare': 'Bror och svägerska', 'Köpare från': 'Bjurwalla', 'Fördel': '', 'Auktion': '', 'text': 'Köpebref\nMed Sunt förnuft af fri vilja och moget\nbetänkande uplåter och försäljer jag Erik Olsson med\nmin kära hustru Brita Ersdotters goda ja och samtyc-\nke våre ägande i arf tillfallna fem (5 3/25)te dels pen-\ningelad i krono skatte No 3 Bjurwalla till wår broder\noch Svägerska Bonden Olof Ersson och dess hustru Anna\nPersdotter i Bjurwalla för en betingad och till fullo\nupburen köpeskilling sto

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.



{'Köpare-manliga': 'Anders Mattsson', 'Köpare-kvinnliga': 'Brita Larsdotter', 'Köpare-yrke': '', 'Fördel': 'lifstids fördel', 'År-månad-dag': '1853-08-07', 'Län': 'Westmanlands', 'Härad': 'Wåla', 'Socken': 'Nora', 'By': 'Kjerstinbo', 'Jordnatur': 'kronoskatte', 'Nummer': '1/4', 'Mantal': '', 'Örestal': '', 'Penningland': '1 öres och 12 penningeland', 'Riksdaler': '2666', 'Öre': '32', 'Skilling': '', 'Runstycken': '', 'Valuta': 'Banko', 'Säljare-manliga': 'Matts Persson', 'Säljare-kvinnliga': 'Lisa Jönsdotter', 'Köpare från': '', 'text': 'Köpe Bref\nTill vår kära Son Anders Mattsson och dess blifvan-\nde hustru Brita Larsdotter i Kjerstinbo, uplåta och\nförsälja vi härigenom vårt ägande 1/4 Mantal kronoskatte\nom 1 öres och 12 penningeland uti Kjerstinbo, Nora Soc-\nken Wåla Härad och Westmanlands län beläget, för en \nöfverenskommen och betingad köpeskilling af Twå\ntusen Sexhundra Sextiosex Riksdaler och 32 sk Banko samt\nutfäst lifstids fördel; och som vi denna köpeskilliing\ntillfu

In [33]:
df_extracted_lowtp_mix_np.head()

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Övrigt,Vittnen,Övrig,Auctionsförrättare,Auctionplats,Auctiondatum,Sale Date,Auction Date,Price,Witnesses
0,1860-11-17,Westmanland,Wagnsbro,Wester färnebo,Sör åll,Hemmanet,2,1/6,1.0,8.0,...,,,,,,,,,,
1,,,,,,,,,,,...,,"[{'Name': 'J G Hild', 'Övrigt': 'E Borin'}]",,,,,,,,
2,1861-01-02,Westmanlands,Wagnsbro,Wester färnebo,Heden,skatte,,1/8,1.0,1.0,...,,,Säljare försäljer 1/8 mantal skatte Heden och ...,,,,,,,
3,1861-01-19,Västmanlands,Wagnsbro,Karbennings,Klingholmen,Hemman,1/32,,,,...,,,,,,,,,,
4,1861-01-16,Westmanlands,Wagnsbro,Wester färnebo,Norr Sahlbo,Kronoskattehemmanet,4,1/24,,8.0,...,,,,,,,,,,


In [73]:
messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": pre_prompt+prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": pre_prompt+prompt4},
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": pre_prompt+text,
    },
    
]
prompt=tokenizer.apply_chat_template(messages, tokenize=False)

In [34]:
df_extracted_lowthp_mix_np = pd.DataFrame(columns=df_cols)
df_extracted_lowthp_mix_np

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Valuta,Säljare-manliga,Säljare-kvinnliga,Köpare-manliga,Köpare-kvinnliga,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion


In [35]:

# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    # Construct the multi-turn prompt
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": pre_prompt+prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": pre_prompt+prompt4},
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": pre_prompt+text,
    },
    
    ]
    prompt=tokenizer.apply_chat_template(messages, tokenize=False)
    # Generate the response
    response_text = generate_response(prompt, temp=0.2, top_p=0.9)
    
    
    #print('{'+response_text.split('}')[-2].split('{')[-1]+'}')
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        #json_data = json.loads('{'+response_text.split('}')[-2].split('{')[-1]+'}')
        json_data = parse_nested_json(response_text)
        json_data['text'] = text
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        json_data['text'] = text
        extracted_data.append(json_data)
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_lowthp_mix_np = pd.DataFrame(extracted_data)





# Create a DataFrame from the collected data
df_extracted_lowthp_mix_np = pd.DataFrame(extracted_data)
df_extracted_lowthp_mix_np.to_csv('df_extracted_lowthp_mix_np.csv')
df_extracted_lowthp_mix_np.to_excel('df_extracted_lowthp_mix_np.xlsx')


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!
Row added!


In [36]:
df_extracted_hightp_mix_np = pd.DataFrame(columns=df_cols)
df_extracted_hightp_mix_np

Unnamed: 0,År-månad-dag,Län,Härad,Socken,By,Jordnatur,Nummer,Mantal,Örestal,Penningland,...,Valuta,Säljare-manliga,Säljare-kvinnliga,Köpare-manliga,Köpare-kvinnliga,Köpare-yrke,Relation mellan säljare och köpare,Köpare från,Fördel,Auktion


In [38]:

# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    # Construct the multi-turn prompt
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    messages = [
    {
        "role": "user",
        "content": system_prompt,
    },
    {
        "role": "assistant",
        "content": sys_response1,
    },
    {"role": "user", "content": pre_prompt+prompt2},
    {
        "role": "assistant",
        "content": response2,
    },
    {"role": "user", "content": pre_prompt+prompt3},
    {
        "role": "assistant",
        "content": response3,
    },
    {"role": "user", "content": pre_prompt+prompt4},
    {
        "role": "assistant",
        "content": response4,
    },
    {
        "role": "user",
        "content": pre_prompt+text,
    },
    
    ]
    prompt=tokenizer.apply_chat_template(messages, tokenize=False)
    # Generate the response
    response_text = generate_response(prompt, temp=0.8, top_p=0.85)
    
    
    #print('{'+response_text.split('}')[-2].split('{')[-1]+'}')
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        #json_data = json.loads('{'+response_text.split('}')[-2].split('{')[-1]+'}')
        json_data = parse_nested_json(response_text)
        json_data['text'] = text
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        json_data['text'] = text
        extracted_data.append(json_data)
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_hightp_mix_np = pd.DataFrame(extracted_data)






# Create a DataFrame from the collected data
df_extracted_hightp_mix_np = pd.DataFrame(extracted_data)
df_extracted_hightp_mix_np.to_csv('df_extracted_hightp_mix_np.csv')
df_extracted_hightp_mix_np.to_excel('df_extracted_hightp_mix_np.xlsx')


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Row added!


TypeError: 'str' object does not support item assignment

In [8]:
prompt1 = "Hej!"
response1 = "Hallå! Hur kan jag hjälpa dig med att exakt extrahera information från svensk text i JSON-format?"
prompt2 =  user_prompt
response2 = """{
  "År-månad-dag": "1860-11-17",
  "Län": "Westmanland",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Sör åll",
  "Jordnatur": "Hemmanet",
  "Nummer": "2",
  "Mantal": "1/6",
  "Örestal": "1",
  "Penningland": "8",
  "Riksdaler": "1500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksgels",
  "Säljare-manliga": "Per Wrettström",
  "Säljare-kvinnliga": "Anna Persdotter",
  "Köpare-manliga": "Johan Hedström",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Ej angiven",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt3="""Extrahera informationen för varje fält och presentera den tydligt i JSON-format. 'Jag Sara Jansdotter upplåter och försäljer härmedelst till min Son Hemmansägaren Johan Mattsson härstädes, det mig i arf efter min aflidne man Hemmansägaren Matts Jansson tillfallne två femton dels mantal af Skattehemmanet no 5, om Sexton penningeland i Islingsby Wester fernebo Socken, Wagnsbro Härad och Westmanlands Län belägen, emot en öfverenskommen och betingad Köpeskilling Stor: Sju Hundra Nio Riksdaler 33 öre Riksmynt, och som jag denna köpeskilling tillfullo bekommit, alltså afhänder jag mig och mina öfrige arfvingar berörde 2/15 dels mantal Islingsby, med allt hvad dertill hörer, af ålder lydt och lagligen tillvinnas kan, och tillegne den samma bemälde min Son Johan Mattsson och hans arfvingar, att genast tillträda, samt everldeliga äga och besitta hafvande till yttermera wisse häraf, jag detta köpebref uti nedanstående wittnens närvaro, med mitt bomärkes undertecknande bekräfta, som skedde i Islingsby Nybygget den 26 februari 1861 Sara/bom/Jansdotter wittnen underskrifna'"""
response3="""{
  "År-månad-dag": "1861-02-26",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Islingsby",
  "Jordnatur": "Skattehemmanet",
  "Nummer": "5",
  "Mantal": "2/15",
  "Örestal": "",
  "Penningland": "16",
  "Riksdaler": "709",
  "Öre": "33",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Sara Jansdotter",
  "Säljare-kvinnliga": "",
  "Köpare-manliga": "Johan Mattsson",
  "Köpare-kvinnliga": "",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Mor och Son",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
prompt4="""'Jag Eric Jansson gör hervid veterligt att jag med min kära hustru Anna Jansdotters goda ja och samtycke samt af fri vilja, försålt, såsom jag ock genom detta öppna salubref, försäljer till min Svärfar Hemmansegaren Jan Ersson och hustru Anna Jansdotter, egona 1/8 mtl skatte Heden om 1 öresland och 1/8 mtl skatte Skogsbyn om 1 öresland i Wester fernebo Socken och Wagnsbro härad för en Summa af Sjutusen femhundra /7500/ Riksdaler Riksmynt och som den … penningen med den första är till mig slutligen betald så afhändar jag mig, min köra hustru och barn tillhörde hemmansdelar 1/8 mlt Heden och 1/8 mtl Skogby med alla dess tillhörigheter och tillägnar de samma Jan Ersson och hustru Anna Jansdotter, Heden och arfvingar med hemmansdelar med alla ägor i hus, jord och öfrige tillhörigheter intet undantagandes af hvad dertill lyder af ålder legat eller framledes tillvinnas kan, att äga och bruka och besitta såsom deras välfångna egendom, förbindande till hemul efter lag – Till yttermera visshet har jag tillika med min kära hustru detta Salubref i undertecknande vittnens närvaro, egenhändigt underskrifvet som skedde på Heden den 2ra januari 1861. Eric Jansson (otydligt) och Heden. Anna /bom/ kattharina Jansdotter
Jan Ersson Boende på Heden. Anders Mattsson Hebo egor'"""
response4= """{
  "År-månad-dag": "1861-01-02",
  "Län": "Westmanlands",
  "Härad": "Wagnsbro",
  "Socken": "Wester färnebo",
  "By": "Heden",
  "Jordnatur": "Skatte",
  "Nummer": "",
  "Mantal": "1/8",
  "Örestal": "1",
  "Penningland": "",
  "Riksdaler": "7500",
  "Öre": "",
  "Skilling": "",
  "Runstycken": "",
  "Valuta": "Riksmynt",
  "Säljare-manliga": "Eric Jansson",
  "Säljare-kvinnliga": "Anna Jansdotters",
  "Köpare-manliga": "Jan Ersson",
  "Köpare-kvinnliga": "Anna Jansdotter",
  "Köpare-yrke": "",
  "Relation mellan säljare och köpare": "Svärfar och Svärson",
  "Köpare från": "",
  "Fördel": "",
  "Auktion": ""
}"""
#prompt5="Jag Per Gustaf Hedberg tillika med min hustrus Christina Carolina Gerdtsdotter samtycke upplåter och försäljer till Per Gustaf Ersson och dess hustru Lovisa Ersdotter Klingholmen vårt uti Labodarne ägande Ett Trettiondetvånde dels Hemman med dertill hörande inägojord skog och mark beläget inom Karbennings Socken dock likväl Wagnsbro Härad emot en överenskommen och betingad köpeskilling stor Ett Tusen Två Hundrade Riksdaler Riksmynt, Och som denna köpeskilling 1200 Rd Rmt är uti ett särskildt köpekontrakt häröfver af denna dag upptagen så varder den derigenom här qvitterad. Alltså afhänder vi oss och våra efter-kommande berörde 1/32de dels Hemman med åtföljande förmoner samt alt hvad hädanefter lagligen tillvinnas kan till bemälte Per Gustaf Ersson dess hustru och efterkommande rätts innehafvare att everlderligen äga bruka och besitta, förbindande vi oss till Himmel efter lag hvadan vi uti tvenne tillkallade wittnens när och öfvervaro underskrifne som skedde uti Karbenningby den 19 januari 1861 Per Gustaf Hedberg Christina Carolina Gerdtsdotter i Karbenningby Wittnar Lars Eric Larsson Lars Starksson."

In [None]:
multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"
response_text = generate_response(multi_turn_prompt, temp=0.2, top_p=0.1)
print("Multi-turn conversation response:", response_text)

In [None]:
# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    text='Extrahera noggrant informationen för varje fält och presentera den tydligt i JSON-format. dubbelkolla noggrannheten för varje extraherat fält innan presentationen' + "'''"+text.strip()+"'''"
    # Construct the multi-turn prompt
    multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"

    # Generate the response
    response_text = generate_response(multi_turn_prompt, temp=0.8, top_p=0.85)
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        json_data = json.loads('{'+response_text.split('{')[-1])
        json_data['text'] = text
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        json_data['text'] = text
        extracted_data.append(json_data)
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_hightp = pd.DataFrame(extracted_data)
df_extracted_hightp.to_csv('Extracted_hightnp.csv')
df_extracted_hightp.to_excel('Extracted_hightnp.xlsx')

In [13]:
#chain of thought user prompt test 1
# Initialize a list to collect data
extracted_data = []

# Loop through each text in the DataFrame
for text in df['Text']:
    text='Tänk noga steg för steg och extrahera informationen för varje fält i texten från ett markförsäljningskontrakt och presentera det tydligt i JSON-format. dubbelkolla noggrannheten för varje extraherat fält innan presentationen' + "'''"+text.strip()+"'''"
    # Construct the multi-turn prompt
    multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {text}<|end_of_turn|>GPT4 Correct Assistant:"
    #multi_turn_prompt = f"GPT4 Correct System: {system_prompt}<|end_of_turn|>GPT4 Correct User: {prompt1}<|end_of_turn|>GPT4 Correct Assistant: {response1}<|end_of_turn|>GPT4 Correct User: {prompt2}<|end_of_turn|>GPT4 Correct Assistant: {response2}<|end_of_turn|>GPT4 Correct User: {prompt3}<|end_of_turn|>GPT4 Correct Assistant: {response3}<|end_of_turn|>GPT4 Correct User: {prompt4}<|end_of_turn|>GPT4 Correct Assistant:{response4}<|end_of_turn|>GPT4 Correct User: {prompt5}<|end_of_turn|>GPT4 Correct Assistant:"

    # Generate the response
    response_text = generate_response(multi_turn_prompt, temp=0.8, top_p=0.85)
    
    # Parse JSON and add to the list
    try:
        # Extract JSON from the response
        json_data = json.loads('{'+response_text.split('{')[-1])
        extracted_data.append(json_data)
        print('Row added!')
    except json.JSONDecodeError:
        print("Error parsing JSON for response: ", response_text)

# Create a DataFrame from the collected data
df_extracted_hightp = pd.DataFrame(extracted_data)
df_extracted_hightp.to_csv('COTExtracted_hightnp.csv')
df_extracted_hightp.to_excel('COTExtracted_hightnp.xlsx')


Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Error parsing JSON for response:  GPT4 Correct System: Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:
År-månad-dag: Identifiera datumet i formatet år-månad-dag.
Län: Namnet på länet.
Härad: Namnet på häradet.
Socken: Namnet på socknen.
By: Namnet på byn.
Jordnatur: Typ av jord eller mark.
Mantal: Information om mantal.
Örestal: Antal öre.
Penningland: Information om penningland.
Riksdaler: Antal riksdaler.
Öre: Antal öre.
Skilling: Antal skilling.
Runstycken: Information om runstycken.
Valuta: Typ av valuta som används.
Sälja

Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Error parsing JSON for response:  GPT4 Correct System: Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:
År-månad-dag: Identifiera datumet i formatet år-månad-dag.
Län: Namnet på länet.
Härad: Namnet på häradet.
Socken: Namnet på socknen.
By: Namnet på byn.
Jordnatur: Typ av jord eller mark.
Mantal: Information om mantal.
Örestal: Antal öre.
Penningland: Information om penningland.
Riksdaler: Antal riksdaler.
Öre: Antal öre.
Skilling: Antal skilling.
Runstycken: Information om runstycken.
Valuta: Typ av valuta som används.
Säljare-manlig: Namn på manliga säljare.
Säljare-kvinnlig: Namn på kvinnliga säljare.
Köpare-manlig: Namn på manlig

Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Error parsing JSON for response:  GPT4 Correct System: Hej, jag behöver din hjälp för att extrahera specifik information från en svensk text. Var noggrann och ge endast information som finns tydligt i texten. Om du är osäker på något, eller om informationen inte finns i texten, är det bättre att inte ge ett svar för den specifika punkten. Här är de fält jag behöver information om:
År-månad-dag: Identifiera datumet i formatet år-månad-dag.
Län: Namnet på länet.
Härad: Namnet på häradet.
Socken: Namnet på socknen.
By: Namnet på byn.
Jordnatur: Typ av jord eller mark.
Mantal: Information om mantal.
Örestal: Antal öre.
Penningland: Information om penningland.
Riksdaler: Antal riksdaler.
Öre: Antal öre.
Skilling: Antal skilling.
Runstycken: Information om runstycken.
Valuta: Typ av valuta som används.
Säljare-manlig: Namn på manliga säljare.
Säljare-kvinnlig: Namn på kvinnliga säljare.
Köpare-manlig: Namn på manliga köpare.
K

Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
Row added!
