This notebook aims to scrape laws presented at the Lithuanian parliament, to uncover daily what laws are being presented and summarise them.

In [1]:
import pandas as pd
from bs4 import BeautifulSoup
import requests
import ollama


In [2]:
site = 'https://www.lrs.lt/sip/portal.show?p_r=35368&p_a=kz_rodyti_dokumentus&p1=6'

response = requests.get(site)
soup = BeautifulSoup(response.content, 'html.parser')

# gets all table rows, ignores the header
trs = soup.find_all('tr')
trs = trs[1:]

entries = []

for rows in trs:
    # gets all table cells
    tds = rows.find_all('td')
    tds = tds[1:] # drops the number cell
    entry = [td.text for td in tds]
    try:
        entry.append(tds[0].a['href'])
    except:
        entry.append('No link')
    entries.append(entry)

df = pd.DataFrame(entries, columns=['Pavadinimas', 'Numeris', 'Data', 'Pateikė', 'url'])
df = df[:-3]
df.head(30)


Unnamed: 0,Pavadinimas,Numeris,Data,Pateikė,url
0,Konstitucinio Teismo įstatymo Nr. I-67 48 stra...,XVP-137,2025-02-17,"Seimo nariai: Domas Griškevičius, Linas Kukur...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
1,Sveikatos priežiūros įstaigų įstatymo Nr. I-13...,XVP-136,2025-02-14,"Seimo nariai: Andrius Busila, Karolis Podolsk...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
2,Mažmeninės prekybos įmonių nesąžiningų veiksmų...,XVP-135,2025-02-14,"Seimo nariai: Aidas Gedvilas, Andrius Busila,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
3,Atsiskaitymų grynaisiais pinigais ribojimo įst...,XVP-134,2025-02-14,"Seimo nariai: Aidas Gedvilas, Dainius Varnas,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
4,"Asmenų, slapta bendradarbiavusių su buvusios S...",XVP-133,2025-02-14,"Seimo nariai: Aidas Gedvilas, Algirdas Sysas,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
5,Vaiko teisių apsaugos pagrindų įstatymo Nr. I-...,XVP-132,2025-02-14,"Seimo nariai: Aidas Gedvilas, Artūras Skardži...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
6,Baudžiamojo proceso kodekso Nr. IX-785 44 stra...,XVP-131,2025-02-14,"Seimo nariai: Aidas Gedvilas, Artūras Skardži...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
7,Konstitucinio Teismo įstatymo Nr. I-67 4 strai...,XVP-130,2025-02-14,Seimo narys Julius Sabatauskas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
8,Seimo statuto „Dėl Lietuvos Respublikos Seimo ...,XVP-129,2025-02-14,Seimo narys Julius Sabatauskas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
9,Žuvininkystės įstatymo Nr. VIII-1756 14(3) str...,XIVP-3472(3),2025-02-13,Aplinkos apsaugos komitetas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...


In [3]:
def get_word_section_text(url):
    if url == 'No link':
        return 'No content'
    response = requests.get(url)
    print(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    iframe = soup.find('iframe', id='legalActResourceURLIframe')
    if iframe:
        iframe_url = iframe['src']
        response = requests.get(f'https://e-seimas.lrs.lt{iframe_url}')
        iframe_soup = BeautifulSoup(response.content, 'html.parser')
        law_element = iframe_soup.get_text()
    else:
        law_element = 'No content'

    return law_element


df['contents'] = df['url'].apply(get_word_section_text)
df['contents'] = df['contents'].apply(lambda x: x.replace('\n', ' ').replace('\r', ' ').replace('\t', ' '))

https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/7cf0b5a0ecf411efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/66005980ead411efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/be230e00eac511efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/e9195ad0eac311efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/2a57b200eac211efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/1c8dcc10eac011efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/afdc9750eabe11efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/52bb30b0ea9911efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/72c16420ea9811efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/9e4ff690ea1811efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/5a1b9e40e9d511efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/71341980e88c11efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/

In [4]:
df.head()

Unnamed: 0,Pavadinimas,Numeris,Data,Pateikė,url,contents
0,Konstitucinio Teismo įstatymo Nr. I-67 48 stra...,XVP-137,2025-02-17,"Seimo nariai: Domas Griškevičius, Linas Kukur...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKO...
1,Sveikatos priežiūros įstaigų įstatymo Nr. I-13...,XVP-136,2025-02-14,"Seimo nariai: Andrius Busila, Karolis Podolsk...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS SVE...
2,Mažmeninės prekybos įmonių nesąžiningų veiksmų...,XVP-135,2025-02-14,"Seimo nariai: Aidas Gedvilas, Andrius Busila,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS ...
3,Atsiskaitymų grynaisiais pinigais ribojimo įst...,XVP-134,2025-02-14,"Seimo nariai: Aidas Gedvilas, Dainius Varnas,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS AT...
4,"Asmenų, slapta bendradarbiavusių su buvusios S...",XVP-133,2025-02-14,"Seimo nariai: Aidas Gedvilas, Algirdas Sysas,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS ...


# Analysing the laws


In [5]:
theme_prompt = f'Tau bus pateiktas Lietuvos seimo svarstomas įstatymas, turi apie jį išgryninti iki keturių vieno ar dviejų žodžių temų. Būkite kuo labiau nešališkas. Šias temas apibūdink panašiai į šį pavyzdį apie e-cigarečių draudimą: "e-cigaretės, tabakas, prekyba" Temos neturi būti numeruotos, jos turi būti atskirtos kableliais. Atsakyk tik lietuvių kalba. Nerašyk nieko apart temų. Įstatymo turinys: ',
theme_prompt = 'Tau bus pateiktas Lietuvos Seimo svarstomas įstatymas. Išgrynink iš jo keturias vieno ar dviejų žodžių temas, išlaikydamas kuo didesnį nešališkumą. Temos turi būti pateiktos be numeracijos, atskirtos kableliais ir viena tarpo ženklo (", ") kombinacija, kad būtų lengvai išskaidomos naudojant Python split(", ") funkciją, panašiai kaip šiame pavyzdyje apie e-cigarečių draudimą: "e-cigaretės, tabakas, prekyba". NENAUDOK jokio kitokio formato. Atsakyk tik lietuvių kalba ir nerašyk nieko, išskyrus temas. Įstatymo turinys:'
theme_prompt = "You will be given a law being discussed in the Lithuanian Parliament. Extract up to four themes up to three words in length. SPECIAL FORMAT NOTE: Themes should be separated by commas and a space. Do not include any other text. The output must be parseable by Python's split() function. Only include the themes themselves, no labels. An example output looks like this: 'THEME, THEME, THEME' where THEME is one of your extracted themes. Answer only in Lithuanian. If you cannot think of meaningful themes, return 'None'. Law content: "
theme_prompt = (
    "You will be given a law being discussed in the Lithuanian Parliament. "
    "Extract exactly four themes, each up to three words in length. "
    "SPECIAL FORMAT NOTE: Themes must be separated by a comma followed by a single space (', '). "
    "Do not include any other text, labels, or explanations. "
    "The output must be strictly parseable by Python's split(', ') function. "
    "If the law does not provide enough meaningful themes, repeat 'None' four times like this: 'None, None, None, None'. "
    "An example output format: 'THEME, THEME, THEME, THEME'. "
    "Answer only in Lithuanian. "
    "Law content: "
)

In [6]:
# ollama.create(model='law_analyser', from_='llama3.2:3b', system='Tau bus pateiktas Lietuvos seimo svarstomas įstatymas, turėsite trumpai aprašyti, ko šiuo įstatymu siekiama. Būkite kuo labiau nešališkas.')

eurollm = 'alibayram/erurollm-9b-instruct:latest'

def get_summary(text):
    response = ollama.chat(model=eurollm, messages=[{
        'role': 'user',
        'content': f'Tau bus pateiktas Lietuvos seimo svarstomas įstatymas, turėsite trumpai aprašyti, ko šiuo įstatymu siekiama. Būkite kuo labiau nešališkas. Šis aprašymas tūretų būti maždaug 3-4 sakinių. Atsakyk tik lietuvių kalba. Nerašyk nieko apart dokumento aprašymo. Įstatymo turinys: {text}',
        'termperature': 0.2
    }])
    print(response['message']['content'])
    return response['message']['content']

def get_themes(text):
    response = ollama.chat(model=eurollm, messages=[{
        'role': 'user',
        'content': theme_prompt + text,
        'termperature': 0.3
    }])
    print(response['message']['content'])
    return response['message']['content']


In [8]:
df['summary'] = df['contents'].apply(get_summary)

Šiuo įstatymu siekiama išplėsti Konstitucinio Teismo teisėjų nušalinimo ar nusišalinimo nuo bylos nagrinėjimo atvejus, įtraukiant naujus, susijusius su teisėjo nešališkumu. Pagrindiniai pakeitimai yra šie: 1) giminių ryšys byloje sprendžiamu klausimu; 2) viešos išankstinės nuomonės apie bylą reiškimas; 3) dalyvavimas rengiant ir (ar) teikiant teisės aktų projektus, dėl kurių atitiktis Konstitucijai ar įstatymui yra tiriama; 4) priklausymas tai pačiai politinei organizacijai, frakcijai ar buvę susijęs su dalyvaujančiais byloje asmenimis politinio pasitikėjimo ryšiais. Šie pakeitimai turėtų padėti užtikrinti didesnį teisėjų nešališkumą ir objektyvumą sprendžiant bylas.
Šiuo įstatymu siekiama pakeisti LNSS (Lietuvos nacionalinio socialinės apsaugos draudimo) įstatymo 15 straipsnį, reglamentuojantį LNSS valstybės ir savivaldybių biudžetinių ir viešųjų įstaigų vadovų ir sveikatos priežiūros specialistų priėmimą į darbą ir atleidimą iš darbo tvarką. Pagrindinis pakeitimas susijęs su vadovų s

In [None]:
df['themes'] = df['contents'].apply(get_themes)

143 STRAIPSNIO PAKEITIMO ĮSTATYMAS, 2025 m.

Verslinė žvejyba, Žvejybos kvotos, Žuvų ištekliai, Sankcijos.
Theme, Theme, Theme, Theme
Energetikos, nepriklausomybės, energetinė, diena
Susitarimas, ratifikavimas, be leidimo gyvenantys asmenys, readmisija
Nacionalinis fondas, dokumentai, teisės ribojimas, prieiga
'Pakeitimas, apsaugos, asmenų, duomenų',  'THEME, THEME, THEME, THEME'.
Šeimos, Kultūra, Tradicijos, Tarptautiniai ryšiai  'Family, Culture, Traditions, International relations', 'Lietuvos RESPUBLIKOS DAINŲ ŠVENČIŲ TRADICIJOS ĮSTATYMO NR. X-1334 4 STRAIPSNIO PAKEITIMO ĮSTATYMAS 2025 m., d. Vilnius, 1 straipsnis, 4 straipsnio keitimas, 6 punktas: Pasaulio lietuvių vienybės diena, kurioje dalyvauja užsienio lietuvių bendruomenės ir jų vaikų, jaunimo bei suaugusiųjų meno kolektyvai;, 7 punktas'
Tabako gaminių, prekybos ir viešojo maitinimo įmonių, elektroninių cigarečių, amžiaus ribos.
THEME, THEME, THEME, THEME
6, rinkai, pateikti, vienkartines
7 straipsnio pakeitimas
Šis tekstas y

In [9]:
len(df.index)

28

In [10]:
today = pd.Timestamp.today().strftime('%Y-%m-%d')
df.to_csv(f'web-app/data/{today}_laws.csv', index=False)