This notebook aims to scrape laws presented at the Lithuanian parliament, to uncover daily what laws are being presented and summarise them.

In [2]:
import pandas as pd
from bs4 import BeautifulSoup
import requests
import ollama


In [3]:
site = 'https://www.lrs.lt/sip/portal.show?p_r=35368&p_a=kz_rodyti_dokumentus&p1=6'

response = requests.get(site)
soup = BeautifulSoup(response.content, 'html.parser')

# gets all table rows, ignores the header
trs = soup.find_all('tr')
trs = trs[1:]

entries = []

for rows in trs:
    # gets all table cells
    tds = rows.find_all('td')
    tds = tds[1:] # drops the number cell
    entry = [td.text for td in tds]
    try:
        entry.append(tds[0].a['href'])
    except:
        entry.append('No link')
    entries.append(entry)

df = pd.DataFrame(entries, columns=['Pavadinimas', 'Numeris', 'Data', 'Pateikė', 'url'])
df = df[:-3]
df.head(30)


Unnamed: 0,Pavadinimas,Numeris,Data,Pateikė,url
0,Pridėtinės vertės mokesčio įstatymo Nr. IX-751...,XVP-128,2025-02-13,Seimo narys Artūras Zuokas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
1,Atmintinų dienų įstatymo Nr. VIII-397 1 straip...,XVP-127,2025-02-11,Seimo narys Dainius Kreivys,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
2,Įstatymo „Dėl Lietuvos Respublikos Vyriausybės...,XVP-126,2025-02-11,Lietuvos Respublikos Prezidentas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
3,Dokumentų ir archyvų įstatymo Nr. I-1115 20 st...,XVP-125,2025-02-10,"Seimo nariai: Arvydas Anušauskas, Dainius Kre...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
4,"Asmenų, slapta bendradarbiavusių su buvusios S...",XVP-124,2025-02-10,"Seimo nariai: Arvydas Anušauskas, Dainius Kre...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
5,Dainų švenčių tradicijos įstatymo Nr. X-1334 4...,XVP-123,2025-02-10,"Seimo nariai: Andrius Bagdonas, Andrius Busil...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
6,"Administracinių nusižengimų kodekso 77, 170 ir...",XIVP-3987(2),2025-02-10,Seimo narė Jurgita Sejonienė,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
7,"Tabako, tabako gaminių ir su jais susijusių ga...",XIVP-3985(2),2025-02-10,Seimo narė Jurgita Sejonienė,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
8,"Tabako, tabako gaminių ir su jais susijusių ga...",XVP-122,2025-02-10,"Seimo nariai: Andrius Busila, Dainius Varnas,...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...
9,Miškų įstatymo Nr. I- 671 7 straipsnio pakeiti...,XVP-121,2025-02-07,Seimo narys Bronis Ropė,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...


In [4]:
def get_word_section_text(url):
    if url == 'No link':
        return 'No content'
    response = requests.get(url)
    print(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    iframe = soup.find('iframe', id='legalActResourceURLIframe')
    if iframe:
        iframe_url = iframe['src']
        response = requests.get(f'https://e-seimas.lrs.lt{iframe_url}')
        iframe_soup = BeautifulSoup(response.content, 'html.parser')
        law_element = iframe_soup.get_text()
    else:
        law_element = 'No content'

    return law_element


df['contents'] = df['url'].apply(get_word_section_text)
df['contents'] = df['contents'].apply(lambda x: x.replace('\n', ' ').replace('\r', ' ').replace('\t', ' '))

https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/5a1b9e40e9d511efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/71341980e88c11efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/b8a27480e88a11efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/8086fb30e7a311efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/ca94b930e7a111efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/5fd02520e79311efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/706f0cc0e78411efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/5d153e20e78311efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/3d7eba40e77511efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/07088cd0e52b11efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/7e341610e52811efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/lt/TAP/5df1dd50e52411efaaf7b71596f7c8a4
https://e-seimas.lrs.lt/portal/legalAct/

In [5]:
df.head()

Unnamed: 0,Pavadinimas,Numeris,Data,Pateikė,url,contents
0,Pridėtinės vertės mokesčio įstatymo Nr. IX-751...,XVP-128,2025-02-13,Seimo narys Artūras Zuokas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS ...
1,Atmintinų dienų įstatymo Nr. VIII-397 1 straip...,XVP-127,2025-02-11,Seimo narys Dainius Kreivys,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKO...
2,Įstatymo „Dėl Lietuvos Respublikos Vyriausybės...,XVP-126,2025-02-11,Lietuvos Respublikos Prezidentas,https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas Projektas LIETUVOS RES...
3,Dokumentų ir archyvų įstatymo Nr. I-1115 20 st...,XVP-125,2025-02-10,"Seimo nariai: Arvydas Anušauskas, Dainius Kre...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS ...
4,"Asmenų, slapta bendradarbiavusių su buvusios S...",XVP-124,2025-02-10,"Seimo nariai: Arvydas Anušauskas, Dainius Kre...",https://e-seimas.lrs.lt/portal/legalAct/lt/TAP...,Projektas LIETUVOS RESPUBLIKOS ...


# Analysing the laws


In [None]:
# ollama.create(model='law_analyser', from_='llama3.2:3b', system='Tau bus pateiktas Lietuvos seimo svarstomas įstatymas, turėsite trumpai aprašyti, ko šiuo įstatymu siekiama. Būkite kuo labiau nešališkas.')

eurollm = 'alibayram/erurollm-9b-instruct:latest'

def get_summary(text):
    response = ollama.chat(model=eurollm, messages=[{
        'role': 'user',
        'content': f'Tau bus pateiktas Lietuvos seimo svarstomas įstatymas, turėsite trumpai aprašyti, ko šiuo įstatymu siekiama. Būkite kuo labiau nešališkas. Šis aprašymas tūretų būti maždaug 3-4 sakinių. Atsakyk tik lietuvių kalba. Įstatymo turinys: {text}',
        'termperature': 0.2
    }])
    print(response['message']['content'])
    return response['message']['content']


In [7]:
df['summary'] = df['contents'].apply(get_summary)

This proposed law in Lithuania aims to simplify the registration and PVM (Value Added Tax) calculation process for certain businesses. The changes made to articles 71, 92, and 97 of the Law on VAT aim to:

* Reduce the threshold for registering as a VAT payer, making it easier for small businesses to comply with tax obligations. This is particularly beneficial for businesses that only occasionally exceed certain revenue limits.
* Exempt certain services or supplies from PVM calculation if they do not exceed specific annual revenue limits. These limits will increase over time (60,000 EUR in 2026, 70,000 EUR in 2027, and 85,000 EUR in 2028).
* Introduce a simplified calculation method for PVM when businesses exceed the specified revenue limits. This method will be applied retroactively to years where the limit was not met but could have been exceeded.
* Clarify that farmers must meet the PVM requirements based on their total annual revenue, regardless of whether they operate individually

In [11]:
len(df.index)

22

In [12]:
today = pd.Timestamp.today().strftime('%Y-%m-%d')
df.to_csv(f'{today}_laws.csv', index=False)