### Example GET URL -> html 

In [1]:
from urllib.request import urlopen
url = "http://olympus.realpython.org/profiles/aphrodite"
page = urlopen(url)

In [2]:
page

<http.client.HTTPResponse at 0x256df9f4040>

In [3]:
html_bytes = page.read()
html = html_bytes.decode("utf-8")

In [4]:
print(html)

<html>
<head>
<title>Profile: Aphrodite</title>
</head>
<body bgcolor="yellow">
<center>
<br><br>
<img src="/static/aphrodite.gif" />
<h2>Name: Aphrodite</h2>
<br><br>
Favorite animal: Dove
<br><br>
Favorite color: Red
<br><br>
Hometown: Mount Olympus
</center>
</body>
</html>



### Example Using html find 

In [5]:
title_index = html.find("<title>")
start_index = title_index + len("<title>")
end_index = html.find("</title>")
start_index, end_index

(21, 39)

In [6]:
title = html[start_index:end_index]
title

'Profile: Aphrodite'

### Example Regex

In [7]:
import re

url = "http://olympus.realpython.org/profiles/poseidon"
page = urlopen(url)
html = page.read().decode("utf-8")
pattern = "<title.*?>.*?</title.*?>"
match_results = re.search(pattern, html, re.IGNORECASE)
title = match_results.group()
print(title)
title = re.sub("<.*?>", "", title)
title

<title >Profile: Poseidon</title>


'Profile: Poseidon'

### Example Beatiful Soup

In [8]:
from bs4 import BeautifulSoup
from urllib.request import urlopen

url = "http://olympus.realpython.org/profiles/dionysus"
page = urlopen(url)
html = page.read().decode("utf-8")
soup = BeautifulSoup(html, "html.parser")
print(soup.get_text())
print(soup.find_all("img"))



Profile: Dionysus





Name: Dionysus

Hometown: Mount Olympus

Favorite animal: Leopard 

Favorite Color: Wine




[<img src="/static/dionysus.jpg"/>, <img src="/static/grapes.png"/>]


In [9]:
def get_soup(url: str):
    page = urlopen(url, timeout=1)
    html = page.read().decode("utf-8")
    soup = BeautifulSoup(html, "html.parser")
    return soup
vaal_soup = get_soup("https://www.vaal.ee/oksjonid")

In [10]:
vaal_soup.find_all("arhiiv")

[]

## Example Regex find all for pattern (web pages)

In [11]:
def get_re(url: str, pattern):
    '''
    Opens connection with url, returns all matches matching pattern
    '''
    page = urlopen(url, timeout=1)
    html = page.read().decode("utf-8")
    match_results = re.findall(pattern, html, re.IGNORECASE)
    return match_results
vaal_re = get_re("https://www.vaal.ee/oksjonid",  '"http://arhiiv.*?"')

In [12]:
vaal_re[0], vaal_re[-1]

('"http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad"',
 '"http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_kevadoksjon"')

## Example Data preparation

In [13]:
oksjon_url = vaal_re[0].replace('"', "")
oksjon_soup = get_soup(oksjon_url)

## Examples of using BeautifulSoup

In [14]:
# Get text from art piece
pildi_infod = oksjon_soup.find_all("td", {"class": "galDesc"})
pildi_infod[0].get_text()

'01. Allsalu, Efraim (1929–2006)\n                Alghind\xa01500.00 EUR Lõpphind\xa03300.00 EUR '

In [15]:
# Get more info url
base_url = "http://arhiiv.vaal.ee"
pildi_link = oksjon_soup.find_all("td", {"class": "galPic"})
raw_link = pildi_link[0].a["href"]
url_end = re.search("'.*?'", raw_link, re.IGNORECASE).group().replace("'", "")
print(base_url + url_end)

http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9046


In [16]:
autor = re.search(" .*?\\n", pildi_infod[0].get_text(), re.IGNORECASE).group().strip()
print(autor)
hinnad = re.findall("hind.*? ", pildi_infod[0].get_text(), re.IGNORECASE)
alghind = hinnad[0].split(u'\xa0')[1].strip()
print(alghind)
lopphind = hinnad[1].split(u'\xa0')[1].strip()
print(lopphind)

Allsalu, Efraim (1929–2006)
1500.00
3300.00


## Fetch art piece specific url sites (also images)

In [17]:
from urllib import request
from urllib.request import urlopen
import re
from urllib.request import urlopen, URLError
from bs4 import BeautifulSoup
from socket import timeout

base_url = "http://arhiiv.vaal.ee"

def get_re(url: str, pattern):
    '''
    Opens connection with url, returns all matches matching pattern
    '''
    page = urlopen(url, timeout=1)
    html = page.read().decode("utf-8")
    match_results = re.findall(pattern, html, re.IGNORECASE)
    return match_results

def get_soup(url: str):
    """
    Opens website and makes Soup from it
    """
    page = urlopen(url, timeout=1)
    html = page.read().decode("utf-8")
    soup = BeautifulSoup(html, "html.parser")
    return soup

def get_soup_persistent(url: str):
    """
    Persistently tries to make Soup from given website link. Fixes timeout error
    """
    haus_year_soup = None
    while True:
        try:
            haus_year_soup = get_soup(url)
            return haus_year_soup
        except timeout as e:
            print(e)
        except URLError as e:
            print(e)  

def vaal_extract_page(page_soup):
    """
    Finds 1 auction page art pieces links.
    """
    all_items = page_soup.find_all("td", {"class": "galDesc"})
    all_imgs = page_soup.find_all("td", {"class": "galPic"})
    if len(all_items) == 0: # Invalid page, no content
        return None
    art_pieces = []
    counter = 0
    for item in all_items:
        art_piece_obj = dict()
#         author = re.search(" .*?\\n", item.get_text(), re.IGNORECASE).group().strip()
#         start_price = "-1"
#         end_price = "-1"
#         prices = re.findall("hind.*? ", item.get_text(), re.IGNORECASE)
#         if len(prices) == 1:
#             start_price = prices[0].split(u'\xa0')[1].strip()
#         elif(len(prices) == 2): # Check if end price present
#             start_price = prices[0].split(u'\xa0')[1].strip()
#             end_price = prices[1].split(u'\xa0')[1].strip()
#         art_piece_obj["author"] = author
#         art_piece_obj["start_price"] = start_price
#         art_piece_obj["end_price"] = end_price
        raw_link = all_imgs[counter].a["href"]
        url = re.search("'.*?'", raw_link, re.IGNORECASE).group().replace("'", "")
        art_piece_obj["url"] = url
        
        art_pieces.append(art_piece_obj)
        #print(author, start_price, end_price, info_link)
        counter +=1


    return art_pieces

def vaal_extract_all_auctions():
    """
    Finds all vaal auctions. Finds every auction art pieces information
    """
    pattern = r'"http://arhiiv.*?"'
    url = "https://www.vaal.ee/oksjonid"
    all_pages = get_re(url, pattern)
    vaal_art_pieces = []
    for auction in all_pages:
        page_nr = 1
        while True: # Every page has 12 art pieces, if less than 12 then last page 
            url = auction.replace('"', "") + "?page=" + str(page_nr)
            print(url)
            soup = get_soup_persistent(url)
            page_art_pieces = vaal_extract_page(soup)
            if page_art_pieces is None:
                break
            vaal_art_pieces.extend(page_art_pieces)
            page_nr += 1
    return vaal_art_pieces

data = vaal_extract_all_auctions() # about 4 min runtime

http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=1
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=2
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=3
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=4
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=5
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=6
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2021kevad?page=7
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=1
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=2
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=3
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=4
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=5
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis?page=6
http://arhiiv.vaal.ee/avaleht/oksjon/toimunud_oksjonid/2020sugis

http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=1
<urlopen error timed out>
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=2
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=3
<urlopen error timed out>
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=4
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=5
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon?page=6
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2012_jouluoksjon?page=1
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2012_jouluoksjon?page=

http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=1
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=2
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=3
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=4
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=5
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=6
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=7
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon?page=8
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon?page=1
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon?page=2
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon?page=3
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon?page=4
http

<urlopen error timed out>
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon?page=4
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon?page=5
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_kevadoksjon?page=1
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_kevadoksjon?page=2
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_kevadoksjon?page=3
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2002_kevadoksjon?page=4
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon?page=1
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon?page=2
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon?page=3
<urlopen error timed out>
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon?page=4
http://arhiiv.vaal.ee/est/avaleht/oksjon/toimunud_oksjonid/2001_sy

### Example: Get info from url link

In [18]:
example_dict = dict()
print(len(data))
p_link = data[3]["url"]
p_soup = get_soup_persistent(base_url + p_link)

# Reference link
example_dict["Viide"] = p_link

# Default fields
table_elements = p_soup.table.find_all("td")
fields = p_soup.table.find_all("td", {"class":"field"})
for i in range(len(fields)):
    field_name = fields[i].get_text()
    end_index = field_name.index(":")
    example_dict[field_name[:end_index]] = fields[i].find_next("td").get_text()
    
# Description
desc = fields[-1].find_next("td").find_next("td").get_text()
example_dict["Kirjeldus"] = desc
# Img link
img_link_end = p_soup.table.td.img["src"]
img_link_full = base_url + img_link_end
print(img_link_full)
example_dict["Pilt"] = img_link_full

#p_soup.table.find_all("td")
print(example_dict)


2585
http://arhiiv.vaal.ee/static/files/085/t2_bach.jpg
{'Viide': '/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9079', 'Autor': '04. Bach, Aino (1901–1980)', 'Teos': 'Väike Mari (1957)', 'Kategooria': '2021 kevadoksjon', 'Tehnika': 'kuivnõel', 'Mõõdud': 'plm 17,5 x 12,5', 'Alghind': '1000.00 EUR ', 'Lõpphind': '1000.00 EUR ', 'Kirjeldus': 'Portree modell oli – nagu ka tuntud kuivnõelagravüüris „Magav laps” (1955) – tulevane näitleja Mari Lill. Väljendusrikkaid lapseportreesid lõi A. Bach enne sõda, eriti aga 1950. aastatel, mis olid tema teiseks tipp-perioodiks 1930. aastate järel. Enamasti on nad läbi viidud kaunijoonelises kuivnõelatehnikas. Võrreldes „Magava lapse” või „Leenaga” (1959, pehmelakk) on „Väike Mari” suhteliselt vähe levinud. Signatuur all paremal.', 'Pilt': 'http://arhiiv.vaal.ee/static/files/085/t2_bach.jpg'}


## Extract all useful information from art piece website

In [19]:
def get_src_info(data):
    counter = 0 # temporary usage
    for d in range(len(data)):
        art_piece_obj = dict()
        link = data[d]["url"]
#         if counter == 20:
#             break
        print(link)
        p_soup = get_soup_persistent(base_url + link)

        # Reference link
        art_piece_obj["url"] = link

        # Default fields
        fields = p_soup.table.find_all("td", {"class":"field"})
        for i in range(len(fields)):
            field_name = fields[i].get_text()
            try:
                end_index = field_name.index(":")
                art_piece_obj[field_name[:end_index]] = fields[i].find_next("td").get_text()
            except ValueError as e:
                break

        # Description
        desc = fields[-1].find_next("td").find_next("td")
        if desc:
            art_piece_obj["desc"] = desc.get_text()
        else:
            art_piece_obj["desc"] = None
        # Img link
        img_link_end = p_soup.table.td.img["src"]
        art_piece_obj["img"] = img_link_end

        counter+=1

        #print(art_piece_obj)
        data[d] = art_piece_obj
get_src_info(data)

/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9046
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9078
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9047
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9079
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9117
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9080
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9049
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9041
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9072
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9115
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/hor/pic_id-9081
/est/avaleht/oksjon/toimunud_oksjonid/2021kevad/newwin/vert/pic_id-9082
<urlopen erro

/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8912
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8965
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/vert/pic_id-8922
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8913
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8966
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8967
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8927
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/hor/pic_id-8981
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/vert/pic_id-8914
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2020sugis/newwin/vert/pic_id-8968
<urlopen error timed out>
<

/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/vert/pic_id-8574
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/vert/pic_id-8575
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8576
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/vert/pic_id-8577
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8578
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8579
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8580
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8581
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8586
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8582
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8584
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/vert/pic_id-8585
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/vert/pic_id-8589
/est/avaleht/oksjon/toimunud_oksjonid/2019sugis/newwin/hor/pic_id-8590
/

<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/vert/pic_id-8277
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8271
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/vert/pic_id-8291
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8318
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8307
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8313
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8272
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8299
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/hor/pic_id-8265
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2018sugis/newwin/vert/pic_id-8310
<

/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7895
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7896
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7920
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7914
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7885
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7905
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7922
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7916
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7892
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7918
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/vert/pic_id-7889
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7919
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7915
/est/avaleht/oksjon/toimunud_oksjonid/2017sugis/newwin/hor/pic_id-7897


<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/vert/pic_id-7285
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/vert/pic_id-7286
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7364
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7365
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7390
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7281
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/vert/pic_id-7366
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7287
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/hor/pic_id-7367
/est/avaleht/oksjon/toimunud_oksjonid/2016sugis/newwin/vert/pic_id-7368
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>


/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6903
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6878
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/vert/pic_id-6924
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/vert/pic_id-6925
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6855
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6880
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/vert/pic_id-6872
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6892
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6920
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6876
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6899
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6897
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6864
/est/avaleht/oksjon/toimunud_oksjonid/sugis2015/newwin/hor/pic_id-6883
/es

/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/vert/pic_id-6684
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6678
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/vert/pic_id-6679
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/vert/pic_id-6726
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6688
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/vert/pic_id-6724
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6685
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6716
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6708
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6725
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6707
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/vert/pic_id-6686
/est/avaleht/oksjon/toimunud_oksjonid/kevad2015/newwin/hor/pic_id-6680
/est/avaleht/oksjon/toimunud_oksjonid/2014talveoksjon/newwin/vert/pic_id

<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/hor/pic_id-6432
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/vert/pic_id-6490
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/hor/pic_id-6494
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/vert/pic_id-6461
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/vert/pic_id-6462
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/hor/pic_id-6464
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/hor/pic_id-6470
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2014sgisoksjon/newwin/hor/pic_id-6448
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>

/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-6010
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-6020
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-5990
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-6009
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-5942
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/vert/pic_id-6012
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-6019
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-5934
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/vert/pic_id-6004
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/vert/pic_id-6011
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/vert/pic_id-6001
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-5941
/est/avaleht/oksjon/toimunud_oksjonid/2013_sgisoksjon/newwin/hor/pic_id-

/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/vert/pic_id-5587
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5594
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5624
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5603
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5625
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5573
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5616
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/hor/pic_id-5627
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2013_tartuoksjon/newwin/vert/pic_id-5588
<urlopen error timed out>
<urlopen e

/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5364
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5365
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5366
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/vert/pic_id-5367
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/vert/pic_id-5403
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5380
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5368
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5402
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5381
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/vert/pic_id-5370
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/hor/pic_id-5384
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwin/vert/pic_id-5372
/est/avaleht/oksjon/toimunud_oksjonid/2012_sygisoksjon/newwi

/est/avaleht/oksjon/toimunud_oksjonid/2012_kevadoksjon/newwin/vert/pic_id-4980
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/vert/pic_id-4750
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-8854
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-8855
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-8856
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-8857
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/vert/pic_id-8858
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-4755
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_sygisoksjon/newwin/hor/pic_id-4756
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjon

/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/vert/pic_id-8875
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-4352
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-4353
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/vert/pic_id-4354
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-8876
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-8877
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-4357
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/hor/pic_id-4358
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/vert/pic_id-4359
/est/avaleht/oksjon/toimunud_oksjonid/2011_kevadoksjon/newwin/vert/pic_id-4360
<urlopen error timed out>
<urlopen error timed out>
<urlopen

/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3904
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3911
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/vert/pic_id-3880
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/vert/pic_id-3910
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3894
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/vert/pic_id-3884
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3881
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/vert/pic_id-3882
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3905
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3906
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3891
/est/avaleht/oksjon/toimunud_oksjonid/2010_kollektor_juuli/newwin/hor/pic_id-3892
/est/avaleht

<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/vert/pic_id-3800
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/hor/pic_id-3761
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/hor/pic_id-3783
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/vert/pic_id-3801
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/hor/pic_id-3802
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/vert/pic_id-3803
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/hor/pic_id-3804
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin/hor/pic_id-3775
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2010_kevadoksjon/newwin

/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/vert/pic_id-3052
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-2966
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-2968
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/vert/pic_id-3060
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/vert/pic_id-3054
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-2965
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-3066
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-2990
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-3059
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-3065
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/hor/pic_id-2989
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwin/vert/pic_id-2991
/est/avaleht/oksjon/toimunud_oksjonid/2009_kevadoksjon/newwi

<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2665
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2666
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2667
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/hor/pic_id-2668
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2669
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2670
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2671
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/hor/pic_id-2672
/est/avaleht/oksjon/toimunud_oksjonid/2008_sygisoksjon/newwin/vert/pic_id-2673
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_ok

/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/vert/pic_id-2588
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/hor/pic_id-2589
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/hor/pic_id-2590
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/hor/pic_id-2591
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/vert/pic_id-2592
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/vert/pic_id-2593
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/vert/pic_id-2594
/est/avaleht/oksjon/toimunud_oksjonid/2008_pallas/newwin/vert/pic_id-2595
/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon/newwin/vert/pic_id-2376
/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon/newwin/hor/pic_id-2377
/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon/newwin/hor/pic_id-2378
/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon/newwin/hor/pic_id-2379
/est/avaleht/oksjon/toimunud_oksjonid/2008_kevadoksjon/newwin/hor/pic_id-2380
/est/avaleht/oksjon/

/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/hor/pic_id-2100
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2101
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2102
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2103
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/hor/pic_id-2104
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2105
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/hor/pic_id-2074
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2106
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2107
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_sygisoksjon/newwin/vert/pic_id-2108
/est/avaleht/oksjon/toimunud_ok

/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/vert/pic_id-1980
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/vert/pic_id-1979
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1978
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/vert/pic_id-1977
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-8850
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1975
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1974
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1973
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/vert/pic_id-1972
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1971
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/vert/pic_id-1970
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1969
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1967
/est/avaleht/oksjon/toimunud_oksjonid/2007_TKM/newwin/hor/pic_id-1966
/est/avaleht/ok

<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1314
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1315
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/vert/pic_id-1316
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1317
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1318
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1319
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/vert/pic_id-1320
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/vert/pic_id-1321
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2007_kevadoksjon/newwin/hor/pic_id-1322
<urlopen error timed out>
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjon

/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/hor/pic_id-926
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/hor/pic_id-927
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-928
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-929
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/hor/pic_id-930
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/hor/pic_id-931
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-932
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-933
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-934
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-935
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-936
/est/avaleht/oksjon/toimunud_oksjonid/2006_sygisoksjon/newwin/vert/pic_id-937
<urlopen error t

/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/vert/pic_id-1088
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1089
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1090
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1091
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1092
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1093
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/vert/pic_id-1094
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1095
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1096
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1097
/est/avaleht/oksjon/toimunud_oksjonid/2006_ekt/newwin/hor/pic_id-1098
/est/avaleht/oksjon/toimunud_oksjonid/2005_sygisoksjon/newwin/hor/pic_id-1205
/est/avaleht/oksjon/toimunud_oksjonid/2005_sygisoksjon/newwin/hor/pic_id-1206
/est/avaleht/oksjon/toimunud_oksjonid/2005_sygisoksjon/newwin/hor/pic_id

<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1256
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/hor/pic_id-1257
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/hor/pic_id-1258
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1259
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1260
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/hor/pic_id-1261
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1264
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1263
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/vert/pic_id-1265
/est/avaleht/oksjon/toimunud_oksjonid/2004_sygisoksjon/newwin/hor/pic_id-1266
<urlopen error timed out>
<urlopen error timed out>
/est/a

/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1527
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/vert/pic_id-1528
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1529
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/vert/pic_id-1530
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1531
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/vert/pic_id-1532
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/vert/pic_id-1533
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1534
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1535
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1536
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1537
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwin/hor/pic_id-1538
/est/avaleht/oksjon/toimunud_oksjonid/2004_kevadoksjon/newwi

/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1697
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1698
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1699
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1700
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/vert/pic_id-1701
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1702
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1703
<urlopen error timed out>
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1704
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1705
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid/2002_sygisoksjon/newwin/hor/pic_id-1706
<urlopen error timed out>
/est/avaleht/oksjon/toimunud_oksjonid

/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/vert/pic_id-1642
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1643
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1644
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1645
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1646
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1647
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1648
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/vert/pic_id-1649
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/vert/pic_id-1650
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/vert/pic_id-1651
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/vert/pic_id-1652
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/newwin/hor/pic_id-1653
/est/avaleht/oksjon/toimunud_oksjonid/2001_sygisoksjon/neww

## Create dataframe

In [20]:
import pandas as pd
print(len(data))
df = pd.DataFrame(data)
df.head()

2585


Unnamed: 0,Alghind,Autor,Hind,Kategooria,Lõpphind,Mõõdud,Tehnika,Teos,desc,img,url
0,1500.00 EUR,"01. Allsalu, Efraim (1929–2006)",,2021 kevadoksjon,3300.00 EUR,"49 x 36,5","õli, masoniit",Tants (1985),Kallak lüürilis-sümbolistlikku improvisatsioon...,/static/files/003/t2_allsalu_22tants22.jpg,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...
1,750.00 EUR,"02. Arrak, Henno (1930–2017)",,2021 kevadoksjon,1000.00 EUR,"plm 33,5 x 39",ofort,Aiapidu II 7/25 (1971),Signatuur all paremal.,/static/files/024/t2_hennoarrak.jpg,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...
2,450.00 EUR,"03. Arrak, Jüri (s 1936)",,2021 kevadoksjon,1000.00 EUR,"km 33,5 x 63,5",linoollõige,Poisid õunaga 16/25 (1967),Teos kuulub Eesti Kunsti Muuseumi kogusse. Sig...,/static/files/064/t2_arrak_22poisid_unaga22.jpg,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...
3,1000.00 EUR,"04. Bach, Aino (1901–1980)",,2021 kevadoksjon,1000.00 EUR,"plm 17,5 x 12,5",kuivnõel,Väike Mari (1957),Portree modell oli – nagu ka tuntud kuivnõelag...,/static/files/085/t2_bach.jpg,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...
4,2900.00 EUR,"05. Burman, Paul (1888–1934)",,2021 kevadoksjon,4800.00 EUR,"48,5 x 48,5","õli, vineer",Talimotiiv (1920–1923),Paul Burmani on peetud Eesti kunsti üheks esim...,/static/files/009/t2_burman.jpg,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...


## Clean df, remove unwanted characters

In [21]:
df["auction_name"] = df["Kategooria"]
df["tech"] = df["Tehnika"]
df["start_price"] = df["Alghind"].str.split(" ", 1, expand=True)[0]
df["end_price"] = df["Lõpphind"].str.split(" ", 1, expand=True)[0]
df["Hind"] = df["Hind "].str.split(" ", 1, expand=True)[0]
df["start_price"] = df["start_price"].fillna(df["Hind"])


df["author_year"] = df["Autor"].str.split("(", 1, expand=True)[1]
df["author_year"] = df["author_year"].str.replace(")", "").str.replace("s", "")
df = df.join(df['author_year'].str.split('–', 1, expand=True).rename(columns={0:'author_year_start', 1:'author_year_end'})) # special - symbol (–)

df["author"] = df["Autor"].str.split(" ", 1, expand=True)[1]
df["author"] = df["author"].str.split("(", 1, expand=True)

df["year"] = df["Teos"].str.extract("((19|20)\d{2})", expand=True)[0]
df["title"] = df["Teos"].str.split(" ", 1, expand=True)[0]
#df["Teos_algus"], df["Teos_lõpp"] = df["Teos_aasta"].str.split("-", 1, expand=True).str

# Extract years
df = df.join(df['year'].str.split('–', 1, expand=True).rename(columns={0:'year_start', 1:'year_end'})) # special - symbol (–)
df["year_start"] = df["year"].str.extract(r"((19|20)\d{2})", expand=True)

df["date"] = df["auction_name"].str.extract("((19|20)\d{2})", expand=True)[0]

df["size"] = df["Mõõdud"].str.replace("[^\.\d,xX\/]", "") # replace anything except . or number or x or X or /
df["height"] = df["size"].str.split("[xX\/]", 1, expand=True)[0]
df["width"] = df["size"].str.split("[xX\/]", 2, expand=True)[1]
df["depth"] = df["size"].str.split("[xX\/]", 2, expand=True)[2]
for size_attr in ["height", "width", "depth"]:
    df[size_attr] = df[size_attr].str.replace(",", ".")


df.head()


Index(['Alghind', 'Autor', 'Hind ', 'Kategooria', 'Lõpphind', 'Mõõdud',
       'Tehnika', 'Teos', 'desc', 'img', 'url'],
      dtype='object')


Unnamed: 0,Alghind,Autor,Hind,Kategooria,Lõpphind,Mõõdud,Tehnika,Teos,desc,img,...,author_year_end,author,year,title,year_start,date,size,height,width,depth
0,1500.00 EUR,"01. Allsalu, Efraim (1929–2006)",,2021 kevadoksjon,3300.00 EUR,"49 x 36,5","õli, masoniit",Tants (1985),Kallak lüürilis-sümbolistlikku improvisatsioon...,/static/files/003/t2_allsalu_22tants22.jpg,...,2006.0,"Allsalu, Efraim",1985,Tants,1985,2021,"49x36,5",49.0,36.5,
1,750.00 EUR,"02. Arrak, Henno (1930–2017)",,2021 kevadoksjon,1000.00 EUR,"plm 33,5 x 39",ofort,Aiapidu II 7/25 (1971),Signatuur all paremal.,/static/files/024/t2_hennoarrak.jpg,...,2017.0,"Arrak, Henno",1971,Aiapidu,1971,2021,"33,5x39",33.5,39.0,
2,450.00 EUR,"03. Arrak, Jüri (s 1936)",,2021 kevadoksjon,1000.00 EUR,"km 33,5 x 63,5",linoollõige,Poisid õunaga 16/25 (1967),Teos kuulub Eesti Kunsti Muuseumi kogusse. Sig...,/static/files/064/t2_arrak_22poisid_unaga22.jpg,...,,"Arrak, Jüri",1967,Poisid,1967,2021,"33,5x63,5",33.5,63.5,
3,1000.00 EUR,"04. Bach, Aino (1901–1980)",,2021 kevadoksjon,1000.00 EUR,"plm 17,5 x 12,5",kuivnõel,Väike Mari (1957),Portree modell oli – nagu ka tuntud kuivnõelag...,/static/files/085/t2_bach.jpg,...,1980.0,"Bach, Aino",1957,Väike,1957,2021,"17,5x12,5",17.5,12.5,
4,2900.00 EUR,"05. Burman, Paul (1888–1934)",,2021 kevadoksjon,4800.00 EUR,"48,5 x 48,5","õli, vineer",Talimotiiv (1920–1923),Paul Burmani on peetud Eesti kunsti üheks esim...,/static/files/009/t2_burman.jpg,...,1934.0,"Burman, Paul",1920,Talimotiiv,1920,2021,"48,5x48,5",48.5,48.5,


## Cleaning and extracting techniques

In [22]:
# extract individual techniques 
tech_prepared = df["tech"].str.lower().str.replace(".", "").str.split(",", expand=True)
for col in tech_prepared:
    tech_prepared[col] = tech_prepared[col].str.strip()
print(tech_prepared.head())
# prepare processing of multiple art piece techniques (one art piece can have multiple tech)
tech_df_list = []
for i in range(len(tech_prepared.columns)):
    tech_df_i = tech_prepared[i].str.get_dummies(sep=" ")
    tech_df_list.append(tech_df_i)

# process techniques (valid/invalid)
tech_uniq_cols = set()
columns_to_remove = ["x", "(", ")", "ï¿½li", "guaï¿½ï¿½", "akrüüllateks", "lï¿½uend"]
for tdf in tech_df_list:
    print(tdf.shape)
    for col in tdf.columns:
        temp_uniq_size = len(tech_uniq_cols)
        if col.strip().isdigit() or len(col) < 3 or any(rem in col for rem in columns_to_remove):
            tdf.drop(col, inplace=True, axis=1)
        else:
            tech_uniq_cols.add(col)
            if len(tech_uniq_cols) == temp_uniq_size:
                tdf.drop(col, inplace=True, axis=1)
                
# combine tech columns                
tech_df = pd.DataFrame(tech_df_list[0])
for tdf in range(1, len(tech_df_list)):
    print(tech_df_list[tdf].shape)
    tech_df = pd.concat([tech_df, tech_df_list[tdf]], axis=1, sort=True)

# some manual mapping
mappings = {"guašš":["guašš", "guaśś"], "kollaaž":["kollaaž", "kollaaź"], "tušš":["tušš", "tušs", "tuśś"]}
for k, v in mappings.items():
    tech_df[k] = tech_df[v].max()
    for i in range(len(v)):
        if v[i] == k:
            continue
        tech_df.drop(v[i], axis=1, inplace=True)

tech_df = tech_df.loc[:,~tech_df.columns.duplicated()]

for col in tech_df.columns:
    print(col)
print(tech_df.shape)

             0         1     2     3
0          õli  masoniit  None  None
1        ofort      None  None  None
2  linoollõige      None  None  None
3     kuivnõel      None  None  None
4          õli    vineer  None  None
(2585, 116)
(2585, 71)
(2585, 20)
(2585, 2)
(2585, 32)
(2585, 4)
(2585, 0)
akrüül
akrüülil
akvarell
akvatinta
akvatinta-kõrgtrükk
akvatinta-pehmelakk
autolito
autolitograafia
autori
autoritehnika
digiprint
digitaaltrükk
digitrükk
embossing
etsing
facemount
grafiidipliiats
grafiit
guašš
harilik
itaalia
joonistus
joonsöövitus
kahepoolne
keraamika
klaas
kolaaž
kollaaž
koloreeritud
kriit
kuivnõel
käsitsi
kõrgtrükk
külmnõel
linool
linoolgravüür
linoollõige
linoolsügavtrükk
lito
litograafia
maalitud
metsotinto
mezzotinto
monotüüpia
mou
ofort
ofset-lito
ofset-litograafia
ofsetlito
ofsett
ofsettrükk
originaal
paberil
papil
pastakas
pastapliiats
pastell
pastellmaal
pehmelakk
pirnipuu
plastikaatlõige
pliiats
pliiatsijoonistus
press-kriit
pronks
proovitrükk
pstellmaal
puit
puitr

## Simple test for check if data is clean

In [23]:
def test_data_clean(initial_df):
    test_df = pd.DataFrame(initial_df)
    print("###", "author", "###")
    for name in test_df["author"]:
        if pd.isnull(name) or "," not in name:
            pass # not that important
    # Number fields to numeric
    for col in ["start_price", "end_price", "height", "width", "year_start", "date"]:
        test_df[col] = pd.to_numeric(test_df[col], downcast="integer")
        error_rows = test_df[test_df[col].isnull()]
        if col == "start_price":
            error_rows = error_rows.loc[(error_rows["Hind"].notnull() | error_rows["Alghind"].notnull())]
        if col == "end_price":
            error_rows = error_rows.loc[(error_rows["Lõpphind"].notnull())]
        if col == "height":
            error_rows = error_rows.loc[error_rows["Lõpphind"].str.count("[xX\/]") == 1]
        if col == "width":
            error_rows = error_rows.loc[error_rows["Lõpphind"].str.count("[xX\/]") == 1]
        if col == "year_start":
            error_rows = error_rows.loc[(error_rows["Teos"].str.count("((19|20)\d{2})") > 0)]
        if col == "date":
            error_rows = error_rows.loc[(error_rows["auction_name"].str.count("((19|20)\d{2})") > 0)]
        # Print rows with problems
        print("###", col, "###")
        for index, val in error_rows.iterrows():
            print(val)
            print()

    return test_df
tested_df = test_data_clean(df)
tested_df.head(11)

### author ###
### start_price ###
### end_price ###
### height ###
### width ###
### year_start ###
### date ###


Unnamed: 0,Alghind,Autor,Hind,Kategooria,Lõpphind,Mõõdud,Tehnika,Teos,desc,img,...,author_year_end,author,year,title,year_start,date,size,height,width,depth
0,1500.00 EUR,"01. Allsalu, Efraim (1929–2006)",,2021 kevadoksjon,3300.00 EUR,"49 x 36,5","õli, masoniit",Tants (1985),Kallak lüürilis-sümbolistlikku improvisatsioon...,/static/files/003/t2_allsalu_22tants22.jpg,...,2006.0,"Allsalu, Efraim",1985,Tants,1985.0,2021.0,"49x36,5",49.0,36.5,
1,750.00 EUR,"02. Arrak, Henno (1930–2017)",,2021 kevadoksjon,1000.00 EUR,"plm 33,5 x 39",ofort,Aiapidu II 7/25 (1971),Signatuur all paremal.,/static/files/024/t2_hennoarrak.jpg,...,2017.0,"Arrak, Henno",1971,Aiapidu,1971.0,2021.0,"33,5x39",33.5,39.0,
2,450.00 EUR,"03. Arrak, Jüri (s 1936)",,2021 kevadoksjon,1000.00 EUR,"km 33,5 x 63,5",linoollõige,Poisid õunaga 16/25 (1967),Teos kuulub Eesti Kunsti Muuseumi kogusse. Sig...,/static/files/064/t2_arrak_22poisid_unaga22.jpg,...,,"Arrak, Jüri",1967,Poisid,1967.0,2021.0,"33,5x63,5",33.5,63.5,
3,1000.00 EUR,"04. Bach, Aino (1901–1980)",,2021 kevadoksjon,1000.00 EUR,"plm 17,5 x 12,5",kuivnõel,Väike Mari (1957),Portree modell oli – nagu ka tuntud kuivnõelag...,/static/files/085/t2_bach.jpg,...,1980.0,"Bach, Aino",1957,Väike,1957.0,2021.0,"17,5x12,5",17.5,12.5,
4,2900.00 EUR,"05. Burman, Paul (1888–1934)",,2021 kevadoksjon,4800.00 EUR,"48,5 x 48,5","õli, vineer",Talimotiiv (1920–1923),Paul Burmani on peetud Eesti kunsti üheks esim...,/static/files/009/t2_burman.jpg,...,1934.0,"Burman, Paul",1920,Talimotiiv,1920.0,2021.0,"48,5x48,5",48.5,48.5,
5,2300.00 EUR,"06. Grünberg, Jaan (1889–1969)",,2021 kevadoksjon,3300.00 EUR,"38 x 45,5","õli, paber, dubleeritud papile.",Rukkihakid (1933),Jaan Grünberg võttis aastatel 1926–1933 ja 193...,/static/files/011/t2_grnberg.jpg,...,1969.0,"Grünberg, Jaan",1933,Rukkihakid,1933.0,2021.0,"38x45,5",38.0,45.5,
6,3600.00 EUR,"07. Haamer, Eerik (1908–1994)",,2021 kevadoksjon,5400.00 EUR,27 x 38,pliiatsijoonistus,Ruhnu tants (1943.–1944.),Eerik Haamri Ruhnu-teemalised teosed kuuluvad ...,/static/files/033/t2_haamer_uus.jpg,...,1994.0,"Haamer, Eerik",1943,Ruhnu,1943.0,2021.0,27x38,27.0,38.0,
7,2200.00 EUR,"08. Hallek, Enno (s 1931)",,2021 kevadoksjon,,"89 x 82,5","õli, lõuend",Vaade merele (1963),Signatuur all keskel. Enno Halleki varane loom...,/static/files/088/t2_hallek.jpg,...,,"Hallek, Enno",1963,Vaade,1963.0,2021.0,"89x82,5",89.0,82.5,
8,3400.00 EUR,"09. Hoidre, Alo (1916–1993)",,2021 kevadoksjon,7600.00 EUR,100 x 80,"õli, lõuend",Naised maskidega (1992),Signatuur all paremal.,/static/files/081/t2_hoidre_22naised_maskidega...,...,1993.0,"Hoidre, Alo",1992,Naised,1992.0,2021.0,100x80,100.0,80.0,
9,5600.00 EUR,"10. Johani, Andrus (1906–1941)",,2021 kevadoksjon,10400.00 EUR,"41 x 53,5","segatehnika, dubleeritud papile",Saaremaa motiiv (1938),Kui paljud pallaslased olid pärit kesistest ol...,/static/files/098/t2_johani_copy.jpg,...,1941.0,"Johani, Andrus",1938,Saaremaa,1938.0,2021.0,"41x53,5",41.0,53.5,


In [24]:
tested_df[tested_df.index.duplicated()]

Unnamed: 0,Alghind,Autor,Hind,Kategooria,Lõpphind,Mõõdud,Tehnika,Teos,desc,img,...,author_year_end,author,year,title,year_start,date,size,height,width,depth


## Construct final DataFrame

In [25]:
clean_df = pd.DataFrame()
clean_df["url"] = tested_df["url"]
clean_df["src"] = ["vaal"] * len(clean_df)
tested_df["year_end"] = tested_df["year_start"]
for col in ["auction_name", "date", "title", "author", "start_price", "end_price", "year", "year_start", "year_end", "tech", "size", "height", "width", "img"]: 
    clean_df[col] = tested_df[col]
print(clean_df.shape)
for col in tech_df.columns:
    clean_df[col] = tech_df[col].fillna(0)

clean_df.head()

2585
Index(['akrüül', 'akrüülil', 'akvarell', 'akvatinta', 'akvatinta-kõrgtrükk',
       'akvatinta-pehmelakk', 'autolito', 'autolitograafia', 'autori',
       'autoritehnika',
       ...
       'smirgelpaber', 'tee', 'vakstu', 'vineer', 'vineeril', 'ölõuend',
       'teega', 'toonitud', 'vein', 'vineerile'],
      dtype='object', length=142)
2585
(2585, 16)


Unnamed: 0,url,src,auction_name,date,title,author,start_price,end_price,year,year_start,...,smirgelpaber,tee,vakstu,vineer,vineeril,ölõuend,teega,toonitud,vein,vineerile
0,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...,vaal,2021 kevadoksjon,2021.0,Tants,"Allsalu, Efraim",1500.0,3300.0,1985,1985.0,...,0,0,0,0,0,0,0,0,0,0
1,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...,vaal,2021 kevadoksjon,2021.0,Aiapidu,"Arrak, Henno",750.0,1000.0,1971,1971.0,...,0,0,0,0,0,0,0,0,0,0
2,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...,vaal,2021 kevadoksjon,2021.0,Poisid,"Arrak, Jüri",450.0,1000.0,1967,1967.0,...,0,0,0,0,0,0,0,0,0,0
3,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...,vaal,2021 kevadoksjon,2021.0,Väike,"Bach, Aino",1000.0,1000.0,1957,1957.0,...,0,0,0,0,0,0,0,0,0,0
4,/est/avaleht/oksjon/toimunud_oksjonid/2021keva...,vaal,2021 kevadoksjon,2021.0,Talimotiiv,"Burman, Paul",2900.0,4800.0,1920,1920.0,...,0,0,0,1,0,0,0,0,0,0


In [26]:
#clean_df.to_csv("example.csv")
#TODO: fix year_end
#TODO: fix date to day.month.year
#raise Error("")

NameError: name 'Error' is not defined

## Create new db/table (optional)

In [None]:
!pip install mysql-connector-python
import mysql.connector as mysql
import getpass

db = mysql.connect(
    host = "localhost",
    user = "root",
    passwd = getpass.getpass()
)
print(db)
cursor = db.cursor()
try:
    cursor.execute("CREATE DATABASE art")
    cursor.execute("CREATE table test_1")
    cursor.execute("SHOW DATABASES")
    databases = cursor.fetchall() ## returns list of all databases
    print(databases)
except mysql.Error as e:
    print(e)

## Connect and get existing database DataFrame, merge DataFrames

In [27]:
import sqlalchemy
import mysql.connector as mysql
#from pyodbc import ProgrammingError
import getpass

db_username = 'admin'
db_password = getpass.getpass()
db_ip       = 'kanvas-auctions.cxljcprf9rvb.us-east-1.rds.amazonaws.com'
db_name     = 'kanvas'

db_connection = sqlalchemy.create_engine('mysql+mysqlconnector://{0}:{1}@{2}/{3}'.
                                               format(db_username, db_password, 
                                                      db_ip, db_name))
print(db_connection)
db_data = pd.read_sql('SELECT * FROM test_4', db_connection)
merged_df = pd.concat([db_data,clean_df], sort=False)
print(merged_df.columns)
print(clean_df.shape, db_data.shape, merged_df.shape)
merged_df

# try:
#     clean_df.to_sql(con=db_connection, name='test_3', if_exists='append')
# except mysql.Error:
#     db_data = pd.read_sql('SELECT * FROM test_3', db_connection)
#     merged_df = pd.concat([db_data,clean_df])
#     merged_df.to_sql(con=db_connection, name="test_3", if_exists = 'replace')

········
Engine(mysql+mysqlconnector://admin:***@kanvas-auctions.cxljcprf9rvb.us-east-1.rds.amazonaws.com/kanvas)
Index(['url', 'src', 'auction_name', 'date', 'title', 'author', 'start_price',
       'end_price', 'year', 'year_start',
       ...
       'punane', 'saepuruplaat', 'smirgelpaber', 'tee', 'vakstu', 'ölõuend',
       'teega', 'toonitud', 'vein', 'vineerile'],
      dtype='object', length=198)


Unnamed: 0,url,src,auction_name,date,title,author,start_price,end_price,year,year_start,...,punane,saepuruplaat,smirgelpaber,tee,vakstu,ölõuend,teega,toonitud,vein,vineerile
0,?c=teosed&l=et&id=2512&window=1&oid=3&form=0,haus,20.11.1997 14:01-20.11.1997 00:00,1997.0,NAINE PAABULINNUGA,Evald Okas,831.00,844.00,1939,1939.0,...,,,,,,,,,,
1,?c=teosed&l=et&id=2433&window=1&oid=3&form=0,haus,20.11.1997 14:01-20.11.1997 00:00,1997.0,TALLINNA RAEKOJA PLATS,Karl Burman (seenior),499.00,499.00,1920,1920.0,...,,,,,,,,,,
2,?c=teosed&l=et&id=2489&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,NATÜÜRMORT SIDRUNITEGA,Valerian Loik,1074.00,1074.00,1970,1970.0,...,,,,,,,,,,
3,?c=teosed&l=et&id=2509&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,MAASTIK TALUMAJAGA,Roman Nyman,1176.00,1176.00,1940,1940.0,...,,,,,,,,,,
4,?c=teosed&l=et&id=2568&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,Puulõike sünd,Eduard Wiiralt,230.00,556.00,1936,1936.0,...,,,,,,,,,,
5,?c=teosed&l=et&id=2428&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,ILLUSTRATSIOONID M. RAUA “VALITUD LUULETUSTELE,Aino Bach,920.00,920.00,1946,1946.0,...,,,,,,,,,,
6,?c=teosed&l=et&id=2429&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,LAPSED,Aino Bach,831.00,831.00,1950,1950.0,...,,,,,,,,,,
7,?c=teosed&l=et&id=2477&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,SUVI,Eduard Kutsar,1150.00,1150.00,1950,1950.0,...,,,,,,,,,,
8,?c=teosed&l=et&id=2530&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,LAMAV AKT,Richard Sagrits,575.00,671.00,1958,1958.0,...,,,,,,,,,,
9,?c=teosed&l=et&id=2523&window=1&oid=5&form=0,haus,26.10.1998 14:16,1998.0,LILLED AKNAL,Oskar Raunam,1470.00,1643.00,1941,1941.0,...,,,,,,,,,,


## Continue merging DataFrames, change conflicting word forms

In [29]:
last_non_tech = list(merged_df.columns).index("img")
print("### starting after", merged_df.columns[last_non_tech], "###")

# map tech columns that cause duplicate columns (db converts š->s, ž->z and so on)
mappings = {"guašš":["guašš", "guaśś", "guašs"], "kollaaž":["kollaaž", "kollaaź"], "tušš":["tušš", "tušs", "tuśś", "tuss"]}
for k, val in mappings.items():
    print(k, val)
    remaining_val = []
    for v in val:
        if v in merged_df.columns:
            remaining_val.append(v)
    if len(remaining_val) == 0:
        continue
        
    merged_df[k] = merged_df[remaining_val].max()
    for v in remaining_val:
        print(v)
        if v == k:
            continue
        merged_df.drop(v, axis=1, inplace=True)
print(list(merged_df.columns[:]))
for col in merged_df.columns[last_non_tech + 1:]:
    merged_df[col] = merged_df[col].fillna(0)
print(clean_df.shape, db_data.shape, merged_df.shape)



### starting after img ###
guašš ['guašš', 'guaśś', 'guašs']
guašš
kollaaž ['kollaaž', 'kollaaź']
kollaaž
tušš ['tušš', 'tušs', 'tuśś', 'tuss']
tušš
['url', 'src', 'auction_name', 'date', 'title', 'author', 'start_price', 'end_price', 'year', 'year_start', 'year_end', 'tech', 'size', 'height', 'width', 'img', 'akrüül', 'akvarell', 'akvatinta', 'autolito', 'autoritehnika', 'awagami', 'diatüüpia', 'digiprint', 'digitaalne', 'digitrükk', 'foto', 'giclee', 'graafika', 'grafiit', 'guašš', 'hanga', 'itaalia', 'joonistus', 'kartongtrükk', 'kastitaolises', 'keraamika', 'kips', 'kipsvaland', 'kivilito', 'kleebitud', 'kollaaž', 'koloreeritud', 'kriidiga', 'kriit', 'kuivnõel', 'käärilõige', 'kõrgtrükk', 'lametrükk', 'linool', 'linoolgravüür', 'linooll', 'linoollõige', 'linoolsügavtrükk', 'lito', 'litograafia', 'lõuend', 'lõuendil', 'made', 'marker', 'metsotinto', 'moku', 'monotüüpia', 'must', 'ofort', 'ofset-lito', 'oksüdograafia', 'paber', 'papile', 'papp', 'pastapliiats', 'all', 'betoon', 'cath

## Commit changes by overwriting table

In [None]:
merged_df.to_sql(con=db_connection, name="test_4", if_exists = 'replace', index=False)