### Working with `selenium`: continued

Today we will continue to work on the task uploading the addresses of all precinct election commissions of the Ivanovo region. First, we'll download all the necessary libraries for the work:

* `selenium` ‒ to automate your work in the browser
* `time` ‒ to add a delay
* `pandas` ‒ to save results to a dataframe

In [1]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

In [2]:
driver = webdriver.Chrome()

In [3]:
from time import sleep
import pandas as pd
from bs4 import BeautifulSoup

In [4]:
driver.get("http://cikrf.ru/digital-services/naydi-svoy-izbiratelnyy-uchastok/")

fld = driver.find_element('xpath', "/html/body/div[2]/div/div/button")
fld.click()

Now let's write the function `get_uik_address()`, which takes two arguments as input, plot number and region, and returns a string with the address. To do this, copy the code from the previous session to the function body:

In [5]:
import random

In [6]:
for i in range(10):
    print(random.randint(1, 10))

2
1
9
1
3
4
9
10
4
7


In [7]:
for i in range(10):
    print(random.uniform(1., 2.))

1.627106188114631
1.5470654362985927
1.8677820626942983
1.4208598043920952
1.2185361095484009
1.8794949926762918
1.3027023674696365
1.8337054911504296
1.4441133486213305
1.2433261228485681


In [8]:
def get_uik_address(n_uik, reg):
    
    driver.get("http://cikrf.ru/digital-services/naydi-svoy-izbiratelnyy-uchastok/")

#     fld = driver.find_element_by_xpath("/html/body/div[2]/div/div/button")
#     fld.click()

#     sleep(1.5)

    fld = driver.find_element('xpath', "/html/body/div[1]/div/div[2]/div/div[4]/form/div[1]/div[2]")
    fld.click()

    sleep(random.uniform(1., 2.))

    fld = driver.find_element('xpath', '/html/body/div[1]/div/div[2]/div/div[4]/form/div[3]/div[1]/div/span/span[1]/span/span[2]')
    fld.click()

    sleep(random.uniform(1., 2.))

    reg_field = driver.find_element('xpath', '/html/body/span/span/span[1]/input')
    reg_field.send_keys(reg)

    sleep(random.uniform(1., 2.))

    reg_field.send_keys(Keys.RETURN)

    sleep(random.uniform(1., 2.))

    uik_field = driver.find_element('xpath', '/html/body/div[1]/div/div[2]/div/div[4]/form/div[3]/div[2]/div/input')
    uik_field.click()
    uik_field.clear()
    uik_field.send_keys(n_uik)

    sleep(random.uniform(1., 2.))

    uik_field.send_keys(Keys.RETURN)
    
    sleep(random.uniform(1., 2.))
    
    my_page = BeautifulSoup(driver.page_source)
    p = filter(lambda x: x not in ('',None),[i.text for i in my_page.find_all('span',{'class':'address'})])
    p = next(p)
    
    if p is None or p=='':
        p = 'Адреса не нашлось'
        
    return p

Now let's try to take a few numbers of sections and see what happens in the loop. But let's play it safe by writing an expression with an exception, so that if the page doesn't contain an address or loads incorrectly, our code doesn't break and the loop doesn't break. If everything is good (there is an address), Python will save it (the" branch " with `try`), if everything is bad (there is no address in any form), Python will write an empty string instead (the branch with `except`) and move on. 

In [9]:
uiks = range(240, 245)

In [10]:
get_uik_address(244, "Ивановская область")

'155800, Ивановская область, город Кинешма, улица Григория Королева, дом 10, здание "Кинешемский политехнический колледж"'

In [11]:
addresses = []

for u in uiks:
    try:
        address = get_uik_address(u, "Ивановская область")
        print(address)
    except:
        address = ""
    addresses.append(address)
    print(u, address)

240 
155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Желябова, дом 6, здание МБОУ ООШ №6
241 155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Желябова, дом 6, здание МБОУ ООШ №6
155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"
242 155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"
155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"
243 155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"
155800, Ивановская область, город Кинешма, улица Григория Королева, дом 10, здание "Кинешемский политехнический колледж"
244 155800, Ивановская область, город Кинешма, улица Григория Королева, дом 10, здание "Кинешемский политехнический колледж"


It works! Let's create a list with all the numbers of polling stations in the Ivanovo region:

In [12]:
addresses

['',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Желябова, дом 6, здание МБОУ ООШ №6',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"',
 '155800, Ивановская область, город Кинешма, улица Григория Королева, дом 10, здание "Кинешемский политехнический колледж"']

**Important:** periodically open a browser window where Python searches for polling stations! This is not only pleasant (to see how everything is filled in in the search fields without our participation), but also useful: so you can notice if something went wrong. 

Let's create a dataframe from a dictionary whose keys are the names of table columns, and whose values are lists of elements in these columns.

In [13]:
df = pd.DataFrame({'uik': uiks, 'address': addresses})
#keys – names of future columns
#values - a list of values inside the future table

In [14]:
df.head()

Unnamed: 0,uik,address
0,240,
1,241,"155330, Ивановская область, городской округ Ви..."
2,242,"155330, Ивановская область, городской округ Ви..."
3,243,"155330, Ивановская область, городской округ Ви..."
4,244,"155800, Ивановская область, город Кинешма, ули..."


In [15]:
list(df.uik)

[240, 241, 242, 243, 244]

In [16]:
list(df.address)

['',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Желябова, дом 6, здание МБОУ ООШ №6',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"',
 '155330, Ивановская область, городской округ Вичуга, город Вичуга, улица Ленинская, дом 26, здание МБУК "Клуб имени Шагова"',
 '155800, Ивановская область, город Кинешма, улица Григория Королева, дом 10, здание "Кинешемский политехнический колледж"']

Save the table to a csv file:

In [17]:
df.to_csv('Ivanovo.csv', index=False, encoding='Windows-1251')

In [18]:
df.to_excel('Ivanovo.xlsx', index=False)

  df.to_excel('Ivanovo.xlsx', index=False)


In [19]:
driver.close()