# Seminar 5
## Sample Solutions

If you download file `vacancies.json` on your computer, place it in the same folder with your `*.py` or `*.ipynb` file. Otherwise, you can directly use the full path to your file as follows:
* Windows (escape each backslash twice): `"C:\\Users\\test\\Desktop\\vacancies.json"`
* Mac OS: `"/Users/test/Desktop/vacancies.json"`

If you obtain error `'charmap'` - this is the sign, that your default OS encoding cannot recognize Cyrillic letters, so use an option `encoding = 'UTF-8'`, that can capture Cyrillic script. [More about UTF-8](https://en.wikipedia.org/wiki/UTF-8).

**Example**:
```python
with open("C:\\Users\\test\\Desktop\\vacancies.json", "r", encoding = 'UTF-8') as read_file:
    data = json.load(read_file)
```

In [1]:
# Using Requests library to download source page text from Webpage
import json
import requests

url = 'https://api.hh.ru/vacancies?per_page=100&locale=EN'

file = requests.get(url)
data = json.loads(file.text)

In [2]:
# Store vacancies' sample
vacancies = data['items']

In [3]:
# 100 vacancies in the sample
len(vacancies)

100

In [4]:
# The first vacancy
vacancies[0]

{'id': '4095490',
 'premium': True,
 'name': 'Водитель-международник',
 'department': None,
 'has_test': False,
 'response_letter_required': False,
 'area': {'id': '1002',
  'name': 'Minsk',
  'url': 'https://api.hh.ru/areas/1002?locale=EN'},
 'salary': {'from': 2500, 'to': None, 'currency': 'BYR', 'gross': False},
 'type': {'id': 'open', 'name': 'Open'},
 'address': {'city': 'Минск',
  'street': 'Автозаводская линия',
  'building': 'метро Могилевская',
  'description': None,
  'lat': 53.861798,
  'lng': 27.673986,
  'raw': 'Минск, Автозаводская линия, метро Могилевская',
  'metro': {'station_name': 'Mogilevskaya',
   'line_name': 'Avtozavodskaya',
   'station_id': '63.429',
   'line_id': '63',
   'lat': 53.861862,
   'lng': 27.674381},
  'metro_stations': [{'station_name': 'Mogilevskaya',
    'line_name': 'Avtozavodskaya',
    'station_id': '63.429',
    'line_id': '63',
    'lat': 53.861862,
    'lng': 27.674381}],
  'id': '408525'},
 'response_url': None,
 'sort_point_distance': Non

In [5]:
# Skip empty 'salary' fields (automatically recognized with None)
# Display 3 entries
[i['salary'] for i in vacancies if i['salary'] is not None][:3]

[{'from': 2500, 'to': None, 'currency': 'BYR', 'gross': False},
 {'from': 45000, 'to': 150000, 'currency': 'RUR', 'gross': True},
 {'from': 80000, 'to': None, 'currency': 'RUR', 'gross': True}]

In [6]:
# Now we obtain less number of observations (as we do not consider empty 'salary' fields)
len([i['salary'] for i in vacancies if i['salary'] is not None])

76

In [7]:
# Store both name of the city and salary in tuple
# Display 3 entries
[(i['area']['name'], i['salary']) for i in vacancies if i['salary'] is not None][:3]

[('Minsk', {'from': 2500, 'to': None, 'currency': 'BYR', 'gross': False}),
 ('Saint Petersburg',
  {'from': 45000, 'to': 150000, 'currency': 'RUR', 'gross': True}),
 ('Tula', {'from': 80000, 'to': None, 'currency': 'RUR', 'gross': True})]

In [8]:
# Filter by currency (that is stored inside 'salary' field)
# Do not forget again to skip None
# Display 3 entries
[(i['area']['name'], i['salary']) for i in vacancies if i['salary'] is not None and i['salary']['currency'] == 'RUR'][:3]

[('Saint Petersburg',
  {'from': 45000, 'to': 150000, 'currency': 'RUR', 'gross': True}),
 ('Tula', {'from': 80000, 'to': None, 'currency': 'RUR', 'gross': True}),
 ('Krasnodar',
  {'from': 70000, 'to': 250000, 'currency': 'RUR', 'gross': False})]

In [9]:
# Thus, number of observations again less
len([(i['area']['name'], i['salary']) for i in vacancies if i['salary'] is not None and i['salary']['currency'] == 'RUR'])

74

In [10]:
# Use mymean function, that takes as input the list with numbers and None objects
def mymean(x):
    x = [i for i in x if i is not None]
    return sum(x) / len(x)

In [11]:
# Test several examples
print(mymean([100, 200]))
print(mymean([100, None]))
print(mymean([None, 200]))

150.0
100.0
200.0


In [12]:
# Redefine mymean function with 'gross' parameter (the data has 'gross' field for each vacancy)
# By default the 'gross' option is False
def mymean(x, gross = False):
    x = [i for i in x if i is not None]
    if gross:
        return round((sum(x) / len(x)) * 0.87, 1)
    else:
        return round((sum(x) / len(x)), 1)

In [13]:
# Test again
print(mymean([100, 200]))
print(mymean([100, 200], gross = False))
print(mymean([100, 200], gross = True))
print(mymean([100, None], gross = False))
print(mymean([100, None], gross = True))

150.0
150.0
130.5
100.0
87.0


In [14]:
# Actually, again not all data etries have True or False values inside 'gross' field
# Somewhere it is None
# So, let's assume that the salary is NET if 'gross' is None
# Test again the behavior
mymean([100, 200], gross = None)

150.0

In [15]:
# Then just place this function instead of i['salary']
# Display 3 entries
[(i['area']['name'], mymean([i['salary']['from'], i['salary']['to']], gross = i['salary']['gross'])) for i in vacancies if i['salary'] is not None and i['salary']['currency'] == 'RUR'][:3]

[('Saint Petersburg', 84825.0), ('Tula', 69600.0), ('Krasnodar', 160000.0)]

In [16]:
# Store the result in the variable
salary = [(i['area']['name'], mymean([i['salary']['from'], i['salary']['to']], gross = i['salary']['gross'])) for i in vacancies if i['salary'] is not None and i['salary']['currency'] == 'RUR']

In [17]:
# Extract unique cities from the obtained dataset
cities = set([i[0] for i in salary])
cities

{'Adler',
 'Astrakhan',
 'Barnaul',
 'Chelyabinsk',
 'Cherepovets',
 'Izhevsk',
 'Kazan',
 'Kemerovo',
 'Krasnodar',
 'Lipetsk',
 'Magnitogorsk',
 'Miass',
 'Moscow',
 'Naberezhnye Chelny',
 'Nizhnevartovsk',
 'Nizhny Tagil',
 'Norilsk',
 'Rostov-na-Donu',
 'Saint Petersburg',
 'Sochi',
 'Surgut',
 'Tolyatti',
 'Tula',
 'Ufa',
 'Ulyanovsk',
 'Ussuriysk',
 'Vladimir',
 'Vladivostok',
 'Volgograd',
 'Voronezh',
 'Yekaterinburg'}

In [18]:
# Use two for loops to find out the mean salary
[(i, mymean([j[1] for j in salary if j[0] == i])) for i in cities]

[('Miass', 23490.0),
 ('Tula', 43235.0),
 ('Ufa', 110461.5),
 ('Saint Petersburg', 54172.0),
 ('Norilsk', 27840.0),
 ('Barnaul', 20880.0),
 ('Kazan', 24360.0),
 ('Sochi', 155557.1),
 ('Rostov-na-Donu', 33930.0),
 ('Volgograd', 16240.0),
 ('Kemerovo', 21750.0),
 ('Lipetsk', 44370.0),
 ('Nizhnevartovsk', 34800.0),
 ('Krasnodar', 80867.1),
 ('Astrakhan', 21750.0),
 ('Yekaterinburg', 30450.0),
 ('Cherepovets', 43500.0),
 ('Voronezh', 51100.0),
 ('Chelyabinsk', 23490.0),
 ('Ulyanovsk', 22620.0),
 ('Vladivostok', 46500.0),
 ('Surgut', 30450.0),
 ('Moscow', 43500.0),
 ('Tolyatti', 57500.0),
 ('Nizhny Tagil', 30450.0),
 ('Magnitogorsk', 23490.0),
 ('Izhevsk', 34680.0),
 ('Naberezhnye Chelny', 65250.0),
 ('Adler', 130500.0),
 ('Ussuriysk', 36500.0),
 ('Vladimir', 56550.0)]

In [19]:
# Add min and max calculation for the previous step
# And store result into new variable
city_stats = [(i, mymean([j[1] for j in salary if j[0] == i]), min([j[1] for j in salary if j[0] == i]), max([j[1] for j in salary if j[0] == i])) for i in cities]
city_stats

[('Miass', 23490.0, 23490.0, 23490.0),
 ('Tula', 43235.0, 8700.0, 69600.0),
 ('Ufa', 110461.5, 40000.0, 150000.0),
 ('Saint Petersburg', 54172.0, 29841.0, 84825.0),
 ('Norilsk', 27840.0, 27840.0, 27840.0),
 ('Barnaul', 20880.0, 20880.0, 20880.0),
 ('Kazan', 24360.0, 24360.0, 24360.0),
 ('Sochi', 155557.1, 58725.0, 282750.0),
 ('Rostov-na-Donu', 33930.0, 33930.0, 33930.0),
 ('Volgograd', 16240.0, 13920.0, 20880.0),
 ('Kemerovo', 21750.0, 21750.0, 21750.0),
 ('Lipetsk', 44370.0, 44370.0, 44370.0),
 ('Nizhnevartovsk', 34800.0, 34800.0, 34800.0),
 ('Krasnodar', 80867.1, 22794.0, 160000.0),
 ('Astrakhan', 21750.0, 21750.0, 21750.0),
 ('Yekaterinburg', 30450.0, 30450.0, 30450.0),
 ('Cherepovets', 43500.0, 43500.0, 43500.0),
 ('Voronezh', 51100.0, 50000.0, 52200.0),
 ('Chelyabinsk', 23490.0, 23490.0, 23490.0),
 ('Ulyanovsk', 22620.0, 22620.0, 22620.0),
 ('Vladivostok', 46500.0, 46500.0, 46500.0),
 ('Surgut', 30450.0, 30450.0, 30450.0),
 ('Moscow', 43500.0, 30450.0, 60900.0),
 ('Tolyatti', 575

In [20]:
# Sort by mean salary
# Return first 10 entries
top10 = sorted(city_stats, key = lambda x: x[1], reverse = True)[:10]
top10

[('Sochi', 155557.1, 58725.0, 282750.0),
 ('Adler', 130500.0, 130500.0, 130500.0),
 ('Ufa', 110461.5, 40000.0, 150000.0),
 ('Krasnodar', 80867.1, 22794.0, 160000.0),
 ('Naberezhnye Chelny', 65250.0, 65250.0, 65250.0),
 ('Tolyatti', 57500.0, 57500.0, 57500.0),
 ('Vladimir', 56550.0, 52200.0, 60900.0),
 ('Saint Petersburg', 54172.0, 29841.0, 84825.0),
 ('Voronezh', 51100.0, 50000.0, 52200.0),
 ('Vladivostok', 46500.0, 46500.0, 46500.0)]

Install `cyrtranslit` library (once):
```
!pip install cyrtranslit
```

In [21]:
# Test its behavior
import cyrtranslit
cyrtranslit.to_latin('Привет мир!', 'ru')

'Privet mir!'

In [22]:
# Extract TOP-10 cities
top10cities = [i[0] for i in top10]
top10cities

['Sochi',
 'Adler',
 'Ufa',
 'Krasnodar',
 'Naberezhnye Chelny',
 'Tolyatti',
 'Vladimir',
 'Saint Petersburg',
 'Voronezh',
 'Vladivostok']

In [23]:
# Restore all professions from TOP-10 (by celaned salary) cities
[(i, set([j['name'] for j in vacancies if j['area']['name'] == i])) for i in top10cities]

[('Sochi',
  {'Агент по недвижимости',
   'Агент по продажам недвижимости премиум-класса',
   'Ведущий менеджер по продажам',
   'Ведущий специалист отдела продаж новостроек',
   'Ведущий специалист по продажам недвижимости комфорт-класса',
   'Менеджер отдела продаж новостроек бизнес-класса',
   'Специалист по работе с клиентами (недвижимость)'}),
 ('Adler',
  {'Сециалист по недвижимости', 'Специалист по работе с недвижимостью'}),
 ('Ufa',
  {'Investment advisor (Private Banking)',
   'Агент по недвижимости',
   'Агент по продажам недвижимости',
   'Ведущий инженер-программист (Delphi)',
   'Менеджер по продажам /Агент',
   'Менеджер по продажам жилья',
   'Менеджер по продажам и подбору жилья',
   'Менеджер по продаже',
   'Менеджер по продаже вторичной недвижимости (агент)',
   'Менеджер по продаже недвижимости',
   'Риелтор',
   'Специалист по недвижимости',
   'Специалист по продаже жилой недвижимости (Агент)',
   'Специалист по продаже и поиску жилой недвижимости',
   'Финансовый

In [24]:
# Add transliteration (optional)
[(i, set([cyrtranslit.to_latin(j['name'], 'ru') for j in vacancies if j['area']['name'] == i])) for i in top10cities]

[('Sochi',
  {'Agent po nedvizhimosti',
   'Agent po prodazham nedvizhimosti premium-klassa',
   'Menedzher otdela prodazh novostroek biznes-klassa',
   "Specialist po rabote s klientami (nedvizhimost')",
   'Veduszij menedzher po prodazham',
   'Veduszij specialist otdela prodazh novostroek',
   'Veduszij specialist po prodazham nedvizhimosti komfort-klassa'}),
 ('Adler',
  {'Secialist po nedvizhimosti', "Specialist po rabote s nedvizhimost'ju"}),
 ('Ufa',
  {'Agent po nedvizhimosti',
   'Agent po prodazham nedvizhimosti',
   'Finansovyj sovetnik',
   'Investment advisor (Private Banking)',
   'Menedzher po prodazham /Agent',
   "Menedzher po prodazham i podboru zhil'ja",
   "Menedzher po prodazham zhil'ja",
   'Menedzher po prodazhe',
   'Menedzher po prodazhe nedvizhimosti',
   'Menedzher po prodazhe vtorichnoj nedvizhimosti (agent)',
   'Rieltor',
   'Specialist po nedvizhimosti',
   'Specialist po prodazhe i poisku zhiloj nedvizhimosti',
   'Specialist po prodazhe zhiloj nedvizhim

In [25]:
# Share of vacacies with non empty 'salary' field
len([i for i in vacancies if i['salary'] is not None]) / len(vacancies)

0.76

In [26]:
# Find out types of schedule
set([i['schedule']['id'] for i in vacancies])

{'flexible', 'fullDay', 'remote', 'shift'}

In [27]:
# Calculate the share of Full-day vacancies
len([i for i in vacancies if i['schedule']['id'] == 'fullDay']) / len(vacancies)

0.54

## Skills

In [28]:
# Restore managerial vacancies with key words (using re library)
import re
keywords = ['менеджер', 'manager', 'menedzher']

[i['name'].lower() for i in vacancies if re.search('менеджер|manager|menedzher', i['name'].lower())]

['менеджер по продаже недвижимости',
 'агент по недвижимости / менеджер по продажам (подразделение на ул. красная)',
 'менеджер по грузоперевозкам',
 'менеджер по продаже недвижимости/специалист по недвижимости (подразделение на ул. селезнева)',
 'агент по недвижимости/менеджер по продаже недвижимости',
 'менеджер\xa0по\xa0продажам\xa0недвижимости/риэлтор (подразделение на ул.ставропольская)',
 'менеджер по коммерческой недвижимости (подразделение на ул. красная)',
 'менеджер по продажам импортной кабельно-проводниковой продукции',
 'менеджер по оптовым продажам промышленного электрооборудования',
 'менеджер по продажам сельхозтехники',
 'менеджер по продажам рекламы',
 'менеджер по продаже недвижимости',
 'менеджер по привлечению клиентов (краснооктябрьский район, тракторный район)',
 'менеджер по привлечению клиентов',
 'менеджер отдела продаж новостроек бизнес-класса',
 'региональный менеджер по продажам',
 'подработка_менеджер по работе с клиентами',
 'менеджер телефонных продаж',


In [29]:
# Or the same, using `in`
[i['name'].lower() for i in vacancies if sum([j in i['name'].lower() for j in keywords]) > 0]

['менеджер по продаже недвижимости',
 'агент по недвижимости / менеджер по продажам (подразделение на ул. красная)',
 'менеджер по грузоперевозкам',
 'менеджер по продаже недвижимости/специалист по недвижимости (подразделение на ул. селезнева)',
 'агент по недвижимости/менеджер по продаже недвижимости',
 'менеджер\xa0по\xa0продажам\xa0недвижимости/риэлтор (подразделение на ул.ставропольская)',
 'менеджер по коммерческой недвижимости (подразделение на ул. красная)',
 'менеджер по продажам импортной кабельно-проводниковой продукции',
 'менеджер по оптовым продажам промышленного электрооборудования',
 'менеджер по продажам сельхозтехники',
 'менеджер по продажам рекламы',
 'менеджер по продаже недвижимости',
 'менеджер по привлечению клиентов (краснооктябрьский район, тракторный район)',
 'менеджер по привлечению клиентов',
 'менеджер отдела продаж новостроек бизнес-класса',
 'региональный менеджер по продажам',
 'подработка_менеджер по работе с клиентами',
 'менеджер телефонных продаж',


In [30]:
# Extract requirement from these vacancies
skills = [i['snippet']['requirement'] for i in vacancies if re.search('менеджер|manager|menedzher', i['name'].lower())]
skills

['Позитивное мышление. Нацеленность на результат. Самоорганизованность. Готовность работать по стандартам, принятым в компании. Стрессоустойчивость. Умение работать в команде. ',
 'Нацеленность на высокий финансовый результат, здоровые амбиции. Желание развиваться в области активных продаж. Отличные коммуникативные навыки. Высокая работоспособность.',
 'Мы ценим активность, инициативность и умение работать в режиме многозадачности. В подобной работе важны коммуникативные навыки и уверенность в себе!',
 'Ты энергичен и заряжен на результат. Без опыта, но готов обучаться!',
 'Работа творческая и одновременно аналитическая. Мыслите позитивно. Готовы к работе разъездного характера. Открыты к новым знаниям.',
 'Наши преимущества:',
 'Вы - коммуникабельны, находите общий язык с разными людьми. У Вас есть опыт в продажах, Вы гордитесь достигнутыми результатами. ',
 'Высшее техническое образование (энергетика, автоматизация, электропривод, радиотехника, производство кабельной продукции). Знани

In [31]:
# Process this text
# Remove None
# Lowercase
# Translit
skills_processed = [cyrtranslit.to_latin(i.lower(), 'ru') for i in skills if i is not None]
skills_processed

["pozitivnoe myshlenie. nacelennost' na rezul'tat. samoorganizovannost'. gotovnost' rabotat' po standartam, prinjatym v kompanii. stressoustojchivost'. umenie rabotat' v komande. ",
 "nacelennost' na vysokij finansovyj rezul'tat, zdorovye ambicii. zhelanie razvivat'sja v oblasti aktivnyh prodazh. otlichnye kommunikativnye navyki. vysokaja rabotosposobnost'.",
 "my cenim aktivnost', iniciativnost' i umenie rabotat' v rezhime mnogozadachnosti. v podobnoj rabote vazhny kommunikativnye navyki i uverennost' v sebe!",
 "ty ehnergichen i zarjazhen na rezul'tat. bez opyta, no gotov obuchat'sja!",
 'rabota tvorcheskaja i odnovremenno analiticheskaja. myslite pozitivno. gotovy k rabote raz#ezdnogo haraktera. otkryty k novym znanijam.',
 'nashi preimuszestva:',
 "vy - kommunikabel'ny, nahodite obszij jazyk s raznymi ljud'mi. u vas est' opyt v prodazhah, vy gordites' dostignutymi rezul'tatami. ",
 "vysshee tehnicheskoe obrazovanie (ehnergetika, avtomatizacija, ehlektroprivod, radiotehnika, proizvo

In [32]:
# Join previous result in one line
# Then split by several punctuation characters
pattern = ',|\.|;|!|\(|\)'
phrases = re.split(pattern, ' '.join(skills_processed))
phrases[:10]

['pozitivnoe myshlenie',
 " nacelennost' na rezul'tat",
 " samoorganizovannost'",
 " gotovnost' rabotat' po standartam",
 ' prinjatym v kompanii',
 " stressoustojchivost'",
 " umenie rabotat' v komande",
 "  nacelennost' na vysokij finansovyj rezul'tat",
 ' zdorovye ambicii',
 " zhelanie razvivat'sja v oblasti aktivnyh prodazh"]

In [33]:
# Remove excessive spacing and empty lines
phrases_done = [re.sub('\s{2,}', ' ', i.strip()) for i in phrases]
phrases_done = [i for i in phrases_done if i != '']
phrases_done[:10]

['pozitivnoe myshlenie',
 "nacelennost' na rezul'tat",
 "samoorganizovannost'",
 "gotovnost' rabotat' po standartam",
 'prinjatym v kompanii',
 "stressoustojchivost'",
 "umenie rabotat' v komande",
 "nacelennost' na vysokij finansovyj rezul'tat",
 'zdorovye ambicii',
 "zhelanie razvivat'sja v oblasti aktivnyh prodazh"]

In [34]:
# Find out frequencies (you can use previous approach or the following)
# You can also use the Counter function from collections library
# And sort obtained dictionary
from collections import Counter
sorted(Counter(phrases_done).items(), key = lambda x: x[1], reverse = True)[:10]

[('vysshee tehnicheskoe obrazovanie', 2),
 ('ehnergetika', 2),
 ('avtomatizacija', 2),
 ('ehlektroprivod', 2),
 ('radiotehnika', 2),
 ("gramotnaja rech'", 2),
 ("pravil'naja rech' i chetkaja dikcija", 2),
 ('znanie ms office i google', 2),
 ("zhelanie zarabatyvat' dlja realizacii zhiznennyh celej", 2),
 ('opyt v prodazhah budet', 2)]

# Additional stuff
## For our future classes in 2nd module
We can diplay this data in table structure, using `pandas` library. We can either use initial structure or unflatten (unnest) or dictionary.

In [1]:
import pandas as pd

df = pd.read_json('https://api.hh.ru/vacancies?per_page=100&locale=EN')

In [2]:
df.head()

Unnamed: 0,items,found,pages,per_page,page,clusters,arguments,alternate_url
0,"{'id': '4095490', 'premium': True, 'name': 'Во...",719548,20,100,0,,,https://hh.ru/search/vacancy?enable_snippets=t...
1,"{'id': '4694457', 'premium': True, 'name': 'Сп...",719548,20,100,0,,,https://hh.ru/search/vacancy?enable_snippets=t...
2,"{'id': '6555939', 'premium': False, 'name': 'В...",719548,20,100,0,,,https://hh.ru/search/vacancy?enable_snippets=t...
3,"{'id': '8184005', 'premium': False, 'name': 'М...",719548,20,100,0,,,https://hh.ru/search/vacancy?enable_snippets=t...
4,"{'id': '8557634', 'premium': False, 'name': 'Ф...",719548,20,100,0,,,https://hh.ru/search/vacancy?enable_snippets=t...


In [3]:
vacs = pd.io.json.json_normalize(df['items'])
vacs.head()

Unnamed: 0,id,premium,name,department,has_test,response_letter_required,response_url,sort_point_distance,published_at,created_at,...,schedule.name,contacts.name,contacts.email,contacts.phones,address.metro,salary,address,employer.logo_urls,department.id,department.name
0,4095490,True,Водитель-международник,,False,False,,,2020-10-08T09:37:24+0300,2020-10-08T09:37:24+0300,...,Shift schedule,,,,,,,,,
1,4694457,True,Специалист/стажер (агент) по недвижимости в аг...,,False,False,,,2020-10-06T12:05:58+0300,2020-10-06T12:05:58+0300,...,Flexible schedule,Анурова Юлия Николаевна,personal-advecs@mail.ru,"[{'comment': None, 'city': '812', 'number': '3...",,,,,,
2,6555939,False,Ведущий программист 1С,,False,False,,,2020-10-09T13:28:37+0300,2020-10-09T13:28:37+0300,...,Full day,Бабкина Кристина Анатольевна,165@sfx-tula.ru,"[{'comment': 'доб. 165', 'city': '487', 'numbe...",,,,,,
3,8184005,False,Менеджер по продаже недвижимости,,False,False,,,2020-10-05T11:31:43+0300,2020-10-05T11:31:43+0300,...,Flexible schedule,Пеца Александр Сергеевич,hr@kayan.ru,"[{'comment': None, 'city': '918', 'number': '2...",,,,,,
4,8557634,False,Финансовый консультант,,False,False,,,2020-10-08T14:00:49+0300,2020-10-08T14:00:49+0300,...,Full day,,,,,,,,,


In [5]:
vacs.filter(regex = ('area.name|salary..*'))

Unnamed: 0,area.name,salary.from,salary.to,salary.currency,salary.gross
0,Minsk,2500.0,,BYR,False
1,Saint Petersburg,45000.0,150000.0,RUR,True
2,Tula,80000.0,,RUR,True
3,Krasnodar,70000.0,250000.0,RUR,False
4,Yekaterinburg,,,,
...,...,...,...,...,...
95,Moscow,35000.0,,RUR,True
96,Ufa,,150000.0,RUR,True
97,Ufa,60000.0,150000.0,RUR,False
98,Izhevsk,28000.0,,RUR,True
