In [8]:
import requests
from urllib.request import urlopen
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://www.hse.ru/ba/economics/students/'

class Parser:
    def __init__(self, url):
        self.url = url
        self.soup = self.get_soup(self.url)
        self.headings = self.get_headings(self.soup)
        self.links = self.get_links(self.soup)
        self.date = self.get_date(self.soup)
        self.dataframe = self.get_dataframe(self.headings, self.links, self.date)
        self.new = self.get_n_newest

    def get_soup(self, url):
        html_doc = urlopen(url).read()
        soup = BeautifulSoup(html_doc, features="html.parser")
        return soup

    def get_links(self, soup):
        '''
        :param soup:
        :return list of links:
        '''
        links = []
        divs = soup.find_all('div', 'blackboard-item__cont')
        for html in divs:
            links.append(html.find('a').get('href'))
        return links

    def get_headings(self, soup):
        '''
        :param soup:
        :return list of headings:
        '''
        headings = []
        divs = soup.find_all('div', 'blackboard-item__cont')
        for html in divs:
            headings.append(html.find('a').text)
        return headings

    def get_date(self, soup):
        '''
        :param soup:
        :return list of dates:
        '''
        date = []
        divs = soup.find_all('div', 'blackboard-item__date')
        for html in divs:
            date.append(html.text)
        return date

    def get_dataframe(self, headings, links, date):
        '''
        :param headings:
        :param links:
        :param date:
        :return pandas dataframe:
        '''
        dataframe = pd.DataFrame([headings, links]).T
        dataframe[2] = date
        dataframe = dataframe.rename(columns={0: 'Headings', 1: 'Links', 2: 'Date'})
        dataframe = dataframe[['Date', 'Headings', 'Links']]
        return dataframe

    def get_n_newest(self, n=5):
        '''
        :param n:
        :return n rows of dataframe:
        '''
        dataframe = self.dataframe
        return dataframe.iloc[:n, :]



parser = Parser(url)
headings = parser.headings
links = parser.links
date = parser.date

print(parser.dataframe)



     Date                                           Headings  \
0   26/06  Распределение студентов по НИС на 2019-2020 уч...   
1   24/06   Распределение по группам на экзамен 25.06.2019г.   
2   24/04  График защит ВКР - списки студентов и состав к...   
3   18/04                                     Рецензенты ВКР   
4   17/04                       Конкурс "Бюджет для граждан"   
5   02/04                 Обучение по ИУПу с повтором_важно!   
6   06/11                    Факультатив «Консультант Плюс»!   
7   15/10  Выбор тем курсовых и выпускных квалификационны...   
8   27/09                             СОП по итогам 1 модуля   
9   20/09                  Вниманию студентов БЭК161 и ЭК162   
10  20/09       пересдача устной части независимого экзамена   
11  18/09                Пересдача курсовых работ и проектов   
12  13/09  Пересдача независимого экзамена по английскому...   
13  10/09  Внутренний экзамен по английскому языку (перес...   
14  07/09                 Занятия по мат