## Описаение 
Данный блок производт парсинг обучающего набора данных для проекта [Проект 7. Выбираем авто выгодно](https://lms.skillfactory.ru/courses/course-v1:Skillfactory+DST-12+11MAR2020/courseware/c16441cf4f0a4f8486955f2be47f1cf0/67e09c15d9cd4b8eb691417898f4dfc2/1?activate_block_id=block-v1%3ASkillfactory%2BDST-12%2B11MAR2020%2Btype%40vertical%2Bblock%40f820a06d37d84dd98ab6acaa03392b5e)

Данные сбираются на сайте https://auto.ru/,  
из них формируется *pd.DataFrame* со следуюшими колонками:   
  
**bodytype** -   наименование типа кузова  
**brand** -  наименование марки  
**car_url** -  ссылка на обьявления о продаже  
**color** -  ссылки на обьявления о продаже  
**engineDisplacement** -  обьем двигателя  
**enginePower** -  мощность двигателя  
**equipment_dict** -  словарь с перечислением оснащения автомобиля.  
**fuel_type** -  тип топлива  
**mileage** -  пробег авто  
**modelDate** -  год начала выпуска модели  
**model_name** -  наименование модели  
**numberOfDoors** -  количество дверей  
**productionDate** -  Год производства автомобиля  
**sell_id** -  содержит id обьявления   
**vehicleTransmission** -  содержит id обьявления  
**vendor** -  обобщающий признак: принадлежность марки к европейским либо японским маркам  
**Владельцы** -  количество владельцев авто  
**ПТС** -  Колонка содержит ('Оригинал', 'Дубликат') категорию ПТС  
**Привод** -   категория привода  
**Руль** -   категрию право- или левосторонности управления  
**offerprice** - цена продпажи (целевая переменная)

# Импорт библиотек, установка параметров, определение функций
## Импорт библиотек

In [2]:
import pandas as pd
import json
import numpy as np
# import requests
import time
import re

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from tqdm import tqdm
from bs4 import BeautifulSoup

import warnings
warnings.filterwarnings("ignore")

## Функции

In [15]:
def get_marks_models():
    '''
    возврашщает pd.Series в котором 
    индекс - название марки автомобиоя, 
    значения - списки названий моделей для каждой маркию
    
    '''
    url_for_marks_models = 'https://auto.ru/catalog/cars/all/'
    
#     marks_models = pd.Series() 
    marks_models = dict() 


    driver = webdriver.Chrome(service=service)  # открываем driver
    driver.maximize_window()                    # масксимизируем окно

    for pages_num in range(1,20):
        
        if pages_num==1: url = url_for_marks_models + '?view_type=list'
        else:            url = url_for_marks_models + '?page_num='+ str(pages_num) +'&view_type=list'
        
        driver.get(url)                         # открываем страницу по url
        res = driver.execute_script("return document.body.innerHTML;") # получаем html
        soup = BeautifulSoup(res, 'html.parser') # создаем обьект bs4.BeautifulSoup
        
        # Список html-ек перечня моделей каждой марки на странице:
        marks_on_page_list = soup.find_all('dd', class_='catalog-all-text-list__desc') 
    
        if not marks_on_page_list: 
            break
        
        for mark_html in marks_on_page_list:
            models_of_mark = mark_html.find_all('a', class_='link_theme_auto') # список html-ек моделей марки
        
            link_for_mark_name = models_of_mark[0].get('href')  # линк первой модели, содержит обозначене марки на auto.ru
            mark_start = link_for_mark_name.find('cars/') + 5   # первый символ обозначеня марки
            mark_end = link_for_mark_name.find('/', mark_start) # последний символ обозначения марки
            mark_name = link_for_mark_name[mark_start:mark_end].upper() # получение обозначения марки  
        
            models_list = []
            for model in models_of_mark:
                link_theme_auto = model.get('href')                 # линк модели, содержит обозначение модели на auto.ru
                model_start = mark_end+1                            # первый символ обозначения модели
                model_end = link_theme_auto.find('/', model_start)  # последний символ обозначения модели
                model_name = link_theme_auto[model_start:model_end].upper() # получение обозначения модели
                models_list.append(model_name)
                
            marks_models[mark_name] = models_list
        
        time.sleep(1) 
    # Закрываем процесс браузера:
    driver.quit()
    
    return marks_models

def get_generation_year(model_url,driver):
    '''
    возврашщает pd.DataFrame  в котором: 
        full_name - полное название модели с указанием поколения, 
        bodytype - тип кузова поколения модели
        generation_year - год начала выпуска поколения
        
    model_url - ссылка на страницу со списокм поколений модели
    
    '''
    driver.get(model_url+'?output_type=models_list') # открываем страницу по url
    
    models_list_res = driver.execute_script("return document.body.innerHTML;") # получаем html        
    
    # создаем обьект bs4.BeautifulSoup из html: 
    models_list_bs = BeautifulSoup(models_list_res, 'html.parser') 
    
    # получаем список html-ек описаний для всех поколений модели  
    posting_tag = models_list_bs.find_all('h3',class_ = "ListingItemGroup__title")
    
    # формируем списки с указанием поколения модели, типом кузова поколения и годом начала выпуска поколения
    # (необходимость указания типа кузова вызвана тем, что разные кузова зачастую переходят на следующее 
    #  поколение в разные годы)
    
    
    
    data = [
    [tag.find('a',class_ = 'ListingItemTitle__link').text,             # поколение
     tag.find('div',class_ = "ListingItemGroup__subtitle").text[:      # кузов
                tag.find('div',class_ = "ListingItemGroup__subtitle").text.find(' •')],
     int(tag.find('div',class_ = "ListingItemGroup__subtitle").text    # год
                [tag.find('div',class_ = "ListingItemGroup__subtitle").text.find('(')+1:
                 tag.find('div',class_ = "ListingItemGroup__subtitle").text.find('(')+5])] 
        
        for tag in posting_tag]
    
    result = pd.DataFrame(data,columns = ['full_name','bodytype','generation_year'])
    
    return result 

def get_model_generation_year(marks_models_for_parsing):
    '''
    возврашщает pd.DataFrame  в котором: 
        full_name - полное название марки и модели с указанием поколения 
        bodytype - тип кузова поколения модели
        generation_year - год начала выпуска поколения
    
    marks_models_for_parsing - pd.Series в котором
        индекс: марка автомобиля
        значение: список моделей данной марки
    '''
    driver = webdriver.Chrome(service=service)  # запускаем процесс браузера
    driver.maximize_window()                    # масксимизируем окно    
    
    model_generation_year = pd.DataFrame(columns = ['full_name','bodytype','generation_year'])
    
    for mark in marks_models_for_parsing:
        print(mark, end=' | ')
        
        for model in marks_models_for_parsing[mark]:
            model_url = 'https://auto.ru/moskva/cars/' + mark.lower() + '/' + model.lower() + '/used/'
            tmp = get_generation_year(model_url,driver)
            model_generation_year = model_generation_year.append(tmp)
            time.sleep(1)
            
    driver.quit()    # закрываем процесс браузера
    
    return model_generation_year

def get_features_from_ticket(ticket_url, driver):
    '''
    возвращает pd.Series с признакамии полученными из карточки обьявления
    
    ticket_url: str, ссылка на страницу обьявления
    service : обьект selenium.webdriver.chrome.service
        
    '''
    features = pd.Series(index = data_columns)
    
    # получем html карточки текщего обьявления
#     driver = webdriver.Chrome(service=service)
#     driver.maximize_window()
    driver.get(ticket_url)
    # Находим и кликаем 'Все опции'
    try:
        butt = driver.find_element(By.CLASS_NAME, 'ComplectationGroupsDesktop__cut') 
        butt.click() 
    except Exception: pass
    # Получаем содержимое html-страницы:
    ticket_res = driver.execute_script("return document.body.innerHTML;")
    # Закрываем процесс браузера:
#     driver.quit()
    # создаем обьект bs4.BeautifulSoup из html карточки текщего обьявления
    ticket_bs = BeautifulSoup(ticket_res, 'html.parser')  

    # проверка корректности результата BeautifulSoup
    if ticket_bs:
    # получение признаков из карточки текущего обьявления
        # bodyType      
        try: features['bodyType'] = ticket_bs.find('li',class_='CardInfoRow_bodytype').find('a').text
        except Exception: features['bodytype'] = np.NaN

        # brand        
        try: features['brand'] = ticket_bs.find_all('a',class_='CardBreadcrumbs__itemText')[2].text.strip().upper()
        except Exception: features['brand'] = np.NaN
            
        # car_url
        features['car_url'] = ticket_url
            
        # color        
        try: features['color'] = ticket_bs.find('li',class_='CardInfoRow_color').find('a').text
        except Exception: features['color'] = np.NaN 
            
        # description
        try:
            rows = ticket_bs.find('div',class_='CardDescriptionHTML').find_all('span')
            features['description'] = '\n'.join([row.text for row in rows])
        except Exception: features['description'] = np.NaN
        
        #engineDisplacement            
        try: 
            engineDisplacement = ticket_bs.find('li',class_='CardInfoRow_engine').find('div').text.split(' / ')[0]
            features['engineDisplacement'] =  re.sub("[^\d.]", "", engineDisplacement)
        except Exception: features['engineDisplacement'] = np.NaN
            
        # enginePower
        try: 
            enginePower = ticket_bs.find('li',class_='CardInfoRow_engine').find('div').text.split(' / ')[1]
            features['enginePower'] = re.sub("\D", "", enginePower)
        except Exception: features['enginePower'] = np.NaN            

        # equipment_dict 
        try: 
            complectation_groups = ticket_bs.find(
                'div',class_='ComplectationGroupsDesktop__row').find_all(
                'div',class_='ComplectationGroupsDesktop__group')
            features['equipment_dict'] = {
                group.text.split('•')[0]: group.text.split('•')[1:] for group in complectation_groups}
        except Exception: features['equipment_dict'] = np.NaN             
  
        # fuel_type
        try: features['fuel_type'] = ticket_bs.find('li',class_='CardInfoRow_engine').find('div').text.split(' / ')[2]
        
        except Exception: features['fuel_type'] = np.NaN
            
        # mileage
        try:
            mileage = ticket_bs.find('li',class_='CardInfoRow_kmAge').find_all('span')[1].text
            features['mileage'] = re.sub("\D", "", mileage)
        except Exception: features['mileage'] = np.NaN            
            
        # model_name
        try: features['model_name'] = ticket_bs.find_all('a',class_='CardBreadcrumbs__itemText')[3].text.strip()
        except Exception: features['model_name'] = np.NaN            
            
        # numberOfDoors
        try:
            numberOfDoors_tag = ticket_bs.find('li',class_='CardInfoRow_bodytype').find('a')
            numberOfDoors_pre = re.findall('\d', numberOfDoors_tag.text)
            features['numberOfDoors'] = int(numberOfDoors_pre[0])
        except Exception: features['numberOfDoors'] = np.NaN

        # productionDate
        try: features['productionDate'] = ticket_bs.find('li',class_='CardInfoRow_year').find('a').text
        except Exception: features['productionDate'] = np.NaN
            
        # sell_id
        try:         
            invers_ticket_url = ticket_url[::-1]
            id_start, id_end = invers_ticket_url.find('/',1) , invers_ticket_url.find('-')+1
            features['sell_id'] = ticket_url[-id_start:-id_end]
        except Exception: features['sell_id'] = np.NaN
            
        # vehicleTransmission
        try:
            features['vehicleTransmission'] = (ticket_bs.find('li',class_='CardInfoRow_transmission').
                                               find_all('span')[1].text)
        except Exception: features['vehicleTransmission'] = np.NaN            
            
        # vendor
        european = ['SKODA', 'AUDI',  'VOLVO', 'BMW', 'MERCEDES', 'VOLKSWAGEN']
        japanese = ['HONDA','NISSAN','TOYOTA','INFINITI',  'LEXUS', 'MITSUBISHI']
        if features['brand'] in european :  features['vendor'] = 'EUROPEAN'
        elif features['brand'] in japanese :  features['vendor'] = 'JAPANESE'
        else: features['vendor'] = 'NAN'
            
        # Владельцы
        try: features['Владельцы'] = ticket_bs.find('li',class_='CardInfoRow_ownersCount').find_all('span')[1].text
        except Exception: features['Владельцы'] = np.NaN            
            
        # ПТС
        try: features['ПТС'] = ticket_bs.find('li',class_='CardInfoRow_pts').find_all('span')[1].text
        except Exception: features['ПТС'] = np.NaN               
            
        # Привод
        try: features['Привод'] = ticket_bs.find('li',class_='CardInfoRow_drive').find_all('span')[1].text
        except Exception: features['Привод'] = np.NaN            
            
        # Руль
        try: features['Руль'] = ticket_bs.find('li',class_='CardInfoRow_wheel').find_all('span')[1].text 
        except Exception: features['Руль'] = np.NaN         
            
        # Цена предложения
        try:
            offerprice = ticket_bs.find('span',class_='OfferPriceCaption__price').text
            features['offerprice'] = re.sub("\D", "", offerprice)
        except Exception: features['offerprice'] = np.NaN

        # modelDate              
        try:
            modelDate_tag = ticket_bs.find_all('a',class_='CardBreadcrumbs__itemText')
            features['modelDate'] = (modelDate_tag[2].text.strip() + ' ' +
                                     modelDate_tag[3].text.strip() + ' ' +
                                     modelDate_tag[4].text.strip())  
        except Exception: features['modelDate'] = np.NaN   
    return features

## Установка параметров, определение констант

In [4]:
service=Service('C:/Users/Manych/chromium/chromedriver.exe')

marks_for_parsing = ['SKODA', 'AUDI', 'HONDA', 'VOLVO', 'BMW', 'NISSAN', 'INFINITI',
       'MERCEDES', 'TOYOTA', 'LEXUS', 'VOLKSWAGEN', 'MITSUBISHI']

data_columns = ['bodyType', 'brand', 'car_url', 'color', 'engineDisplacement',
       'enginePower', 'equipment_dict', 'fuel_type', 'mileage', 'modelDate',
       'model_name', 'numberOfDoors', 'productionDate', 'sell_id', 'vehicleTransmission',
       'vendor', 'Владельцы', 'ПТС', 'Привод', 'Руль', 'offerprice'] 

# Парсинг
## Парсинг вспомогательных данных
### Создаем и наполняем ***`marks_models `*** , получаем ***`marks_models_for_parsing`*** и 
***marks_models*** - словарь в которм   
ключ:  обозначения марки на сайте auto.ru  
значения: списки всех моделей для каждой марки.

***marks_models_for_parsing*** - содержит только марки, присутсвующие в валидационном наборе данных **test**

затем сохраняем / читаем сохраненный ***marks_models_for_parsing***

In [5]:
# marks_models = get_marks_models()
# marks_models_for_parsing = dict([(k, marks_models.get(k)) for k in marks_for_parsing])

# with open('./Project_7_data/marks_models_for_parsing.json', 'w') as f: json.dump(marks_models_for_parsing, f)
with open('./Project_7_data/marks_models_for_parsing.json') as f: marks_models_for_parsing = json.loads(f.read())

### Создаем и заполняем `model_generation_year`
***model_generation_year*** - **pd.DataFrame**  в котором:  
        *full_name* - полное название марки и модели с указанием поколения;   
        *bodytype* - тип кузова поколения модели;  
        *generation_year* - год начала выпуска поколения  

Этот DataFrame нужен для преобразования полного названия модели в год начала выпуска модели

In [6]:
%%time
# model_generation_year_all =  get_model_generation_year(marks_models_for_parsing)

# model_generation_year_all.to_csv('./Project_5_data/model_generation_year.csv',index=False)
model_generation_year = pd.read_csv('./Project_7_data/model_generation_year.csv')

Wall time: 35.3 ms


# Парсинг набора данных для обучения
## Получение данных по маркам, присутсвующим в валидационном наборе данных

In [7]:
#  marks_models_for_parsing_TMP = {k: marks_models_for_parsing[k] for k in ['SKODA'] }
# https://auto.ru/moskva/cars/skoda/fabia/used/?output_type=table
# https://auto.ru/moskva/cars/skoda/fabia/used/?output_type=table&page=2

In [8]:
# ticket_url = 'https://auto.ru/cars/used/sale/skoda/fabia/1114813721-910c47b4/'
# get_features_from_ticket(ticket_url,service)

In [9]:
marks_models_for_parsing.keys()

dict_keys(['SKODA', 'AUDI', 'HONDA', 'VOLVO', 'BMW', 'NISSAN', 'INFINITI', 'MERCEDES', 'TOYOTA', 'LEXUS', 'VOLKSWAGEN', 'MITSUBISHI'])

In [13]:
# train = pd.DataFrame(columns=data_columns)

In [None]:
%%time
for mark in {k: marks_models_for_parsing[k] for k in ['TOYOTA'] }:
    print(mark)
    for model in marks_models_for_parsing[mark]:      
        model_url = 'https://auto.ru/moskva/cars/' + mark + '/' + model + '/used/' + '?output_type=table'
    # просмотр последовательно всех страниц текущей модели-model текущей марки-mark
        for pages_num in range(1,10): 
            if pages_num==1: page_url = model_url
            else:            page_url = model_url + '&page=' +  str(pages_num)  
            # получем html страницы
            driver = webdriver.Chrome(service=service)
            driver.maximize_window()
            driver.get(page_url)
            page_html = driver.execute_script("return document.body.innerHTML;")
            # создаем обьект bs4.BeautifulSoup из html страницы
            page_bs = BeautifulSoup(page_html, 'html.parser') 
            # список html-ек карточек на странице                                               
            tickets_on_page = page_bs.find_all('a', class_='ListingItemTitle__link') 
            # выход по исчерпанию страниц текущей модели текущей марки
            if not tickets_on_page: 
                driver.quit()
                break            
            # обработка карточек на странице
            for ticket in tickets_on_page:
                # получаем url карточки текущего обьявления
                ticket_url = ticket.get('href')
                # извлекаем признаки и заполняем строку train-а
                train.loc[len(train)] =get_features_from_ticket(ticket_url,driver)
                time.sleep(0.5) 
            time.sleep(0.5) 
            driver.quit()
        print ('|',len(train),end='') # <==============================             
    print ('|') # <==============================       

TOYOTA
| 13088| 13089| 13110| 13110| 13110| 13110| 13110| 13110| 13110| 13110| 13110| 13110

In [50]:
train.brand.unique()


array(['SKODA', nan, 'BMW', 'HONDA', 'INFINITI', 'MERCEDES-BENZ',
       'NISSAN', 'LEXUS'], dtype=object)

In [51]:
train.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 13081 entries, 0 to 13278
Data columns (total 21 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   bodyType             12835 non-null  object
 1   brand                12835 non-null  object
 2   car_url              13081 non-null  object
 3   color                12835 non-null  object
 4   engineDisplacement   12770 non-null  object
 5   enginePower          12770 non-null  object
 6   equipment_dict       10508 non-null  object
 7   fuel_type            12770 non-null  object
 8   mileage              12835 non-null  object
 9   modelDate            12835 non-null  object
 10  model_name           12835 non-null  object
 11  numberOfDoors        6987 non-null   object
 12  productionDate       12835 non-null  object
 13  sell_id              13081 non-null  object
 14  vehicleTransmission  12835 non-null  object
 15  vendor               13081 non-null  object
 16  Влад

In [43]:
# train.to_csv('./Project_7_data/train.csv',index=False)
# train = pd.read_csv('./Project_7_data/train.csv')

In [45]:
pd.read_csv('./Project_7_data/train.csv')

Unnamed: 0,bodyType,brand,car_url,color,engineDisplacement,enginePower,equipment_dict,fuel_type,mileage,modelDate,...,numberOfDoors,productionDate,sell_id,vehicleTransmission,vendor,Владельцы,ПТС,Привод,Руль,offerprice
0,хэтчбек 5 дв.,SKODA,https://auto.ru/cars/used/sale/skoda/fabia/111...,белый,1.4,86.0,{'Безопасность': ['Подушка безопасности водите...,Бензин,121000.0,Skoda Fabia II Рестайлинг,...,5.0,2014.0,1114778882,механическая,EUROPEAN,2 владельца,Оригинал,передний,Левый,470000.0
1,хэтчбек 5 дв.,SKODA,https://auto.ru/cars/used/sale/skoda/fabia/111...,красный,1.2,105.0,{'Безопасность': ['Подушка безопасности водите...,Бензин,108980.0,Skoda Fabia II Рестайлинг,...,5.0,2012.0,1114779535,роботизированная,EUROPEAN,3 или более,Оригинал,передний,Левый,849000.0
2,хэтчбек 5 дв.,SKODA,https://auto.ru/cars/used/sale/skoda/fabia/111...,белый,1.4,86.0,{'Безопасность': ['Подушка безопасности водите...,Бензин,121000.0,Skoda Fabia II Рестайлинг,...,5.0,2014.0,1114778882,механическая,EUROPEAN,2 владельца,Оригинал,передний,Левый,470000.0
3,хэтчбек 5 дв.,SKODA,https://auto.ru/cars/used/sale/skoda/fabia/110...,серый,1.2,70.0,,Бензин,122000.0,Skoda Fabia II Рестайлинг,...,5.0,2012.0,1105645244,механическая,EUROPEAN,1 владелец,Оригинал,передний,Левый,565000.0
4,хэтчбек 5 дв.,SKODA,https://auto.ru/cars/used/sale/skoda/fabia/111...,синий,1.4,86.0,{'Безопасность': ['Антипробуксовочная система ...,Бензин,8766.0,Skoda Fabia II Рестайлинг,...,5.0,2013.0,1114915329,механическая,EUROPEAN,1 владелец,Оригинал,передний,Левый,1103000.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
13071,купе,LEXUS,https://auto.ru/cars/used/sale/lexus/sc/110629...,чёрный,3.0,228.0,,Бензин,230000.0,Lexus SC I,...,,1998.0,1106296550,автоматическая,JAPANESE,1 владелец,Оригинал,задний,Левый,999999.0
13072,кабриолет,LEXUS,https://auto.ru/cars/used/sale/lexus/sc/108856...,серый,4.3,288.0,{'Безопасность': ['Подушка безопасности водите...,Бензин,100000.0,Lexus SC II Рестайлинг,...,,2006.0,1088565868,автоматическая,JAPANESE,3 или более,Оригинал,задний,Левый,1650000.0
13073,внедорожник 5 дв.,LEXUS,https://auto.ru/cars/used/sale/lexus/ux/111491...,чёрный,2.0,150.0,{'Безопасность': ['Подушка безопасности водите...,Бензин,19500.0,Lexus UX I,...,5.0,2020.0,1114914830,вариатор,JAPANESE,1 владелец,Оригинал,передний,Левый,3898000.0
13074,внедорожник 5 дв.,LEXUS,https://auto.ru/cars/used/sale/lexus/ux/111481...,белый,2.0,150.0,{'Безопасность': ['Антипробуксовочная система ...,Бензин,38720.0,Lexus UX I,...,5.0,2019.0,1114815455,вариатор,JAPANESE,1 владелец,Оригинал,передний,Левый,4892900.0


# ========== TEST ================

In [14]:
marks_models_for_parsing['SKODA']

['FABIA',
 'FABIA_RS',
 'FELICIA',
 'FORMAN',
 'KAROQ',
 'KODIAQ',
 'OCTAVIA',
 'OCTAVIA_RS',
 'RAPID',
 'ROOMSTER',
 'SUPERB',
 'YETI']

In [15]:
mark = 'SKODA'
model = 'FABIA'

model_url = 'https://auto.ru/moskva/cars/' + mark + '/' + model + '/used/'
model_url

'https://auto.ru/moskva/cars/SKODA/FABIA/used/'

In [66]:
dict([(k, marks_models_for_parsing.get(k)) for k in ['SKODA']])

{'SKODA': ['FABIA',
  'FABIA_RS',
  'FELICIA',
  'FORMAN',
  'KAROQ',
  'KODIAQ',
  'OCTAVIA',
  'OCTAVIA_RS',
  'RAPID',
  'ROOMSTER',
  'SUPERB',
  'YETI']}

# ================= EXERCISE =======================

In [45]:
to_json = {'abc': 1, 
           'def': [2,3]}
to_json

{'abc': 1, 'def': [2, 3]}

In [52]:
with open('example.json', 'w') as f: json.dump(to_json, f)
with open('example.json') as f: from_json = json.loads(f.read())
    

{'abc': 1, 'def': [2, 3]}

In [None]:
'''
train = pd.DataFrame(columns=data_columns)

for mark in marks_models_for_parsing.index:
    for model in marks_models_for_parsing[mark]:
        model_url = 'https://auto.ru/moskva/cars/' + mark + '/' + model + '/used/'

    # просмотр последовательно всех страниц текущей модели-model текущей марки-mark
        for pages_num in range(1,100): 
        
            if pages_num==1: params = {}
            else:            params = {'page': pages_num}
    
            res = requests.get(model_url + '?output_type=table', params=params, headers=headers)
            res.encoding = 'utf-8'
            time.sleep(0.5)
    
            # создаем обьект bs4.BeautifulSoup из html очередной страницы с обьявлениями по текущей модели текущей марки
            soup = BeautifulSoup(res.text, 'html.parser')  
    
            # список html-ек карточек на странице                                               
            tickets_on_page_list = soup.find_all('a', class_='ListingItemTitle-module__link') 
    
            if not tickets_on_page_list: # выход по исчерпанию страниц текущей модели текущей марки
                break
        
            # обработка карточек на странице
            for ticket in tickets_on_page_list:
                # получаем url карточки текущего обьявления
                ticket_url = ticket.get('href')
    
                # извлекаем признаки и заполняем строку train-а
                train.loc[len(train)] = get_features_from_ticket(ticket_url)
                ''';