# Регулярные выражения

In [1]:
from bs4 import BeautifulSoup as bs
import re

В этом задании мы предлагаем вам извлечь информацию с данной [страницы](https://www.galeria.spb.ru/shops/)

Для каждого этажа выведите список неработающих магазинов.

Поскольку информация подгружается динамически, мы заранее подготовили для вас html-код, готовый к обработке (файл galeria.html)

In [118]:
html_location = 'galeria.html'
with open(html_location, "r", encoding="utf8") as f:
    page = f.read()

soup = bs(page) # <-- тут html дерево
all_shops = soup.find_all("div", class_="shop")
shops_info_by_floors = {}

def parse_shop_info(element):
    title_raw = element.find(class_="shop__header").text.strip()
    result = re.match(r"(.*) \((временно не работает)\)", title_raw)
    # если магазин работает, то прекращаем обработку
    if not result: return
    # получаем очищенный заголовок без сообщения о том, что магазин не работает
    title = result.group(1)

    floor_raw = element.find(class_="shop__floor").text.strip()
    floor_number = re.match(r"(\d+)", floor_raw).group(1)
    floor_key = f"floor_{floor_number}"

    if floor_key not in shops_info_by_floors:
        shops_info_by_floors[floor_key] = []

    shops_info_by_floors[floor_key].append(title)

for shop in all_shops:
    parse_shop_info(shop)

In [119]:
shops_info_by_floors


{'floor_1': ['Zara',
  'UNIQLO',
  'Massimo Dutti',
  "Victoria's Secret",
  'BOSS',
  'Sephora',
  'Swarovski',
  'Swatch',
  'Oysho',
  'NYX',
  "Kiehl's",
  'Jo Malone London',
  'MAC',
  'The Body Shop',
  'H&M',
  'MOHITO',
  'Marc O’Polo',
  'Zara Home',
  'Chanel',
  'Nespresso'],
 'floor_2': ['Reserved',
  'Stradivarius',
  'MANGO',
  'Pull&Bear',
  'Bershka',
  "Women'Secret",
  'TonyMoly',
  'Vagabond',
  'HOUSE',
  'TOM TAILOR',
  "Levi's",
  'HUGO'],
 'floor_3': ['Adidas',
  'MIXIT',
  'Samsonite',
  'Vans',
  'Sinsay',
  'Cropp',
  'Helly Hansen',
  'LUHTA.FINLAND.FASHION',
  'Reebok',
  'Adidas Originals',
  'Reebok Classic',
  'PUMA',
  'PUMA SELECT'],
 'floor_4': ['Mothercare', 'Reima', 'Adidas kids', 'Toy.ru']}