In [3]:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import time
import random
import re

options = Options()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--window-size=1920,1080')
options.add_argument('--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36')

driver = webdriver.Chrome(options=options)
base_url = "https://www.avito.ru/sankt-peterburg/kvartiry/prodam/novostroyka-ASgBAgICAkSSA8YQ5geOUg?p={}"

all_data = []

def parse_listing(card):
    try:
        html = card.get_attribute('innerHTML')
        soup = BeautifulSoup(html, 'html.parser')

        jk_tag = soup.find('a', href=re.compile('/catalog/novostroyki'))
        residential_complex = jk_tag.get_text(strip=True) if jk_tag else None

        title_tag = soup.find('a', {'data-marker': 'item-title'})
        title = title_tag.get_text(strip=True) if title_tag else ""
        rooms = re.search(r'(\d+|Студия)-к', title)
        rooms = rooms.group(1) if rooms else None

        area = re.search(r'(\d+(?:[.,]\d+)?)\s*м²', title)
        area = area.group(1).replace(',', '.') if area else None

        price_meta = soup.find('meta', itemprop='price')
        price = price_meta['content'] if price_meta else None

        price_per_m2_tag = soup.find('p', string=re.compile('₽.*за.*м²'))
        price_per_m2 = price_per_m2_tag.get_text(strip=True).replace('\xa0', ' ') if price_per_m2_tag else None

        metro_tag = soup.find('a', {'data-marker': 'metro_link'})
        metro = metro_tag.get_text(strip=True) if metro_tag else None

        url = "https://www.avito.ru" + title_tag['href'] if title_tag else None

        return {
            'residential_complex': residential_complex,
            'rooms': rooms,
            'area': area,
            'price': price,
            'price_per_m2': price_per_m2,
            'metro': metro,
            'url': url
        }
    except Exception:
        return None

for page in range(1, 11):
    url = base_url.format(page)
    print(f"Парсинг страницы {page}")
    driver.get(url)

    try:
        WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CSS_SELECTOR, 'div[data-marker="item"]'))
        )
        time.sleep(random.uniform(3, 6))
        cards = driver.find_elements(By.CSS_SELECTOR, 'div[data-marker="item"]')

        for card in cards:
            data = parse_listing(card)
            if data:
                all_data.append(data)

    except Exception as e:
        print(f"⚠️ Ошибка на странице {page}: {e}")
        continue

driver.quit()
df = pd.DataFrame(all_data)
df.to_excel("avito_parser.xlsx", index=False)
print(f"Сохранено {len(df)} записей в avito_parser.xlsx")

Парсинг страницы 1
Парсинг страницы 2
Парсинг страницы 3
Парсинг страницы 4
Парсинг страницы 5
Парсинг страницы 6
Парсинг страницы 7
Парсинг страницы 8
Парсинг страницы 9
Парсинг страницы 10
Сохранено 500 записей в avito_parser.xlsx


In [13]:
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import time
import random
import re
import os

options = Options()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--window-size=1920,1080')
options.add_argument('--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/121.0.0.0 Safari/537.36')

driver = webdriver.Chrome(options=options)
base_url = "https://www.avito.ru/sankt-peterburg/kvartiry/prodam/novostroyka-ASgBAgICAkSSA8YQ5geOUg?p={}"

all_data = []

def parse_listing(card):
    try:
        html = card.get_attribute('innerHTML')
        soup = BeautifulSoup(html, 'html.parser')

        jk_tag = soup.find('a', href=re.compile('/catalog/novostroyki'))
        residential_complex = jk_tag.get_text(strip=True) if jk_tag else None
       
        title_tag = soup.find('a', {'data-marker': 'item-title'})
        title = title_tag.get_text(strip=True) if title_tag else ""
        rooms = re.search(r'(\d+|Студия)-к', title)
        rooms = rooms.group(1) if rooms else None

        area = re.search(r'(\d+(?:[.,]\d+)?)\s*м²', title)
        area = area.group(1).replace(',', '.') if area else None

        price_meta = soup.find('meta', itemprop='price')
        price = price_meta['content'] if price_meta else None

        price_per_m2_tag = soup.find('p', string=re.compile('₽.*за.*м²'))
        price_per_m2 = price_per_m2_tag.get_text(strip=True).replace('\xa0', ' ') if price_per_m2_tag else None

        metro_tag = soup.find('a', {'data-marker': 'metro_link'})
        metro = metro_tag.get_text(strip=True) if metro_tag else None
       
        url = "https://www.avito.ru" + title_tag['href'] if title_tag else None

        return {
            'residential_complex': residential_complex,
            'rooms': rooms,
            'area': area,
            'price': price,
            'price_per_m2': price_per_m2,
            'metro': metro,
            'url': url
        }
    except Exception:
        return None

for page in range(95, 101):
    url = base_url.format(page)
    print(f"Парсинг страницы {page}")
    driver.get(url)

    try:
        WebDriverWait(driver, 20).until(
            EC.presence_of_all_elements_located((By.CSS_SELECTOR, 'div[data-marker="item"]'))
        )
        time.sleep(random.uniform(3, 6))
        cards = driver.find_elements(By.CSS_SELECTOR, 'div[data-marker="item"]')

        for card in cards:
            data = parse_listing(card)
            if data:
                all_data.append(data)

    except Exception as e:
        print(f"Ошибка на странице {page}: {e}")
        continue

driver.quit()

existing_df = pd.read_excel("avito_parser.xlsx")
new_df = pd.DataFrame(all_data)  # это то, что спарсилось сейчас

combined_df = pd.concat([existing_df, new_df], ignore_index=True)
combined_df.drop_duplicates(subset="url", inplace=True)

combined_df.to_excel("avito_parser.xlsx", index=False)
print(f"Сохранено {len(combined_df)} записей в avito_parser.xlsx")


Парсинг страницы 95
Парсинг страницы 96
Парсинг страницы 97
Парсинг страницы 98
Парсинг страницы 99
Парсинг страницы 100
Сохранено 4841 записей в avito_parser.xlsx


In [None]:
import pandas as pd
df = pd.read_excel('avito_parser.xlsx')
df.head()

Unnamed: 0,developer,residential_complex,rooms,area,price,price_per_m2,location,url
0,GloraX,GloraX Балтийская,Студия,32.7,10479999,320489,Балтийская,https://www.avito.ru/sankt-peterburg/kvartiry/...
1,ЛСР,ЖК «Цветной город»,Студия,23.5,4194750,178500,Академическая,https://www.avito.ru/sankt-peterburg/kvartiry/...
2,GloraX,ЖК «GloraX Василеостровский»,4,111.8,34839999,311628,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
3,GloraX,ЖК «GloraX Premium Василеостровский»,4,114.2,73489999,643520,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
4,GloraX,ЖК «GloraX Василеостровский»,3,74.7,26299999,352075,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...


In [33]:
df['rooms'] = df['rooms'].fillna(0).astype(int)
df['rooms'] = df['rooms'].fillna(0).replace(0, 'Студия') #после вопроса в беседе группы, принял решенние, что так правильнее

df.head()

Unnamed: 0,residential_complex,rooms,area,price,price_per_m2,metro,url
0,GloraX Балтийская,Студия,32.7,10479999,320 489 ₽ за м²,Балтийская,https://www.avito.ru/sankt-peterburg/kvartiry/...
1,ЖК «Цветной город»,Студия,23.5,4194750,178 500 ₽ за м²,,https://www.avito.ru/sankt-peterburg/kvartiry/...
2,ЖК «GloraX Василеостровский»,4,111.8,34839999,311 628 ₽ за м²,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
3,ЖК «GloraX Premium Василеостровский»,4,114.2,73489999,643 520 ₽ за м²,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
4,ЖК «GloraX Василеостровский»,3,74.7,26299999,352 075 ₽ за м²,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...


In [37]:
df['price_per_m2'] = df['price_per_m2'].astype(str).str.replace(r'\D', '', regex=True).astype(int)

df.head()

Unnamed: 0,residential_complex,rooms,area,price,price_per_m2,metro,url
0,GloraX Балтийская,Студия,32.7,10479999,320489,Балтийская,https://www.avito.ru/sankt-peterburg/kvartiry/...
1,ЖК «Цветной город»,Студия,23.5,4194750,178500,,https://www.avito.ru/sankt-peterburg/kvartiry/...
2,ЖК «GloraX Василеостровский»,4,111.8,34839999,311628,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
3,ЖК «GloraX Premium Василеостровский»,4,114.2,73489999,643520,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
4,ЖК «GloraX Василеостровский»,3,74.7,26299999,352075,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...


In [74]:
duplicates = df.groupby('residential_complex')['metro'].nunique()
inconsistent = duplicates[duplicates > 1]
df[df['residential_complex'].isin(inconsistent.index)]


Unnamed: 0,residential_complex,rooms,area,price,price_per_m2,location,url,developer


In [45]:
zhk_to_metro = {
    'ЖК «Цивилизация на Неве»' : 'Улица Дыбенко',
    'ЖК «Neva Haus»' : 'Крестовский остров',
    'ЖК «ЦДС Черная Речка»' : 'Лесная',
    'ЖК «Pulse Premier»' : 'Елизаровская'
}

df['metro'] = df['residential_complex'].map(zhk_to_metro).fillna(df['metro'])


In [50]:
df = df.rename(columns={'metro': 'location'})


In [64]:
df[df['location'].isnull()]['residential_complex'].nunique()


0

In [53]:
df = df[df['residential_complex'].notnull() & (df['residential_complex'].str.strip() != '')]

df['residential_complex'] = df['residential_complex'].apply(lambda x: re.sub(r'[\u200e\u200f\u202a-\u202e]', '', x))


In [4]:
zhk_to_location = {
    'ЖК «Цветной город»' : 'Академическая',
    'ЖК «GloraX Новоселье»' : 'Проспект Ветеранов',
    'ЖК «Ranta Residence» (ЖК «Ранта Резиденс»)' : 'Зеленогорск',
    'ЖК «Пулково Lake»' : 'Московская',
    'Комплекс апартаментов «Морская Ривьера»' : 'Зеленогорск',
    'ЖК «Любоград»' : 'Стрельна',
    'ЖК «А101 Лаголово»' : 'Красное Село',
    'ЖК «ЮгТаун»' : 'Московская',
    'ЖК «Кронфорт.Центральный»' : 'Кронштадт',
    'ЖК «ЛСР. Ржевский парк»' : 'Всеволожск',
    'е.квартал «Мир внутри»' : 'Сестрорецк',
    'ЖК «Парадный ансамбль»' : 'Московская',
    'ЖК NEWПИТЕР (НЬЮПИТЕР)' : 'Новоселье',
    'ЖК «Дворцовый фасад»' : 'Стрельна',
    'ЖК «Сандэй»' : 'Проспект Ветеранов',
    'ЖК «Полис Новоселье»' : 'Новоселье',
    'ЖК «Образцовый квартал 15»' : 'Шушары',
    'ЖК «Южная Нева»' : 'Пролетарская',
    'ЖК «Монография»' : 'Шушары',
    'UР-квартал «Новый Московский»' : 'Шушары',
    'ЖК «Алексеевский квартал»' : 'Купчино',
    'ЖК «Тайм Сквер»' : 'Комендантский проспект',
    'ЖК «New Time»' : 'Комендантский проспект',
    'ЖК «Живи! В Рыбацком»' : 'Рыбацкое',
    'ЖК «Дефанс Премиум»' : 'Московская',
    '17/33 Петровский остров' : 'Спортивная',
    'ЖК «Loft у Озера»' : 'Озерки',
    'ЖК «Сенат»' : 'Московская',
    'ЖК «Город Первых»' : 'Всеволожск',
    'ЖК «Прайм Приморский»' : 'Комендантский проспект',
    'ЖК «Академик»' : 'Академическая',
    'ЖК «Курортный Квартал»' : 'Песочный',
    'ЖК «Уютный Новоселье»' : 'Новоселье',
    'ЖК Shepilevskiy (Шепилевский)' : 'Московская',
    'Апарт-отель Вольта' : 'Ладожская',
    'Дом «Куинджи»' : 'Обводный канал',
    'ЖК «PLUS Пулковский»' : 'Московская',
    'Комплекс апартаментов «NEOPARK»' : 'Звёздная',
    'ЖК «Cube» (Кьюб)' : 'Московская',
    'Апарт-комплекс «Zoom Черная Речка»' : 'Чёрная речка',
    'ЖК «Прагма City»' : 'Парголово',
    'Авеню Апарт Пулково' : 'Звёздная',
    'ЖK «Univer City»' : 'Шушары',
    'ЖК «Бионика Заповедная»' : 'Проспект Просвещения',
    'ЖК «Friends»' : 'Проспект Просвещения',
    'ЖК «Respect»' : 'Лесная',
    'ЖК «NEVA RESIDENCE»' : 'Спортивная',
    'ЖК «Образцовый квартал 14»' : 'Шушары',
    'Таллинский парк' : 'Проспект Ветеранов',
    'ЖК «Юнтолово»' : 'Беговая',
    'ЖК «Дубровский»' : 'Пушкин',
    'ЖК «Квартал Торики»' : 'Проспект Ветеранов',
    'ЖК «Образцовый квартал 16»' : 'Шушары',
    'ЖК «Образцовый квартал 17»' : 'Шушары',
    'ЖК «Квартал Лаголово»' : 'Красное Село',
    'ЖК «Ручьи»' : 'Академическая',
    'ЖК «Экография»' : 'Петергоф',
    'ЖК «Granholm Village» (Гранхолм Вилладж)' : 'Парнас',
    'ЖК «Лисино»' : 'Беговая',
    'ЖК «Полис Приморский 2»' : 'Комендантский проспект',
    'ЖК «Образцовый квартал 13»' : 'Шушары',
    'Финский городок «Юттери»' : 'Колпино',
    'ЖК «Новое Колпино»' : 'Колпино',
    'Урбан-виллы «Моменты.Repino»' : 'Репино',
    'ЖК «Квартал Заречье»' : 'Колпино',
    'ЖК «BEREG.Курортный (БЕРЕГ.Курортный)»' : 'Сестрорецк',
    'ЖК «Пулковский дом»' : 'Купчино',
    'ЖК «АСТРИД»' : 'Колпино',
    'ЖК «Полет»' : 'Пушкин',
    'ЖК «Кинопарк»' : 'Проспект Ветеранов',
    'ЖК «Огни Залива»' : 'Ленинский проспект'

}

df['location'] = df['residential_complex'].map(zhk_to_location).fillna(df['location'])


In [18]:
df_developers = pd.read_excel('avito_parser1.xlsx')
df_developers_unique = df_developers[['residential_complex', 'developer']].drop_duplicates()
df_avito = df.merge(
    df_developers_unique,
    on = 'residential_complex',
    how = 'left' 
)

df_avito.head()
df_avito.shape



(4838, 9)

In [19]:
df_avito[df_avito['residential_complex'].isnull()]
df_avito[df_avito['developer'].isnull()]
df_avito[df_avito['location'].isnull()]



KeyError: 'developer'

In [102]:
zhk_to_developer = {
    'ЖК «LEGENDA Васильевского»': 'LEGENDA Intelligent Development',
    'Комплекс апартаментов «Морская Ривьера»' : 'ООО «Строительный холдинг Сенатор»',
    'Кантемировская 11' : 'ПИК',
    'ЖК «ЛСР. Большая Охта»' : 'ЛСР',
    'ЖК «Полис Приморский 2»' : 'Полис',
    'ЖК «БелАрт»' : 'РосСтройИнвест',
    'ЖК «Панорама парк Сосновка»' : 'Setl Group',
    'ЖК «Б15»': '«КВС»',
    'Квартал «Галактика»' : 'Эталон',
    'Клубный дом «Amo»' : 'AAG',
    'ЖК «ЛДМ»' : 'Эталон',
    'ЖК «ID Park Pobedy»' : 'ЕвроИнвест Девелопмент',
    'ЖК «А101 Лаголово»' : 'А101',
    'ЖК «Северная долина»' : 'Главстрой-Регионы',
    'ЖК «Приморский квартал»' : 'Мегалит',
    'ЖК «Respect»' : 'ПСК',
    'ЖК «ЦДС Приневский»' : 'Группа ЦДС',
    'ЖК «VEREN NEXT Шуваловский»' : 'Veren Group',
    'ЖК «Образцовый квартал 15»' : 'СЗ ТЕРМИНАЛ-РЕСУРС',
    'ЖК «Образцовый квартал 16»' : 'СЗ ТЕРМИНАЛ-РЕСУРС',
    'ЖК «Granholm Village» (Гранхолм Вилладж)' : 'Quasar Development',
    'ЖК «Friends»' : 'ПСК',
    'Комплекс апартаментов «NEOPARK»' : 'ЛСР',
    'Апарт-отель Вольта' : 'ПИК',
    'ЖК «Уютный Новоселье»' : 'ГК «Новоселье»',
    'ЖК «Курортный Квартал»' : 'Самолет',
    'Апарт-отель «AVENUE-APART» (Авеню-Апарт)' : 'БестЪ',
    'ЖК «БФА в Озерках»' : 'ЗЕНИТ-СТРОЙ-ИНВЕСТ',
    'Апарт-отель «Лиговский 127»' : 'ВИТА',
    'Клубный дом «ASTRVM» (Аструм)' : 'ПРОМСТРОЙКОМПЛЕКТ',
    'ЖК «Victory plaza»' : 'Setl Group',
    'ЖК «Шуваловский»' : 'ЛСР',
    'ЖК «Огни Залива»' : 'БФА-Девелопмент',
    'Апарт-комплекс «iD Polytech»' : 'ЕвроИнвест Девелопмент',
    'ЖК «Образцовый квартал 13»' : 'СЗ ТЕРМИНАЛ-РЕСУРС',
    'ЖК «Пулковский дом»' : 'Эталон',
    'ЖК «Коллекционный Дом 1919»' : 'ELEMENT',
    "ЖК «YE'S Primorsky» (Йес Приморский)" : 'СЗ К-25',
    'Финский городок «Юттери»' : 'Ленстройтрест',
    'Клубный дом «Futurist»' : 'Группа RBI',
    'Апарт-отель «ODOEVSKIJ 17»' : 'Quasar Development',
    'ЖК «Аэросити 6»' : 'Лидер Групп'
}

df_avito['developer'] = df_avito.apply(
    lambda row: zhk_to_developer[row['residential_complex']]
    if row['residential_complex'] in zhk_to_developer
    else row['developer'],
    axis=1
)


In [None]:
cols = df_avito.columns.tolist()
cols.insert(0, cols.pop(cols.index('developer')))

df_avito = df_avito[cols]
df_avito.head()
df_avito.to_excel("final_df.xlsx", index=False)

Unnamed: 0,developer,residential_complex,rooms,area,price,price_per_m2,location,url
0,GloraX,GloraX Балтийская,Студия,32.7,10479999,320489,Балтийская,https://www.avito.ru/sankt-peterburg/kvartiry/...
1,ЛСР,ЖК «Цветной город»,Студия,23.5,4194750,178500,Академическая,https://www.avito.ru/sankt-peterburg/kvartiry/...
2,GloraX,ЖК «GloraX Василеостровский»,4,111.8,34839999,311628,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
3,GloraX,ЖК «GloraX Premium Василеостровский»,4,114.2,73489999,643520,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...
4,GloraX,ЖК «GloraX Василеостровский»,3,74.7,26299999,352075,Приморская,https://www.avito.ru/sankt-peterburg/kvartiry/...


In [3]:
import pandas as pd
df = pd.read_excel('final_df.xlsx')

In [5]:
# Расчёт средней, медианной, минимальной, максимальной цены и диапазона
average_price = df['price'].mean()
median_price = df['price'].median()
min_price = df['price'].min()
max_price = df['price'].max()

print(f"Средняя цена: {average_price:,.0f} ₽")
print(f"Медианная цена: {median_price:,.0f} ₽")
print(f"Минимальная цена: {min_price:,.0f} ₽")
print(f"Максимальная цена: {max_price:,.0f} ₽")

Средняя цена: 14,208,395 ₽
Медианная цена: 9,436,864 ₽
Минимальная цена: 2,900,000 ₽
Максимальная цена: 2,807,904,549 ₽


In [5]:
# Группировка по жилому комплексу и расчет статистик
developer_price_stats = df.groupby('developer')['price'].agg(
    developer_average_price='mean',
    developer_median_price='median',
    developer_min_price='min',
    developer_max_price='max'
).round().astype('Int64').reset_index()

output_path = "developer_price.xlsx"
developer_price_stats.to_excel(output_path, index=False)



In [4]:
# Группировка по location и расчет статистик
location_price_stats = df.groupby('location')['price'].agg(
    location_average_price='mean',
    location_median_price='median',
    location_min_price='min',
    location_max_price='max'
).round().astype(int).reset_index()

output_path = "location_price.xlsx"
location_price_stats.to_excel(output_path, index=False)

In [15]:
pip install python-dotenv


Collecting python-dotenv
  Obtaining dependency information for python-dotenv from https://files.pythonhosted.org/packages/1e/18/98a99ad95133c6a6e2005fe89faedf294a748bd5dc803008059409ac9b1e/python_dotenv-1.1.0-py3-none-any.whl.metadata
  Using cached python_dotenv-1.1.0-py3-none-any.whl.metadata (24 kB)
Using cached python_dotenv-1.1.0-py3-none-any.whl (20 kB)
Installing collected packages: python-dotenv
Successfully installed python-dotenv-1.1.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.2.1[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [9]:
from dotenv import load_dotenv
import sqlalchemy
import os

load_dotenv()

HOST = os.getenv('host')
PORT = os.getenv('port')
DATABASE = os.getenv('database')
LOGIN = os.getenv('login')
PASSWORD = os.getenv('password')

engine = sqlalchemy.create_engine(f'postgresql://{LOGIN}:{PASSWORD}@{HOST}:{PORT}/{DATABASE}')
con_postgres = engine.connect()


In [7]:
df_developer = pd.read_excel("developer_price.xlsx")
df_location = pd.read_excel("location_price.xlsx")

In [22]:
table_name = 'avito'
schema_name = 'project'

df.to_sql(con=con_postgres, name = table_name, schema=schema_name, index=False, if_exists='replace')

838

In [10]:
table_name = 'developer'
schema_name = 'project'
df_developer.to_sql(con=con_postgres, name = table_name, schema=schema_name, index=False, if_exists='replace')

56

In [11]:
table_name = 'location'
schema_name = 'project'
df_location.to_sql(con=con_postgres, name = table_name, schema=schema_name, index=False, if_exists='replace')

60

In [122]:
!pip install aiogram


Collecting aiogram
  Obtaining dependency information for aiogram from https://files.pythonhosted.org/packages/03/18/c1ec098e7bd683974c56b97ef0c3e41260d4c4a88168a30238ec97e4faa3/aiogram-3.20.0.post0-py3-none-any.whl.metadata
  Using cached aiogram-3.20.0.post0-py3-none-any.whl.metadata (7.6 kB)
Collecting aiofiles<24.2,>=23.2.1 (from aiogram)
  Obtaining dependency information for aiofiles<24.2,>=23.2.1 from https://files.pythonhosted.org/packages/a5/45/30bb92d442636f570cb5651bc661f52b610e2eec3f891a5dc3a4c3667db0/aiofiles-24.1.0-py3-none-any.whl.metadata
  Using cached aiofiles-24.1.0-py3-none-any.whl.metadata (10 kB)
Collecting aiohttp<3.12,>=3.9.0 (from aiogram)
  Obtaining dependency information for aiohttp<3.12,>=3.9.0 from https://files.pythonhosted.org/packages/22/eb/6a77f055ca56f7aae2cd2a5607a3c9e7b9554f1497a069dcfcb52bfc9540/aiohttp-3.11.18-cp311-cp311-macosx_10_9_x86_64.whl.metadata
  Using cached aiohttp-3.11.18-cp311-cp311-macosx_10_9_x86_64.whl.metadata (7.7 kB)
Collecting 

In [None]:
import asyncio
import nest_asyncio
from collections import defaultdict
from dotenv import load_dotenv
import os
from aiogram import Bot, Dispatcher, types, Router
from aiogram.filters import Command
from aiogram.types import Message, InlineKeyboardMarkup, InlineKeyboardButton
from aiogram.fsm.storage.memory import MemoryStorage
from aiogram.utils.keyboard import InlineKeyboardBuilder
import psycopg2

# === Инициализация ===
load_dotenv()
bot = Bot(token=os.environ["bot_token"])
dp = Dispatcher(storage=MemoryStorage())
router = Router()

conn = psycopg2.connect(
    dbname=os.environ["database"],
    user=os.environ["login"],
    password=os.environ["password"],
    host=os.environ["host"],
    port=os.environ["port"]
)
cursor = conn.cursor()

user_filters = defaultdict(dict)
room_options = ["Студия", "1", "2", "3", "4", "5"]
location_options =  {
    "Приморский": ["Чёрная Речка", "Пионерская", "Старая Деревня", "Комендантский проспект"],
    "Выборгский": ["Выборгская", "Лесная", "Удельная", "Озерки", "Проспект Просвещения", "Парнас"],
    "Калининский": ["Площадь Ленина", "Политехническая", "Академическая", "Гражданский проспект"],
    "Красногвардейский": ["Новочеркасская", "Ладожская"],
    "Невский": [
        "Проспект Большевиков", "Улица Дыбенко",
        "Елизаровская", "Ломоносовская", "Пролетарская", "Обухово", "Рыбацкая"
    ],
    "Центральный": [
        "Площадь А. Невского I", "Площадь А. Невского II", "Площаль Восстания", "Маяковская", "Лиговский проспект",
        "Владимирская", "Достоевская", "Невский проспект", "Гостиный Двор"
    ],
    "Василеостровский": ["Василеостровская", "Приморская"],
    "Адмиралтейский": [
        "Сенная площадь", "Садовая", "Спасская", "Пушкинская", "Звенигородская",
        "Технологический институт", "Балтийская", "Адмиралтейская"
    ],
    "Петроградский": ["Петроградская", "Горьковская", "Крестовский остров", "Чкаловская", "Спортивная", "Беговая"],
    "Фрунзенский": ["Купчино", "Волковская", "Обводный канал", "Международная", "Бухарестская"],
    "Московский": ["Фрунзенская", "Московские ворота", "Электросила", "Парк Победы", "Московская", "Звёздная"],
    "Кировский": ["Нарвская", "Кировский завод", "Автово", "Ленинский проспект", "Проспект Ветеранов"],
    "Всеволожский": ["Девяткино"],
    "Пригород": ["Шушары", "Зеленогорск", "Красное село", "Всеволожск", "Стрельна", "Обухово", "Петергоф", "Сестрорецк", "Песочный", "Новоселье", "Парголово", "Репино", "Пушкин", "Кронштадт"]
}


# === Команда /start ===
@router.message(Command("start"))
async def start_handler(message: Message):
    user_filters[message.from_user.id] = {"rooms": [], "locations": []}
    await show_room_selection(message.from_user.id, message)

# === Переключение комнат ===
@router.callback_query(lambda c: c.data.startswith("toggle_room_"))
async def toggle_room(callback: types.CallbackQuery):
    room = callback.data.split("_", 2)[2]
    user_id = callback.from_user.id
    selected = user_filters[user_id].setdefault("rooms", [])
    selected.remove(room) if room in selected else selected.append(room)
    await show_room_selection(user_id, callback.message, edit=True)
    await callback.answer()

# === Подтверждение выбора комнат ===
@router.callback_query(lambda c: c.data == "rooms_done")
async def rooms_done(callback: types.CallbackQuery):
    await show_location_selection(callback.from_user.id, callback.message)
    await callback.answer()

# === Переключение локаций ===
@router.callback_query(lambda c: c.data.startswith("toggle_loc_"))
async def toggle_location(callback: types.CallbackQuery):
    loc = callback.data.split("_", 2)[2]
    user_id = callback.from_user.id
    selected = user_filters[user_id].setdefault("locations", [])
    selected.remove(loc) if loc in selected else selected.append(loc)
    await show_location_selection(user_id, callback.message, edit=True)
    await callback.answer()

# === Подтверждение локаций — цена ===
@router.callback_query(lambda c: c.data == "locs_done")
async def locs_done(callback: types.CallbackQuery):
    price_keyboard = InlineKeyboardMarkup(
        inline_keyboard=[
            [InlineKeyboardButton(text="до 5 млн", callback_data="price_0_5000000")],
            [InlineKeyboardButton(text="5–10 млн", callback_data="price_5000000_10000000")],
            [InlineKeyboardButton(text="10–15 млн", callback_data="price_10000000_15000000")],
            [InlineKeyboardButton(text="15-25 млн", callback_data="price_15000000_25000000")],
            [InlineKeyboardButton(text="25+ млн", callback_data="price_25000000_9999999999")],
        ]
    )
    await callback.message.answer("Теперь выбери диапазон цен:", reply_markup=price_keyboard)
    await callback.answer()

# === Сохраняем цену и показываем результаты ===
@router.callback_query(lambda c: c.data.startswith("price_"))
async def price_filter(callback: types.CallbackQuery):
    parts = callback.data.split("_")
    min_price, max_price = int(parts[1]), int(parts[2])
    user_id = callback.from_user.id
    user_filters[user_id]["price_min"] = min_price
    user_filters[user_id]["price_max"] = max_price
    await show_filtered_results(callback.message, user_id, offset=0)
    await callback.answer()

# === Показать ещё ===
@router.callback_query(lambda c: c.data.startswith("more_"))
async def more_results(callback: types.CallbackQuery):
    offset = int(callback.data.split("_")[1])
    await show_filtered_results(callback.message, callback.from_user.id, offset)
    await callback.answer()

# === Сброс фильтров ===
@router.callback_query(lambda c: c.data == "reset_filters")
async def reset_filters(callback: types.CallbackQuery):
    user_filters.pop(callback.from_user.id, None)
    await start_handler(callback.message)
    await callback.answer()

# === Результаты ===
async def show_filtered_results(message, user_id, offset):
    f = user_filters[user_id]
    rooms = f.get("rooms", [])
    districts = f.get("locations", [])
    locs = []
    for district in districts:
        locs.extend(location_options.get(district, []))
    locs = list(set(locs))

    min_price, max_price = f.get("price_min", 0), f.get("price_max", 9999999999)
    if not rooms:
        await message.answer("Вы не выбрали ни одной комнаты.")
        return

    room_ph = ','.join(['%s'] * len(rooms))
    loc_ph = ','.join(['%s'] * len(locs)) if locs else ''

    sql = f"""
        SELECT residential_complex, area, price, location, url
        FROM project.avito
        WHERE rooms IN ({room_ph}) AND price BETWEEN %s AND %s
    """
    params = list(rooms) + [min_price, max_price]

    if locs:
        sql += f" AND location IN ({loc_ph})"
        params += locs

    sql += " ORDER BY price ASC LIMIT 5 OFFSET %s"
    params.append(offset)

    cursor.execute(sql, params)
    rows = cursor.fetchall()

    if not rows:
        back_keyboard = InlineKeyboardMarkup(
            inline_keyboard=[
                [InlineKeyboardButton(text="🔁 В начало", callback_data="reset_filters")]
            ]
        )
        await message.answer("Больше предложений нет.", reply_markup=back_keyboard)
        return


    for rc, area, price, location, url in rows:
        text = f"\U0001F3E8 ЖК: {rc}\n\U0001F4C0 Площадь: {area} м²\n\U0001F4B0 Цена: {price} ₽\n\U0001F4CD Локация: {location}\n\U0001F517 [Ссылка]({url})"
        await message.answer(text, parse_mode="Markdown")

    # Кнопка всегда внизу
    buttons = [[InlineKeyboardButton(text="🔁 В начало", callback_data="reset_filters")]]

    # Если есть ещё, добавляем кнопку «ещё»
    if len(rows) == 5:
        buttons.insert(0, [InlineKeyboardButton(text="Показать ещё", callback_data=f"more_{offset + 5}")])

    nav = InlineKeyboardMarkup(inline_keyboard=buttons)
    await message.answer("Выберите действие:", reply_markup=nav)


# === Комнаты ===
async def show_room_selection(user_id, msg_obj, edit=False):
    selected = user_filters[user_id].get("rooms", [])
    builder = InlineKeyboardBuilder()
    for room in room_options:
        builder.button(
            text=f"✅ {room}" if room in selected else room,
            callback_data=f"toggle_room_{room}"
        )
    builder.button(text="Продолжить ➡️", callback_data="rooms_done")
    builder.adjust(3, 1)
    await (msg_obj.edit_reply_markup if edit else msg_obj.answer)("Выберите комнаты:", reply_markup=builder.as_markup())

# === Локации ===
async def show_location_selection(user_id, msg_obj, edit=False):
    selected = user_filters[user_id].get("locations", [])
    builder = InlineKeyboardBuilder()
    for loc in location_options:
        builder.button(
            text=f"✅ {loc}" if loc in selected else loc,
            callback_data=f"toggle_loc_{loc}"
        )
    builder.button(text="Продолжить к цене ➡️", callback_data="locs_done")
    builder.adjust(2, 1)
    await (msg_obj.edit_reply_markup if edit else msg_obj.answer)("Выберите район:", reply_markup=builder.as_markup())

# === Запуск ===
dp.include_router(router)
async def main():
    await dp.start_polling(bot)

nest_asyncio.apply()
await main()