## Первое: изучение сайта

Для парсинга нам необходимо понять, из какого раздела сайта загружать информацию. По ТЗ нас интересует погода в текущий момент времени, для этого мы ищем страницу сайта, которая отвечает за погоду сейчас. Посмотрим, из чего состоит ссылка на эту страницу:

In [None]:
# Ссылка иммет следующий вид: https://www.gismeteo.ru/weather-tomsk-4652/now/
# Фрагмент ссылки, отвечающий за данный момент времени : now/
# Остальное - постоянная ссылка на Томскую погоду

Далее исследуем страницу сайта или его html-код. В ТЗ даны два исходных параметра: температура и скорость ветра. Найдем их теги на странице.

In [None]:
#  div class="now-weather"
# <temperature-value value="3" from-unit="c" reactive="">+3</temperature-value>
# Этот тег отвечает за кусочек страницы, где есть указания ТЕМПЕРАТУРЫ

In [None]:
#  div class="now-info-item"
# <speed-value value="1" from-unit="ms" reactive="">1</speed-value>
# Этот тег отвечает за кусочек страницы, где есть указания ВЕТЕР
# Проблема: в структуру страницы 3 одинаковых ячейки для текущих показателей, по тегам ничем не отличаются
# Решение: брать данные с первого вхождения (ветер)

## Второе: выбор библиотек и запуск кода

Нам понадобится библитека request для работы с HTTP-запросами и библиотека BeutifulSoup для работы со html-структурой страницы.

In [None]:
import requests as req
from bs4 import BeautifulSoup

In [None]:
link = "https://www.gismeteo.ru/weather-tomsk-4652/now/"

# Имитация пользователя
try:
  session = req.session()
  session.headers = {
              'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36',
              'accept-language': 'ru-RU,ru;q=0.9,en-GB;q=0.8,en;q=0.7,pl-PL;q=0.6,pl;q=0.5,en-US;q=0.4'
      }

  res = session.get(link)
  res.raise_for_status()
  html = res.text

  soup = BeautifulSoup(html, 'html5lib')
  #print(soup)

  # Скорость ветра либо положительна, либо равна 0
  wind = int(soup.find('div', class_='item-value').find('speed-value')['value'])
  #print(wind)

  # Если температура выше 0, то знак не пишется. При отрицательных значениях добавляется минус
  temperature = int(soup.find('div', class_='now-weather').find('temperature-value')['value'])
  #print(temperature)

except Exception as ex:
    print(f'Error: {ex}')

print(wind, temperature)


0 5


In [None]:
if 0 < temperature and wind < 2:
  print("Хорошая погода, можно гулять без шапки!")
elif wind > 2 or temperature < 0:
  print('На улице ветрено! Лучше надеть шапку.')

Хорошая погода, можно гулять без шапки!
