# *Красный трек*
## Cеминар по теме Plotly

Выполняя этот семинар, ты научишься:
- строить гистограммы, диаграммы в Plotly;
- работать с географическими картами и метками;
- сортировать информацию и получать статистические данные.

## Оценивание работы на семинаре

**Система оценивания —** бинарная:

  - если все задачи решены корректно, без ошибок и полностью соответствуют стандартам кода на курсе, то задание выполнено и оценка — **10 баллов**;
  - если решения содержат ошибки или не соответствуют требованиям, то задание не выполнено и оценка — **0 баллов**.


**Проверка задания**

- Перед тем, как сдать задание, убедись, что твой код работает без ошибок и соответствует стандартам. Для этого используй автоматическую проверку.
- Загрузи задание на LMS. Ассистент проверит, соответствуют ли твои решения требованиям и целям домашнего задания, и выставит оценку.


**Доработка**

- Если твое задание получило 0 баллов, его вернут на доработку через LMS с комментариями о том, что нужно исправить.

## Описание датасета

Подключи и исследуй датасет передвижения кораблей. Каждая строка датасета — это наблюдение за судном в определённый момент времени, которое содержит его координаты, текущее состояние и технические параметры.

In [None]:
import plotly.express as px
import pandas as pd

df = pd.read_csv('ais_sea2.csv', low_memory=False)
df['timestamp'] = pd.to_datetime(df['timestamp'])
df.head()

### Задача 1

Исследуй, как связаны класс ледового укрепления и мощность судовых двигателей. Это поможет выбрать подходящее судно для безопасной и эффективной работы в ледовых условиях.

**Входные данные**

-	`mmsi`: уникальный идентификационный номер судна.
-	`iceclass`: класс ледового укрепления судна.
-	`power`: мощность двигателей судна в киловаттах.

**Что нужно сделать**

-	Удали строки с отсутствующими значениями в колонках `iceclass` и `power`.
- Построй столбчатую диаграмму, отображающую зависимость средней мощности судов от класса ледового укрепления:
  - На оси $X$ должны быть указаны классы ледового укрепления.
  -	На оси $Y$ должна отображаться средняя мощность судов для каждого класса.
- Назови график «Зависимость средней мощности судов от класса ледового укрепления» и подпиши оси.
- Задай свой цвет столбца для каждого класса ледового укрепления.

In [None]:
# Напиши свой код здесь



## Задача 2
  
Построй гистограмму, чтобы исследовать связь между скоростью судов, их типом и сезонностью. Сезоны и погодные условия влияют на себестоимость перевозок.

**Входные данные**

-	`timestamp`: временная метка, обозначающая дату и время (формат datetime).
-	`speed`: скорость судна, числовое значение.
-	`vessel_type`: тип судна (например, грузовое или пассажирское).

**Что нужно сделать**

- Создай новый признак `season` со значениями `winter`, `spring`, `summer`, `autumn`, используя даты. Классификацию можно провести по номеру месяца.

   **Примечание.** Для решения этой задачи можно использовать несколько различных функций. Например, `np.select()`, `np.apply()` или `np.map()`. Подумай, какой из вариантов лучше подойдёт для большого датасета.

- Отфильтруй данные, где скорость судна больше `0.1`.
- Построй гистограмму распределения скорости судов:
  - Ось $X$: скорость судна.
  -	Ось $Y$: количество записей.
-	Сделай разбивку гистограммы по типам судов с помощью параметра `facet_col`.
-	Обозначь каждый сезон разным цветом.
- Установи количество бинов для гистограммы равным 100.
- Назвови график «Распределение скорости cудна по сезонам для каждого типа судна».
-	Каждая гистограмма должна быть построена для конкретного типа судна.

In [None]:
# Напиши свой код здесь



## Задача 3

Визуализируй на карте расположение кораблей, чтобы проанализировать их распределение по географическим координатам. Это поможет сланировать безопасный маршрут в ледяных водах.
После того как построишь график, ответь на вопрос.

**Входные данные**

-	`lat`: широта, на которой расположен корабль (числовое значение).
-	`lon`: долгота, на которой расположен корабль (числовое значение).
-	`vessel_type`: тип судна (категориальная переменная), указывающий на способность проходить через лёд.

**Что нужно сделать**

-	Построй интерактивную карту с использованием `scatter_mapbox`.
-	Установи стиль карты на `open-street-map`.
-	Установи уровень увеличения (zoom) на $4$ для удобства визуализации.
-	Задай прозрачность точек (opacity) на уровне `0.05`, чтобы не перегружать карту.
-	Установи высоту графика, чтобы она была равна 800х1000 пикселей.
-	Назови карту «Маршруты для различных типов судов».
- Установи центр карты в Стокгольме. Для этого передай словарь координат в параметр `mapbox_center` в функцию `update_layout()`.

**Примечание.** В качестве эксперимента можешь попробовать посмотреть на маршруты с видом `mapbox_style='carto-darkmatter'`.

In [None]:
# Напиши свой код здесь



**Какой тип судов чаще всего курсирует между Стокгольмом и финским городом Турку?**

In [None]:
# Напиши ответ на вопрос в этой ячейке


## Задача 4

Исследуй зависимость между водоизмещением судна (DWT) и осадкой судна (draft). Результаты такого анализа важны для проектирования безопасных кораблей, оптимизации грузоперевозок, минимизации воздействия на экологию и улучшения навигации.

**Входные данные**

- `draft`: осадка судна. Это расстояние от линии воды до самой нижней точки корпуса, которое влияет на способность плавать и маневрировать.
-	`dwt`: водоизмещение судна. Это максимальная масса грузов, которые судно может безопасно перевозить при определённой осадке.
-	`breadth`: ширина судна. Эта характеристика влияет на стабильность и манёвренность судна.

**Что нужно сделать**
- Построй график зависимости водоизмещения (DWT) от осадки (draft) с учётом ширины судна.
-	На графике отобрази точки, обозначающие корабли, где ось $X$ — осадка, а ось $Y$ — водоизмещение.
-	Используй градиент цветов, чтобы обозначить ширину судна (breadth).
-	Включи линию тренда LOWESS для выявления тенденций в данных.
-	Добавь информативные заголовки и метки осей.
- Отсеки по осям выборки, которые ниже 15-го перцентиля и выше 95-го.

In [None]:
# Напиши свой код здесь



## Задача 5

Проанализируй данные о перемещениях кораблей и определи, какие из них находились в пути дольше всего. В результате анализа необходимо получить топ-10 кораблей, а также информацию о средней скорости и пройденном расстоянии для каждого из них.

**Входные данные**

- `mmsi`: уникальный идентификатор судна.
- `timestamp`: временные метки перемещений судна.
- `speed`: скорость судна в момент времени.
- `lon`: долгота, на которой расположено судно.
- `lat`: широта, на которой расположено судно.

**Что нужно сделать**

- Определи, какое судно находилось в пути дольше всего, и составь список из топ-10 кораблей на основе максимального времени в пути.
- Рассчитай среднюю скорость для каждого судна из топ-10.
- Вычисли общее расстояние, пройденное каждым судном из топ-10, на основе их координат.
-	Создай итоговый DataFrame, который содержит:
  - `mmsi`: уникальный идентификатор судна;
  - `max_time_in_transit`: максимальное время в пути для каждого судна;
  -	`avg_speed`: средняя скорость для каждого судна;
  -	`km`: общее расстояние, пройденное судном.
- Выведи результаты в виде таблицы `figure_factory`. Результаты должны идти по убыванию — от большего километража к меньшему.

**Как посчитать расстояние, зная координаты?**

Сначала установи библиотеку.

In [None]:
!pip install haversine



Затем для каждого судна расставь координаты в порядке возрастания во времени. Возьми две соседние координаты и воспользуйся функцией `haversine`, которая принимает две координаты и возвращает расстояние между ними в указанных единицах:

``` python
from haversine import haversine, Unit

coords_1 = (934.0522, -118.2437)  # Старт
coords_2 = (34.0523, -118.2436)  # Конец
distance = haversine(coords_1, coords_2, unit=Unit.KILOMETERS)
```

Сумма таких расстояний будет суммарным путём для судна.

In [None]:
# Напиши свой код здесь

