# Импорт библиотек

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy import nan
from typing import List

## Константные переменные

In [3]:
# Спрос на товар
cargo_demand = ["маленький", "большой"]
# Ценность товара
cargo_value = ["обычный", "ценный", "очень ценный"]
# Хрупкость товара
cargo_fragility = ["не хрупкий", "хрупкий"]
# Сила ветра
wind_strength = ["штиль", "тихий ветер", "легкий ветер", "слабый ветер",
                 "умеренный ветер", "свежий ветер", "сильный ветер",
                 "крепкий ветер", "очень крепкий ветер", "шторм",
                 "сильный шторм", "жестокий шторм", "ураган"]
# Сила волнения
sea_state = ["полный штиль", "штиль", "очень слабое", "слабое",
             "умеренное", "значительное", "очень бурное", "сильное",
             "очень сильное", "исключительное"]
# Направление ветра
wind_direction = ["С", "Ю", "З", "В"]
# Природные катаклизмы
natural_disaster = ["нет", "наводнение", "цунами", "землетрясение", "торнадо"]

## Важные функции

In [48]:
# Функция для генерации initial_data для одного конкретного судна
def generate_initial_data(vessel_type: str, L: float, B: float,
                          d: float, DW: float, speed: float,
                          cargo_type: List[str], cargo_demand: List[str] = cargo_demand,
                          cargo_value: List[str] = cargo_value, cargo_fragility: List[str] = cargo_fragility,
                          cargo_danger: str = nan, wind_strength: List[str] = wind_strength,
                          sea_state: List[str] = sea_state, wind_direction: List[str] = wind_direction, natural_disaster:List[str] = natural_disaster,
                          N: int = 5):
    """
    Функция генерирует начальные примеры рейсов для уникального судна

    ----
    Вход:
        vessel_type - тип судна \n
        L - длина судна, м \n
        B - ширина судна, м \n
        d - осадка судна, м \n
        DW - дедвейт судна, т \n
        speed - скорость судна, уз \n
        cargo_type - тип груза \n
        cargo_demand - спрос на товар \n
        cargo_value - ценность груза \n
        cargo_fragility - хрупкость груза \n
        cargo_danger - опасность груза \n
        wind_strength - сила ветра, балл \n
        sea_state - степень волнения моря, балл \n
        wind_direction - направление ветра \n
        natural_disaster - природные катаклизмы \n
        N - количество примеров для генерации \n

    ----
    Выход:
        список сгенерированных примеров для одного уникального судна
    """
    # Массив, в котором хранятся все сгенерированные данные
    generated_data = []

    # Генерация кол-ва примеров (N)
    for i in range(1, N + 1):
        # Генерация типа груза на судне
        cargo_type_ = np.random.choice(cargo_type)
        # Генерация количества груза
        cargo_amount = float(np.random.randint(1, 0.1 * DW))
        # Генерация спроса на товар
        cargo_demand_ = np.random.choice(cargo_demand)
        # Генерация ценности груза
        cargo_value_ = np.random.choice(cargo_value)
        # Генерация хрупкости груза
        cargo_fragility_ = np.random.choice(cargo_fragility)
        # Генерация протяженности маршрута судна
        sea_route = np.random.randint(500, 9000)
        # Генерация силы ветра
        wind_strength_ = np.random.choice(wind_strength)
        # Генерация силы волнения
        sea_state_ = np.random.choice(sea_state)
        # Генерация направления ветра
        wind_direction_ = np.random.choice(wind_direction)
        # Генерация силы волнения
        wind_direction_ = np.random.choice(wind_direction)
        # Генерация природных катаклизмов
        natural_disaster_ = np.random.choice(natural_disaster, p=[0.95, 0.0125, 0.0125, 0.0125, 0.0125])

        if i == 1:
            # Базовый пример
            new_example = [vessel_type, L, B, d, DW, speed, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           natural_disaster_, nan]
        else:
            # Генерация скорости судна
            speed_ = (np.random.uniform(speed - 1.5, speed + 1.5, 1).round(1))[0]
            new_example = [vessel_type, L, B, d, DW, speed_, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           natural_disaster_, nan]
        
        # Добавляем сгенерированные данные в массив
        generated_data.append(new_example)

    return generated_data

In [60]:
# Пример работы функции для генерации данных
for i in generate_initial_data(vessel_type="сухогруз", L=100, B=12, d=6.4, DW=12000, speed=7.6,
                               cargo_type=["бытовая техника", "мебель"], N=3):
    print(i)

['сухогруз', 100, 12, 6.4, 12000, 7.6, 'бытовая техника', 397.0, nan, 'большой', 'очень ценный', 'не хрупкий', nan, 3689, 'жестокий шторм', 'исключительное', 'С', 'нет', nan]
['сухогруз', 100, 12, 6.4, 12000, 6.8, 'мебель', 38.0, nan, 'маленький', 'ценный', 'хрупкий', nan, 7724, 'сильный шторм', 'очень слабое', 'Ю', 'нет', nan]
['сухогруз', 100, 12, 6.4, 12000, 6.2, 'мебель', 792.0, nan, 'маленький', 'очень ценный', 'хрупкий', nan, 1263, 'штиль', 'значительное', 'Ю', 'нет', nan]


# Генерация данных

Данные описывают рейсы судов, в которых указана основная информация о судне, перевозимом грузе, детали маршрута, погодные условия.  
хрупкость груза
Данные содержат в себе следующие переменные:
- vessel_type - тип судна (класс);
- L - длина судна, м;
- B - ширина судна, м;
- d - осадка судна, м;
- DW - дедвейт судна, т;
- speed - скорость судна, узлы;
- cargo_type - тип груза;
- cargo_amount - количество груза, т;
- cost_per_mile - стоимость транспортировки 1 т. товара / 1 милю;
- cargo_demand - спрос на товар;
- cargo_value - ценность груза;
- cargo_fragility - хрупкость груза;
- cargo_danger - опасность груза (химикаты, ядовитые вещества, горючие вещества, взрывоопасные вещества);
- sea_route - маршрут судна, кол-во миль;
- wind_strength - сила ветра, балл;
- sea_state - степень волнения моря, балл;
- wind_direction - направление ветра;
- natural_disaster - природные катаклизмы (цунами, землетрясение, наводнение, торнадо);
- target - стоимость транспортировки груза, доллар ($).

In [3]:
# Формирование датафрейма
columns = ["vessel_type", "L", "B", "d", "DW", "speed", "cargo_type",
           "cargo_amount", "cost_per_mile", "cargo_demand",
           "cargo_value", "cargo_fragility", "cargo_danger", "sea_route",
           "wind_strength", "sea_state", "wind_direction", "natural_disaster",
           "target"]
df = pd.DataFrame(columns=columns)

## Грузовые суда

In [4]:
# 1-ое
AMIRA_MARYANA = [
    ["cargo vessel", 175.53, 29.4, 10.1, 32029.0, 11.7, "appliances", 10.0, 3.2] + [nan] * (df.shape[1] - 9)
]

# 2-ое
SERDOLIK = [
    ["cargo vessel", 89.96, 14.58, 4.6, 5027.0, 9.0, "furniture", 5.6, 1.7] + [nan] * (df.shape[1] - 9)
]

# 3-ое
DESPINA = [
    ["cargo vessel", 224.94, 32.26, 7.0, 76633.0, 7.0, "furniture", 12.1, 3.3] + [nan] * (df.shape[1] - 9)
]

# 4-ое
EDFU = [
    ["cargo vessel", 223.7, 32.3, 6.6, 71572.0, 11.6, "appliances", 5.4, 2.6] + [nan] * (df.shape[1] - 9)
]

# 5-ое
GIVING = [
    ["cargo vessel", 189.6, 30.5, 8.5, 45428.0, 12.3, "appliances", 6.78, 4.71] + [nan] * (df.shape[1] - 9)
]
# 6-ое
OSMAN_BEY = [
    ["cargo vessel", 165.5, 27.0, 9.1, 27321.6, 8.5, "furniture", 3.15, 0.9] + [nan] * (df.shape[1] - 9)
]

# 7-ое
TQ_TRABZON = [
    ["cargo vessel", 87.89, 12.8, 6.0, 3729.0, 8.3, "appliances", 4.23, 1.56] + [nan] * (df.shape[1] - 9)
]

# 8-ое
KURTULUS = [
    ["cargo vessel", 92.25, 15, 4.5, 5300.0, 9.0, "appliances", 3.78, 1.3] + [nan] * (df.shape[1] - 9)
]

# 9-ое
AEOLIAN_FORTUNE = [
    ["cargo vessel", 228.99, 32.26, 7.2, 82099.3, 7.6, "furniture", 12.54, 7.58] + [nan] * (df.shape[1] - 9)
]

# 10-ое
SERENITY_AC = [
    ["cargo vessel", 75.0, 10.7, 3.3, 1750.0, 8.2, "appliances", 2.12, 0.85] + [nan] * (df.shape[1] - 9)
]

In [86]:
# Добавляем данные в df
df = pd.concat([df, pd.DataFrame(data=np.array(AMIRA_MARYANA), columns=df.columns)], ignore_index=True)

In [5]:
df

Unnamed: 0,vessel_type,L,B,d,DW,speed,cargo_type,cargo_length,cargo_breadth,cost_per_mile,cargo_demand,cargo_value,cargo_fragility,cargo_danger,sea_route,wind_strength,sea_state,wind_direction,natural_disaster,target


## Танкеры