# Импорт библиотек

In [22]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy import nan
from typing import List, Dict

## Константные переменные

In [23]:
# Спрос на товар
cargo_demand = ["маленький", "большой"]
# Ценность товара
cargo_value = ["обычный", "ценный", "очень ценный"]
# Хрупкость товара
cargo_fragility = ["не хрупкий", "хрупкий"]
# Сила ветра
wind_strength = {"штиль": 0, "тихий ветер": 1, "легкий ветер": 2, "слабый ветер": 3,
                 "умеренный ветер": 4, "свежий ветер": 5, "сильный ветер": 6,
                 "крепкий ветер": 7, "очень крепкий ветер": 8, "шторм": 9}
# Сила волнения
sea_state = {"полный штиль": 0, "штиль": 1, "очень слабое": 2, "слабое": 3,
             "умеренное": 4, "значительное": 5, "очень бурное": 6, "сильное": 7}
# Направление ветра
wind_direction = ["С", "Ю", "З", "В"]

## Важные функции

In [31]:
# Функция для генерации initial_data для одного конкретного судна
def generate_initial_data(vessel_title: str, vessel_type: str, L: float,
                          B: float, d: float, DW: float, speed: float,
                          cargo_type: List[str], cargo_demand: List[str] = cargo_demand,
                          cargo_value: List[str] = cargo_value, cargo_fragility: List[str] = cargo_fragility,
                          cargo_danger: str = nan, wind_strength: Dict[str, int] = wind_strength,
                          sea_state: List[str] = sea_state, wind_direction: List[str] = wind_direction,
                          N: int = 5):
    """
    Функция генерирует начальные примеры рейсов для уникального судна

    ----
    Вход:
        vessel_title - название судна \n
        vessel_type - тип судна \n
        L - длина судна, м \n
        B - ширина судна, м \n
        d - осадка судна, м \n
        DW - дедвейт судна, т \n
        speed - скорость судна, уз \n
        cargo_type - тип груза \n
        cargo_demand - спрос на товар \n
        cargo_value - ценность груза \n
        cargo_fragility - хрупкость груза \n
        cargo_danger - опасность груза \n
        wind_strength - сила ветра, балл \n
        sea_state - степень волнения моря, балл \n
        wind_direction - направление ветра \n
        N - количество примеров для генерации \n

    ----
    Выход:
        список сгенерированных примеров для одного уникального судна
    """
    # Массив, в котором хранятся все сгенерированные данные
    generated_data = []

    # Запишем значения ветра в отдельный список
    wind_strength_list = list(wind_strength.keys())
    # Запишем все значения волнения в отдельный список
    sea_state_list = list(sea_state.keys())
    # Запишем малые значения волнения в отдельный список
    small_sea_state_list = sea_state_list[:5]
    # Запишем большие значения волнения в отдельный список
    large_sea_state_list = sea_state_list[5:8]
    
    # Генерация кол-ва примеров (N)
    for i in range(1, N + 1):
        # Генерация типа груза на судне
        cargo_type_ = np.random.choice(cargo_type)
        # Генерация количества груза
        cargo_amount = float(np.random.randint(1, 0.1 * DW))
        # Генерация спроса на товар
        cargo_demand_ = np.random.choice(cargo_demand)
        # Генерация ценности груза
        cargo_value_ = np.random.choice(cargo_value)
        # Генерация хрупкости груза
        cargo_fragility_ = np.random.choice(cargo_fragility)
        # Генерация протяженности маршрута судна
        sea_route = np.random.randint(500, 9000)
        # Генерация силы ветра
        wind_strength_ = np.random.choice(wind_strength_list)
        
        # Генерация силы волнения
        if wind_strength[wind_strength_] > 5:
            sea_state_ = np.random.choice(large_sea_state_list)
        else:
            sea_state_ = np.random.choice(small_sea_state_list)

        # Генерация направления ветра
        wind_direction_ = np.random.choice(wind_direction)
        
        
        if i == 1:
            # Базовый пример
            new_example = [vessel_title, vessel_type, L, B, d, DW, speed, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           nan]
        else:
            # Генерация скорости судна
            speed_ = (np.random.uniform(speed - 1.5, speed + 1.5, 1).round(1))[0]
            new_example = [vessel_title, vessel_type, L, B, d, DW, speed_, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           nan]
        
        # Добавляем сгенерированные данные в массив
        generated_data.append(new_example)

    return generated_data

In [32]:
# Пример работы функции для генерации данных
for i in generate_initial_data(vessel_title="AMIRA_MARYANA", vessel_type="сухогруз", L=100, B=12, d=6.4,
                               DW=12000, speed=7.6, cargo_type=["бытовая техника", "мебель"], N=3):
    print(i)

['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 7.6, 'мебель', 775.0, nan, 'маленький', 'очень ценный', 'не хрупкий', nan, 1074, 'легкий ветер', 'слабое', 'Ю', nan]
['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 6.4, 'бытовая техника', 835.0, nan, 'маленький', 'очень ценный', 'хрупкий', nan, 1013, 'слабый ветер', 'слабое', 'З', nan]
['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 7.7, 'бытовая техника', 1005.0, nan, 'большой', 'ценный', 'хрупкий', nan, 5431, 'крепкий ветер', 'очень бурное', 'С', nan]


# Генерация данных

Данные описывают рейсы судов, в которых указана основная информация о судне, перевозимом грузе, детали маршрута, погодные условия.  
хрупкость груза
Данные содержат в себе следующие переменные:
- vessel_type - тип судна (класс);
- L - длина судна, м;
- B - ширина судна, м;
- d - осадка судна, м;
- DW - дедвейт судна, т;
- speed - скорость судна, узлы;
- cargo_type - тип груза;
- cargo_amount - количество груза, т;
- cost_per_mile - стоимость транспортировки 1 т. товара / 1 милю;
- cargo_demand - спрос на товар;
- cargo_value - ценность груза;
- cargo_fragility - хрупкость груза;
- cargo_danger - опасность груза (химикаты, ядовитые вещества, горючие вещества, взрывоопасные вещества);
- sea_route - маршрут судна, кол-во миль;
- wind_strength - сила ветра, балл;
- sea_state - степень волнения моря, балл;
- wind_direction - направление ветра;
- natural_disaster - природные катаклизмы (цунами, землетрясение, наводнение, торнадо);
- target - стоимость транспортировки груза, доллар ($).

In [32]:
# Формирование датафрейма
columns = ["vessel_title", "vessel_type", "L", "B", "d", "DW",
           "speed", "cargo_type", "cargo_amount", "cost_per_mile", "cargo_demand",
           "cargo_value", "cargo_fragility", "cargo_danger", "sea_route",
           "wind_strength", "sea_state", "wind_direction", "target"]
df = pd.DataFrame(columns=columns)

In [33]:
df.shape

(0, 20)

## Грузовые суда

In [31]:
# Виды грузов, которые перевозят сухогрузы
cargo_types = ["зерно", "бобовые", "мука", "хлопок", "руда", "песок", "стройматериалы",
               "автомобили", "текстиль", "бумага", "металлоконструкции", "бытовая техника", "мебель"]

In [35]:
# AMIRA_MARYANA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="AMIRA_MARYANA", vessel_type="сухогруз", L=175.53, B=29.4, d=10.1,
                                                       DW=32029.0, speed=11.7,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# SERDOLIK
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SERDOLIK", vessel_type="сухогруз", L=89.96, B=14.58, d=4.6,
                                                       DW=5027.0, speed=9.0,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# DESPINA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="DESPINA", vessel_type="сухогруз", L=224.94, B=32.26, d=7.0,
                                                       DW=76633.0, speed=7.0,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# EDFU
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="EDFU", vessel_type="сухогруз", L=223.7, B=32.3, d=6.6,
                                                       DW=71572.0, speed=11.6,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# GIVING
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="GIVING", vessel_type="сухогруз", L=189.6, B=30.5, d=8.5,
                                                       DW=45428.0, speed=12.3,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# OSMAN_BEY
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="OSMAN_BEY", vessel_type="сухогруз", L=165.5, B=27.0, d=9.1,
                                                       DW=27321.6, speed=8.5,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# TQ_TRABZON
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="TQ_TRABZON", vessel_type="сухогруз", L=87.89, B=12.8, d=6.0,
                                                       DW=3729.0, speed=8.3,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# KURTULUS
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="KURTULUS", vessel_type="сухогруз", L=92.25, B=15.0, d=4.5,
                                                       DW=5300.0, speed=9.0,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# AEOLIAN_FORTUNE
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="AEOLIAN_FORTUNE", vessel_type="сухогруз", L=228.99, B=32.26, d=7.2,
                                                       DW=82099.3, speed=7.6,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

# SERENITY_AC
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SERENITY_AC", vessel_type="сухогруз", L=75.0, B=10.7, d=3.3,
                                                       DW=1750.0, speed=8.2,
                                                       cargo_type=cargo_types,
                                                       N=40),
                                                       columns = df.columns)])

In [45]:
df.head()

Unnamed: 0,vessel_title,vessel_type,L,B,d,DW,speed,cargo_type,cargo_amount,cost_per_mile,cargo_demand,cargo_value,cargo_fragility,cargo_danger,sea_route,wind_strength,sea_state,wind_direction,natural_disaster,target
0,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,11.7,текстиль,1322.0,,большой,ценный,не хрупкий,,7344,шторм,штиль,В,цунами,
1,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,12.8,бумага,244.0,,большой,ценный,не хрупкий,,6427,умеренный ветер,сильное,С,нет,
2,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,10.4,мебель,131.0,,маленький,обычный,хрупкий,,2931,сильный ветер,значительное,З,нет,
3,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,11.4,руда,5.0,,маленький,обычный,не хрупкий,,1061,шторм,полный штиль,Ю,нет,
4,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,12.9,металлоконструкции,2571.0,,маленький,очень ценный,хрупкий,,5975,штиль,умеренное,Ю,нет,


## Танкеры