# Импорт библиотек

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy import nan
from typing import List, Dict

## Константные переменные

In [2]:
# Спрос на товар
cargo_demand = ["маленький", "большой"]
# Ценность товара
cargo_value = ["обычный", "ценный", "очень ценный"]
# Хрупкость товара
cargo_fragility = ["не хрупкий", "хрупкий"]
# Сила ветра
wind_strength = {"штиль": 0, "тихий ветер": 1, "легкий ветер": 2, "слабый ветер": 3,
                 "умеренный ветер": 4, "свежий ветер": 5, "сильный ветер": 6,
                 "крепкий ветер": 7, "очень крепкий ветер": 8, "шторм": 9}
# Сила волнения
sea_state = {"полный штиль": 0, "штиль": 1, "очень слабое": 2, "слабое": 3,
             "умеренное": 4, "значительное": 5, "очень бурное": 6, "сильное": 7}
# Направление ветра
wind_direction = ["С", "Ю", "З", "В"]

In [3]:
# Виды грузов, которые перевозят сухогрузы
cargo_types_cargo_vessel = ["зерно", "бобовые", "мука", "хлопок", "руда", "песок", "стройматериалы",
                            "автомобили", "текстиль", "бумага", "металлоконструкции", "бытовая техника",
                            "мебель", "рыба"]

# Виды грузов, которые перевозят танкеры
cargo_types_tanker = ["сырая нефть", "нефтепродукты", "природный газ", "химические грузы", "пищевые грузы",
                      "сжиженные углеводородные газы", "спирт", "метанол", "расплавленный камень", "аммиак"]

## Важные функции

In [4]:
# Функция для генерации initial_data для одного конкретного судна
def generate_initial_data(vessel_title: str, vessel_type: str, L: float,
                          B: float, d: float, DW: float, speed: float,
                          cargo_type: List[str], cargo_demand: List[str] = cargo_demand,
                          cargo_value: List[str] = cargo_value, cargo_fragility: List[str] = cargo_fragility,
                          cargo_danger: str = nan, wind_strength: Dict[str, int] = wind_strength,
                          sea_state: List[str] = sea_state, wind_direction: List[str] = wind_direction,
                          N: int = 5):
    """
    Функция генерирует начальные примеры рейсов для уникального судна

    ----
    Вход:
        vessel_title - название судна \n
        vessel_type - тип судна \n
        L - длина судна, м \n
        B - ширина судна, м \n
        d - осадка судна, м \n
        DW - дедвейт судна, т \n
        speed - скорость судна, уз \n
        cargo_type - тип груза \n
        cargo_demand - спрос на товар \n
        cargo_value - ценность груза \n
        cargo_fragility - хрупкость груза \n
        cargo_danger - опасность груза \n
        wind_strength - сила ветра, балл \n
        sea_state - степень волнения моря, балл \n
        wind_direction - направление ветра \n
        N - количество примеров для генерации \n

    ----
    Выход:
        список сгенерированных примеров для одного уникального судна
    """
    # Массив, в котором хранятся все сгенерированные данные
    generated_data = []

    # Запишем значения ветра в отдельный список
    wind_strength_list = list(wind_strength.keys())
    # Запишем все значения волнения в отдельный список
    sea_state_list = list(sea_state.keys())
    # Запишем малые значения волнения в отдельный список
    small_sea_state_list = sea_state_list[:5]
    # Запишем большие значения волнения в отдельный список
    large_sea_state_list = sea_state_list[5:8]
    
    # Генерация кол-ва примеров (N)
    for i in range(1, N + 1):
        # Генерация типа груза на судне
        cargo_type_ = np.random.choice(cargo_type)
        # Генерация количества груза
        cargo_amount = float(np.random.randint(1, 0.1 * DW))
        # Генерация спроса на товар
        cargo_demand_ = np.random.choice(cargo_demand)
        # Генерация ценности груза
        cargo_value_ = np.random.choice(cargo_value)
        # Генерация хрупкости груза
        cargo_fragility_ = np.random.choice(cargo_fragility)
        # Генерация протяженности маршрута судна
        sea_route = np.random.randint(500, 9000)
        # Генерация силы ветра
        wind_strength_ = np.random.choice(wind_strength_list)
        
        # Генерация силы волнения
        if wind_strength[wind_strength_] > 5:
            sea_state_ = np.random.choice(large_sea_state_list)
        else:
            sea_state_ = np.random.choice(small_sea_state_list)

        # Генерация направления ветра
        wind_direction_ = np.random.choice(wind_direction)
        
        
        if i == 1:
            # Базовый пример
            new_example = [vessel_title, vessel_type, L, B, d, DW, speed, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           nan]
        else:
            # Генерация скорости судна
            speed_ = (np.random.uniform(speed - 1.5, speed + 1.5, 1).round(1))[0]
            new_example = [vessel_title, vessel_type, L, B, d, DW, speed_, cargo_type_,
                           cargo_amount, nan, cargo_demand_, cargo_value_,
                           cargo_fragility_, cargo_danger, sea_route,
                           wind_strength_, sea_state_, wind_direction_,
                           nan]
        
        # Добавляем сгенерированные данные в массив
        generated_data.append(new_example)

    return generated_data

In [5]:
# Пример работы функции для генерации данных
for i in generate_initial_data(vessel_title="AMIRA_MARYANA", vessel_type="сухогруз", L=100, B=12, d=6.4,
                               DW=12000, speed=7.6, cargo_type=["бытовая техника", "мебель"], N=3):
    print(i)

['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 7.6, 'мебель', 962.0, nan, 'большой', 'очень ценный', 'не хрупкий', nan, 7550, 'сильный ветер', 'сильное', 'С', nan]
['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 6.5, 'бытовая техника', 952.0, nan, 'маленький', 'очень ценный', 'не хрупкий', nan, 8553, 'штиль', 'умеренное', 'С', nan]
['AMIRA_MARYANA', 'сухогруз', 100, 12, 6.4, 12000, 8.1, 'мебель', 26.0, nan, 'большой', 'ценный', 'хрупкий', nan, 8928, 'шторм', 'очень бурное', 'З', nan]


# Генерация данных

Данные описывают рейсы судов, в которых указана основная информация о судне, перевозимом грузе, детали маршрута, погодные условия.  
хрупкость груза
Данные содержат в себе следующие переменные:
- vessel_title - название судна;
- vessel_type - тип судна (класс);
- L - длина судна, м;
- B - ширина судна, м;
- d - осадка судна, м;
- DW - дедвейт судна, т;
- speed - скорость судна, узлы;
- cargo_type - тип груза;
- cargo_amount - количество груза, т;
- cost_per_mile - стоимость транспортировки 1 т. товара / 1 милю;
- cargo_demand - спрос на товар;
- cargo_value - ценность груза;
- cargo_fragility - хрупкость груза;
- cargo_danger - опасность груза (химикаты, ядовитые вещества, горючие вещества, взрывоопасные вещества);
- sea_route - маршрут судна, кол-во миль;
- wind_strength - сила ветра, балл;
- sea_state - степень волнения моря, балл;
- wind_direction - направление ветра;
- target - стоимость транспортировки груза, доллар ($).

In [6]:
# Формирование датафрейма
columns = ["vessel_title", "vessel_type", "L", "B", "d", "DW",
           "speed", "cargo_type", "cargo_amount", "cost_per_mile", "cargo_demand",
           "cargo_value", "cargo_fragility", "cargo_danger", "sea_route",
           "wind_strength", "sea_state", "wind_direction", "target"]
df = pd.DataFrame(columns=columns)

In [7]:
df.shape

(0, 19)

## Грузовые суда

In [8]:
# AMIRA_MARYANA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="AMIRA_MARYANA", vessel_type="сухогруз", L=175.53, B=29.4, d=10.1,
                                                       DW=32029.0, speed=11.7,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# SERDOLIK
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SERDOLIK", vessel_type="сухогруз", L=89.96, B=14.58, d=4.6,
                                                       DW=5027.0, speed=9.0,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# DESPINA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="DESPINA", vessel_type="сухогруз", L=224.94, B=32.26, d=7.0,
                                                       DW=76633.0, speed=7.0,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# EDFU
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="EDFU", vessel_type="сухогруз", L=223.7, B=32.3, d=6.6,
                                                       DW=71572.0, speed=11.6,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# GIVING
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="GIVING", vessel_type="сухогруз", L=189.6, B=30.5, d=8.5,
                                                       DW=45428.0, speed=12.3,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# OSMAN_BEY
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="OSMAN_BEY", vessel_type="сухогруз", L=165.5, B=27.0, d=9.1,
                                                       DW=27321.6, speed=8.5,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# TQ_TRABZON
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="TQ_TRABZON", vessel_type="сухогруз", L=87.89, B=12.8, d=6.0,
                                                       DW=3729.0, speed=8.3,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# KURTULUS
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="KURTULUS", vessel_type="сухогруз", L=92.25, B=15.0, d=4.5,
                                                       DW=5300.0, speed=9.0,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# AEOLIAN_FORTUNE
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="AEOLIAN_FORTUNE", vessel_type="сухогруз", L=228.99, B=32.26, d=7.2,
                                                       DW=82099.3, speed=7.6,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# SERENITY_AC
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SERENITY_AC", vessel_type="сухогруз", L=75.0, B=10.7, d=3.3,
                                                       DW=1750.0, speed=8.2,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# KONYA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="KONYA", vessel_type="сухогруз", L=199.99, B=32.26, d=7.4,
                                                       DW=63200.0, speed=6.0,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# MSC_SAMANTHA_VI
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="MSC_SAMANTHA_VI", vessel_type="сухогруз", L=274.6, B=40.0, d=9.9,
                                                       DW=77414.0, speed=13.1,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# PARIS_EXPRESS
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="PARIS_EXPRESS", vessel_type="сухогруз", L=366.06, B=48.23, d=14.1,
                                                       DW=153514.0, speed=6.6,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# SIRAYA_WISDOM
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SIRAYA_WISDOM", vessel_type="сухогруз", L=153.08, B=23.0, d=5.8,
                                                       DW=21118.0, speed=10.1,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# AYATI
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="AYATI", vessel_type="сухогруз", L=178.04, B=28.0, d=5.4,
                                                       DW=35366.0, speed=12.4,
                                                       cargo_type=cargo_types_cargo_vessel,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

In [9]:
df.shape

(600, 19)

## Танкеры

In [10]:
# MERA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="MERA", vessel_type="танкер", L=117.0, B=16.4, d=6.9,
                                                       DW=7014.0, speed=10.9,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# CONSTELLATION
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="CONSTELLATION", vessel_type="танкер", L=228.6, B=32.57, d=8.0,
                                                       DW=73917.0, speed=7.4,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# STI_ROTHERHITHE
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="STI_ROTHERHITHE", vessel_type="танкер", L=184.0, B=27.4, d=7.2,
                                                       DW=38734.0, speed=12.1,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# VOLGONEFT_147
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="VOLGONEFT_147", vessel_type="танкер", L=132.6, B=16.9, d=2.8,
                                                       DW=4626.0, speed=7.0,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# BALT_FLOT_18
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="BALT_FLOT_18", vessel_type="танкер", L=140.85, B=16.86, d=3.3,
                                                       DW=7900.0, speed=8.7,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# NAUTILUS
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="NAUTILUS", vessel_type="танкер", L=243.0, B=42.03, d=9.3,
                                                       DW=108835.0, speed=6.1,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# BELGRAVIA_V
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="BELGRAVIA_V", vessel_type="танкер", L=119.8, B=19.0, d=6.9,
                                                       DW=9127.0, speed=11.4,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# GANJA
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="GANJA", vessel_type="танкер", L=140.85, B=16.86, d=4.2,
                                                       DW=7017.0, speed=7.0,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# NEVSKIY_PROSPECT
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="NEVSKIY_PROSPECT", vessel_type="танкер", L=249.9, B=44.0, d=4.7,
                                                       DW=114598.0, speed=5.5,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# ARGOLIS
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="ARGOLIS", vessel_type="танкер", L=175.0, B=31.0, d=7.7,
                                                       DW=40083.0, speed=8.8,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# ICE_HAWK
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="ICE_HAWK", vessel_type="танкер", L=145.88, B=22.5, d=8.7,
                                                       DW=15441.0, speed=9.7,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# GIUSE
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="GIUSE", vessel_type="танкер", L=244.6, B=42.03, d=11.1,
                                                       DW=109390.0, speed=9.4,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# WALER
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="WALER", vessel_type="танкер", L=101.39, B=19.05, d=5.8,
                                                       DW=7279.0, speed=8.3,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# SWIFTSEA_RIDER
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="SWIFTSEA_RIDER", vessel_type="танкер", L=281.0, B=48.2, d=14.7,
                                                       DW=166188.0, speed=8.4,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

# ELEGANCE
df = pd.concat([df, pd.DataFrame(generate_initial_data(vessel_title="ELEGANCE", vessel_type="танкер", L=243.8, B=42.0, d=14.7,
                                                       DW=115098.0, speed=10.4,
                                                       cargo_type=cargo_types_tanker,
                                                       N=40),
                                                       columns = df.columns)], ignore_index=True)

In [11]:
df.shape

(1200, 19)

# Заполнение пропущенных значений в переменных
**Переменные**:
- cargo_danger
- cost_per_mile
- target

## Логика формирования переменной cargo_danger
cargo_danger - класс опасности груза  
  
Классы опасности груза:
- Класс 1 - взрывчатые вещества;
- Класс 2 - газы;
- Класс 3 - легковоспламеняющиеся жидкости;
- Класс 4 - легковоспламеняющиеся твердые вещества;
- Класс 5 - окисляющие вещества;
- Класс 6 - токсические вещества;
- Класс 7 - радиоактивные материалы;
- Класс 8 - коррозионные вещества;
- Класс 9 - прочие опасные вещества;

In [4]:
def set_danger_class(col: pd.Series) -> pd.Series:
    """
    Функция присваивает класс опасности грузу в зависимости от его типа
    
    ----
    Вход:
        col - тип груза в виде pd.Series
    
    ----
    Выход:
        pd.Series с классами опасности груза для каждого примера
    """
    if col in ["бобовые", "рыба", "зерно", "мебель", "бумага", "мука", "песок", "пищевые грузы", "руда"]:
        return 0
    # elif col in []:
    #     return 1
    elif col in ["аммиак", "сжиженные углеводородные газы", "природный газ"]:
        return 2
    elif col in ["метанол", "сырая нефть", "нефтепродукты", "спирт", "расплавленный камень"]:
        return 3
    elif col in ["текстиль", "хлопок"]:
        return 4
    # elif col in [""]:
    #     return 5
    elif col in ["химические грузы"]:
        return 6
    # elif col in [""]:
    #     return 7
    elif col in ["металлоконструкции"]:
        return 8
    elif col in ["бытовая техника", "автомобили", "стройматериалы"]:
        return 9
    else:
        return 0

In [10]:
df["cargo_danger"] = df.cargo_type.apply(set_danger_class)

In [12]:
df.cargo_danger.value_counts()

0    358
3    333
2    173
9    140
4    107
6     47
8     42
Name: cargo_danger, dtype: int64

## Логика формирования переменной cost_per_mile
cost_per_mile - стоимость транспортировки 1 т. груза на 1 милю

Логика формирования переменной:  
$cost\_per\_mile$ = $(cargo\_amount \ / \ sea\_route) \times (cargo\_demand \ + \ cargo\_value \ + \  cargo\_fragility \ + \ cargo\_danger)$

In [3]:
# Поправляющие коэффициенты в формуле
cargo_demand_koef_list = np.where(df.cargo_demand == "маленький", 0, 1)
cargo_value_koef_list = np.select([df.cargo_value == "обычный", df.cargo_value == "ценный", df.cargo_value == "очень ценный"], [0, 1, 2])
cargo_fragility_koef_list = np.where(df.cargo_fragility == "не хрупкий", 0, 1)
cargo_danger_koef_list = np.where(df.cargo_danger == 0, 0, 1)

In [4]:
def cost_per_mile_func(df: pd.DataFrame, cargo_demand_koef_list = cargo_demand_koef_list,
                       cargo_value_koef_list = cargo_value_koef_list,
                       cargo_fragility_koef_list = cargo_fragility_koef_list,
                       cargo_danger_koef_list = cargo_danger_koef_list):
    """
    Функция расчета стоимости транспортировки 1 т. груза за 1 милю
    
    ----
    Вход:
        df - Таблица данных рейсов судов \n
        cargo_demand_koef_list - коэффициент, учитывающий влияние величины спроса на товар (груз) \n
        cargo_value_koef_list - коэффициент, учитывающий влияние ценности груза \n
        cargo_fragility_koef_list - коэффициент, учитывающий влияние хрупкость груза \n
        cargo_danger_koef_list - коэффициент, учитывающий влияние класса опасности груза \n

    ----
    Выход:
        pd.Series - стоимость транспортировки 1 т. груза за 1 милю
    """
    part_1 = np.array(df.cargo_amount / df.sea_route)
    part_2 = np.array(cargo_demand_koef_list + cargo_value_koef_list + cargo_fragility_koef_list + cargo_danger_koef_list)
    
    return pd.Series(part_1 * part_2).astype(float).round(2)

In [5]:
df['cost_per_mile'] = cost_per_mile_func(df)

In [6]:
df[df["cost_per_mile"].isna() == True].count()[0]

0

## Логика формирования переменной target
target - полная стоимость транспортировки груза  
  
Логика формирования $target$ = $cost\_per\_mile \times sea\_route$

In [7]:
df["target"] = df.apply(lambda x: x.cost_per_mile * x.sea_route,
                        axis=1)

In [8]:
df[df["target"].isna() == True].count()[0]

0

# Доступ к данным

In [9]:
df.head(3)

Unnamed: 0,vessel_title,vessel_type,L,B,d,DW,speed,cargo_type,cargo_amount,cost_per_mile,cargo_demand,cargo_value,cargo_fragility,cargo_danger,sea_route,wind_strength,sea_state,wind_direction,target
0,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,11.7,бобовые,2181.0,2.47,маленький,ценный,хрупкий,0,1763,умеренный ветер,очень слабое,В,4354.61
1,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,12.7,бытовая техника,615.0,0.6,большой,очень ценный,не хрупкий,9,4083,шторм,очень бурное,З,2449.8
2,AMIRA_MARYANA,сухогруз,175.53,29.4,10.1,32029.0,12.6,автомобили,2641.0,1.66,большой,обычный,хрупкий,9,4759,легкий ветер,полный штиль,З,7899.94


In [10]:
df.dtypes

vessel_title        object
vessel_type         object
L                  float64
B                  float64
d                  float64
DW                 float64
speed              float64
cargo_type          object
cargo_amount       float64
cost_per_mile      float64
cargo_demand        object
cargo_value         object
cargo_fragility     object
cargo_danger         int64
sea_route           object
wind_strength       object
sea_state           object
wind_direction      object
target             float64
dtype: object

## Сохранение

In [11]:
# Сохранение данных в формат "pickle"
df.to_pickle("../Data/ship_voyages.pkl")

In [12]:
# Сохранение данных в формат "csv"
df.to_csv("../Data/ship_voyages.csv")

## Загрузка

In [2]:
# Загрузка данных в формате "pickle"
df = pd.read_pickle("../Data/ship_voyages.pkl")

In [None]:
# Загрузка данных в формате "csv"
df = pd.read_csv("../Data/ship_voyages.csv", index_col=0)