<a href="https://colab.research.google.com/github/dmitr2ish/MOMO_2023/blob/main/%D0%9B%D0%BE%D0%B3%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B2_sklearn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Цель Блокнота

Решение задачи классификации в scikit-learn с помощью линейной модели - логистическая регрессия
* Применение `LabelEncoding` для изменения целевой переменной
* Обучение класса `LogisticRegression` и анализ атрибутов
* Анализ модели для разных данных
* Сохранение модели

# Import библиотек

In [None]:
import pandas as pd # Библиотека Pandas для работы с табличными данными
import numpy as np # библиотека Numpy для операций линейной алгебры и прочего
import matplotlib.pyplot as plt # библиотека Matplotlib для визуализации
import seaborn as sns # библиотека seaborn для визуализации
import numpy as np # библиотека Numpy для операций линейной алгебры и прочего

import plotly.graph_objects as go # Библиотека Plotly. Модуль "Graph Objects"
import plotly.express as px # Библиотека Plotly. Модуль "Express"

# предварительная обработка числовых признаков
from sklearn.preprocessing import MinMaxScaler# Импортируем нормализацию от scikit-learn
from sklearn.preprocessing import StandardScaler # Импортируем стандартизацию от scikit-learn
from sklearn.preprocessing import PowerTransformer  # Степенное преобразование от scikit-learn
# предварительная обработка категориальных признаков
from sklearn.preprocessing import OneHotEncoder# Импортируем One-Hot Encoding от scikit-learn
from sklearn.preprocessing import OrdinalEncoder# Импортируем Порядковое кодированиеот scikit-learn
from sklearn.preprocessing import LabelEncoder# Импортируем LabelEncoder от scikit-learn

from sklearn.pipeline import Pipeline # Pipeline.Не добавить, не убавить

from sklearn.compose import ColumnTransformer # т.н. преобразователь колонок

from sklearn.base import BaseEstimator, TransformerMixin # для создания собственных преобразователей / трансформеров данных

In [None]:
import warnings
warnings.filterwarnings('ignore')

# Набор данных


Набор данных представляет собой статистику параметров автомобилей на вторичном рынке в Молдавии.

Набор включает ряд категориальных и численных значений, составляющих одну запись (строку). Число записей можно найти как число строк.

Каждый столбец в записи — это отдельный параметр.

Среди указанных параметров приведены целевой для задачи предсказания (регрессии) - цена автомобиля.

 Также среди параметров есть целевой для задачи классификации - тип трансмиссии.

 Последняя задача может быть рассмотрена, например, как пример задачи на заполнение пропусков (если продавец не указал соответствующий параметр).

# Загрузка данных

Загружаем наши данные из файла по прямой ссылке на git-hub

In [None]:
DF = pd.read_csv('https://raw.githubusercontent.com/dayekb/mpti_ml/main/data/cars_moldova_clean.csv', delimiter = ',')
DF

Unnamed: 0,Make,Model,Year,Style,Distance,Engine_capacity(cm3),Fuel_type,Transmission,Price(euro)
0,Toyota,Prius,2011,Hatchback,195000.0,1800.0,Hybrid,Automatic,7750.0
1,Renault,Grand Scenic,2014,Universal,135000.0,1500.0,Diesel,Manual,8550.0
2,Renault,Laguna,2012,Universal,110000.0,1500.0,Diesel,Manual,6550.0
3,Opel,Astra,2006,Universal,200000.0,1600.0,Metan/Propan,Manual,4100.0
4,Mercedes,Vito,2000,Microvan,300000.0,2200.0,Diesel,Manual,3490.0
...,...,...,...,...,...,...,...,...,...
32480,Volkswagen,Passat,2016,Sedan,88000.0,1800.0,Petrol,Automatic,11500.0
32481,Land Rover,Freelander,2002,Crossover,225000.0,1800.0,Metan/Propan,Manual,4400.0
32482,Dacia,Logan Mcv,2015,Universal,89000.0,1500.0,Diesel,Manual,7000.0
32483,Mazda,6,2006,Combi,370000.0,2000.0,Diesel,Manual,4000.0


Список числовых и категориальных данных

In [None]:
cat_columns = ['Make', 'Model', 'Style', 'Fuel_type', 'Transmission']
num_columns = ['Year', 'Distance', 'Engine_capacity(cm3)', 'Price(euro)']

Предварительная обработка из [раннего блокнота](https://colab.research.google.com/drive/1es_OrShFiuaeOnlPjX2B1geHDM-XfofM?usp=sharing)

Из предварительной обработки исключена колонка `Transmission`, поскольку она является целевой меткой и будет обработана отдельно


In [None]:
class QuantileReplacer(BaseEstimator, TransformerMixin):
    def __init__(self, threshold=0.05):
        self.threshold = threshold
        self.quantiles = {}

    def fit(self, X, y=None):
        for col in X.select_dtypes(include='number'):
            low_quantile = X[col].quantile(self.threshold)
            high_quantile = X[col].quantile(1 - self.threshold)
            self.quantiles[col] = (low_quantile, high_quantile)
        return self

    def transform(self, X):
        X_copy = X.copy()
        for col in X.select_dtypes(include='number'):
            low_quantile, high_quantile = self.quantiles[col]
            rare_mask = ((X[col] < low_quantile) | (X[col] > high_quantile))
            if rare_mask.any():
                rare_values = X_copy.loc[rare_mask, col]
                replace_value = np.mean([low_quantile, high_quantile])
                if rare_values.mean() > replace_value:
                    X_copy.loc[rare_mask, col] = high_quantile
                else:
                    X_copy.loc[rare_mask, col] = low_quantile
        return X_copy

In [None]:
class RareGrouper(BaseEstimator, TransformerMixin):
    def __init__(self, threshold=0.05, other_value='Other'):
        self.threshold = threshold
        self.other_value = other_value
        self.freq_dict = {}

    def fit(self, X, y=None):
        for col in X.select_dtypes(include=['object']):
            freq = X[col].value_counts(normalize=True)
            self.freq_dict[col] = freq[freq >= self.threshold].index.tolist()
        return self

    def transform(self, X, y=None):
        X_copy = X.copy()
        for col in X.select_dtypes(include=['object']):
            X_copy[col] = X_copy[col].apply(lambda x: x if x in self.freq_dict[col] else self.other_value)
        return X_copy

In [None]:
num_pipe_distance = Pipeline([
    ('QuantReplace', QuantileReplacer(threshold=0.01, )),
    ('scaler', StandardScaler())
])

num_distance = ['Distance']

num_pipe_engine = Pipeline([
    ('scaler', StandardScaler())
])

num_engine = ['Engine_capacity(cm3)']

num_pipe_year = Pipeline([
    ('power', PowerTransformer())
])

num_year = ['Year']

num_pipe_price = Pipeline([
    ('QuantReplace', QuantileReplacer(threshold=0.01, )),
    ('power', PowerTransformer())
])



num_price = ['Price(euro)']


cat_pipe_style_fuel = Pipeline([
    ('encoder', OneHotEncoder(drop='if_binary', handle_unknown='ignore', sparse_output=False))

])

cat_style_fuel = ['Style', 'Fuel_type']

cat_pipe_make = Pipeline([
    ('replace_rare', RareGrouper(threshold=0.001, other_value='Other')),
    ('encoder', OneHotEncoder(drop='if_binary', handle_unknown='ignore', sparse_output=False))
])

cat_make = ['Make']

cat_pipe_model = Pipeline([
    ('replace_rare', RareGrouper(threshold=0.0001, other_value='Other')),
    ('encoder', OneHotEncoder(drop='if_binary', handle_unknown='ignore', sparse_output=False))
])

cat_model = ['Model']

# Сделаем отдельно Pipeline с числовыми признаками
preprocessors_num = ColumnTransformer(transformers=[
    ('num_distance', num_pipe_distance, num_distance),
    ('num_engine', num_pipe_engine, num_engine),
    ('num_year', num_pipe_year, num_year),
    ('num_price', num_pipe_price, num_price),
])

# и Pipeline со всеми признаками
preprocessors_all = ColumnTransformer(transformers=[
    ('num_distance', num_pipe_distance, num_distance),
    ('num_engine', num_pipe_engine, num_engine),
    ('num_year', num_pipe_year, num_year),
    ('num_price', num_pipe_price, num_price),
    ('cat_style_fuel', cat_pipe_style_fuel, cat_style_fuel),
    ('cat_make', cat_pipe_make, cat_make),
    ('cat_model', cat_pipe_model, cat_model),
])

In [None]:
# объединяем названия колонок в один список (важен порядок как в ColumnTransformer)
columns_num = np.hstack([num_distance,
                    num_engine,
                    num_year,
                        num_price ])

# Логистическая Регрессия

In [None]:
from sklearn.linear_model import LogisticRegression # Логистичекая регрессия от scikit-learn

from sklearn.model_selection import train_test_split#  функция разбиения на тренировочную и тестовую выборку
# в исполнении scikit-learn

from sklearn.model_selection import StratifiedKFold # при кросс-валидации разбиваем данные в пропорции целевой метки
from sklearn.model_selection import cross_validate # функция кросс-валидации от Scikit-learn

from sklearn.metrics import f1_score # f1-мера от Scikit-learn
from sklearn.metrics import classification_report # функция scikit-learn которая считает много метрик классификации

**Считываем данные, разбиваем на тестовую и тренировочную**

In [None]:
# не забываем удалить целевую переменную "тип трансмиссии" из признаков
X,y = DF.drop(columns = ['Transmission']), DF['Transmission']

## Приводим целевые метки к 0 и 1

Для этого воспользуемся объектом `LabelEncoder()` из модуля `preprocessing`

Применение преобразований уже стандартное для нас

* Создаем объект
* обучаем методом `.fit()`
* Смотрим что получилось

In [None]:
Label = LabelEncoder()
Label.fit(y) # задаем столбец, который хотим преобразовать
Label.classes_ # в аттрибуте .classes_ хранится информация "какой класс как шифруется"

array(['Automatic', 'Manual'], dtype=object)

т.е. `0` это 'Automatic', а `1` это 'Manual'

In [None]:
target = Label.transform(y) # преобразуем и сохраняем в новую переменную

In [None]:
target # здесь уже только 0 и 1

array([0, 1, 1, ..., 1, 1, 1])

In [None]:
# разбиваем на тренировочную и валидационную
X_train, X_val, y_train, y_val = train_test_split(X, target,
                                                    test_size=0.3,
                                                    random_state=42)

# Оценим модель с использованием только числовых данных

**Преобразуем данные**

In [None]:
# Сначала обучаем на тренировочных данных
X_train_prep = preprocessors_num.fit_transform(X_train)
# потом на валидационной
X_val_prep = preprocessors_num.transform(X_val)

**Обучаем модель**



Стандартная уже для нас рутина

* Создаем объект класса
* "Обучаем" через `.fit`

In [None]:
model = LogisticRegression(random_state = 42)

model.fit(X_train_prep, y_train);

## Подготовим несколько функций для анализа обученной модели

Эти фунции были рассмотрены [ранее](https://colab.research.google.com/drive/1QE2uUp4dEJegxEFJsJHz-ct_tTXxZNHJ?usp=sharing)

Небольшая разница связана с форматом хранения аттрибута `coef_`





**вытаскивание коэффициентов из модели**

In [None]:
def get_coefs (model):
    """Берем веса как атрибуты обученной модели.
    Входные переменные:
    ===========
    model: обученная модель
    """
    B0=model.intercept_[0]
    B=model.coef_[0]
    return B0, B

**написание модели**

In [None]:
def print_model (B0,B,features_names):
    """Написание уравнения модели.
    Входные переменные:
    ===========
    B0: смещение (независимый коэффициент)
    weights: веса признаков
    features_names: список названий признаков
    """
    line='{:.3f}'.format(B0)
    sign=['+','-']
    for p,(fn,b) in enumerate(zip(features_names,B)):
        line=line+sign[int(0.5*(np.sign(b)-1))]+'{:.2f}*'.format(np.abs(b))+fn

    print('Решение')
    print(line)

**визуализации весов в виде столбчатых диаграмм**

In [None]:
def vis_weigths(weights,features_names = None, width = 1200, height = 600):
    """Отрисовка весов.
    Входные переменные:
    ===========
    weights: веса признаков
    features_names: список названий признаков
    """
    numbers = np.arange(0,len(weights))                 # создаем массив от 0 до количество весов-1
    if features_names:
        tick_labels = np.hstack(['B0',features_names])
    else:
        tick_labels = ['B'+str(num) for num in numbers] # создаем "названия" весов
    fig = go.Figure()
    fig.add_trace(go.Bar(x=numbers[weights<0], y=weights[weights<0],
                    marker_color='red',
                    name='отрицательные веса'))
    fig.add_trace(go.Bar(x=numbers[weights>=0], y=weights[weights>=0],
                    marker_color='blue',
                    name='положительные веса'
                    ))

    fig.update_layout(
                title="Веса модели",
                width=width,
                height=height,
                template = "plotly_dark",
                xaxis = dict(
                                         tickmode = 'array',
                                         tickvals = numbers,
                                         ticktext = tick_labels,
                                         )
                )

    fig.show()

### Напишем уравнение модели

In [None]:
B0, B = get_coefs(model)
features_names = list(columns_num)
print_model(B0,B,features_names)

Решение
0.249+0.10*Distance-1.04*Engine_capacity(cm3)-0.61*Year-0.98*Price(euro)


### Визуализируем веса в виде столбчатых диаграмм

In [None]:
Bs = np.hstack([B0,B])
vis_weigths(Bs,features_names)

## Оценка метрик

In [None]:
def calculate_metric(model_pipe, X, y, metric = f1_score):
    """Расчет метрики.
    Параметры:
    ===========
    model_pipe: модель или pipeline
    X: признаки
    y: истинные значения
    metric: метрика (f1 - по умолчанию)
    """
    y_model = model_pipe.predict(X)
    return metric(y, y_model)

In [None]:
print(f"f1 на тренировочной выборке: {calculate_metric(model, X_train_prep, y_train):.4f}")
print(f"f1 на валидационной выборке: {calculate_metric(model, X_val_prep, y_val):.4f}")

f1 на тренировочной выборке: 0.8115
f1 на валидационной выборке: 0.8168


In [None]:
print(classification_report(y_val, model.predict(X_val_prep), target_names=Label.classes_))

              precision    recall  f1-score   support

   Automatic       0.78      0.75      0.77      4383
      Manual       0.80      0.83      0.82      5363

    accuracy                           0.79      9746
   macro avg       0.79      0.79      0.79      9746
weighted avg       0.79      0.79      0.79      9746



## Кросс-валидация

In [None]:
def cross_validation (X, y, model, scoring, cv_rule):
    """Расчет метрик на кросс-валидации.
    Параметры:
    ===========
    model: модель или pipeline
    X: признаки
    y: истинные значения
    scoring: словарь метрик
    cv_rule: правило кросс-валидации
    """
    scores = cross_validate(model,X, y,
                      scoring=scoring, cv=cv_rule )
    print('Ошибка на кросс-валидации')
    DF_score = pd.DataFrame(scores)
    display(DF_score)
    print('\n')
    print(DF_score.mean()[2:])

In [None]:
scoring_clf = {'ACC': 'accuracy',
           'F1': 'f1',
           'Precision': 'precision',
           'Recall': 'recall'}

In [None]:
cross_validation (X_train_prep, y_train,
                  model,
                  scoring_clf,
                  StratifiedKFold(n_splits=5, shuffle= True, random_state = 42))

Ошибка на кросс-валидации


Unnamed: 0,fit_time,score_time,test_ACC,test_F1,test_Precision,test_Recall
0,0.022736,0.014546,0.786939,0.808687,0.79257,0.825474
1,0.021977,0.014168,0.793536,0.815774,0.794725,0.837969
2,0.022876,0.028702,0.796174,0.81734,0.799537,0.835953
3,0.074142,0.026178,0.789358,0.812083,0.790982,0.834341
4,0.065395,0.034324,0.781614,0.804643,0.785632,0.824597




test_ACC          0.789524
test_F1           0.811705
test_Precision    0.792689
test_Recall       0.831667
dtype: float64


Небольшие выводы по модели:

* используя только 4 числовых признака можно с достаточно хорошо предсказывать тип трансмиссии

* модель выглядит "логично": с ростом пробега "увеличивается" вероятность того что автомобиль - с ручной коробкой, а с ростом объема двигателя, цены и года - вероятность того что автомобиль с автоматической коробкой

## Объединяем Pipeline Предобработки и Модель

Синтаксис - тот же
Список из
* имен
* объектов

In [None]:
pipe_num = Pipeline([
    ('preprocessors', preprocessors_num),
    ('model', LogisticRegression(random_state = 42))
])

Чтобы "обратиться" к части Pipeline - достаточно помнить "имя"

In [None]:
pipe_num['preprocessors']

In [None]:
pipe_num['model']

Так же обучаем через `.fit()`

In [None]:
pipe_num.fit(X_train, y_train)

In [None]:
B0, B = get_coefs(pipe_num['model'])
features_names = list(columns_num)

print_model (B0,B,features_names)

Решение
0.249+0.10*Distance-1.04*Engine_capacity(cm3)-0.61*Year-0.98*Price(euro)


In [None]:
print(f"f1 на тренировочной выборке: {calculate_metric(pipe_num, X_train, y_train):.4f}")
print(f"f1 на валидационной выборке: {calculate_metric(pipe_num, X_val, y_val):.4f}")

f1 на тренировочной выборке: 0.8115
f1 на валидационной выборке: 0.8168


In [None]:
print(classification_report(y_val, pipe_num.predict(X_val), target_names=Label.classes_))

              precision    recall  f1-score   support

   Automatic       0.78      0.75      0.77      4383
      Manual       0.80      0.83      0.82      5363

    accuracy                           0.79      9746
   macro avg       0.79      0.79      0.79      9746
weighted avg       0.79      0.79      0.79      9746



In [None]:
cross_validation (X_train, y_train,
                  pipe_num,
                  scoring_clf,
                  StratifiedKFold(n_splits=5, shuffle= True, random_state = 42))

Ошибка на кросс-валидации


Unnamed: 0,fit_time,score_time,test_ACC,test_F1,test_Precision,test_Recall
0,0.122271,0.034512,0.786719,0.8083,0.792943,0.824264
1,0.161947,0.033702,0.793316,0.815542,0.794646,0.837565
2,0.159984,0.033587,0.795954,0.817107,0.79946,0.83555
3,0.152562,0.033422,0.789358,0.812157,0.79076,0.834744
4,0.153778,0.033003,0.786673,0.811431,0.783408,0.841532




test_ACC          0.790404
test_F1           0.812907
test_Precision    0.792244
test_Recall       0.834731
dtype: float64


# Оценим влияние категориальных признаков

In [None]:
pipe_all = Pipeline([
    ('preprocessors', preprocessors_all),
    ('model', LogisticRegression(random_state = 42))
    ])

In [None]:
pipe_all.fit(X_train, y_train)

In [None]:
cat_style_fuel_names = pipe_all['preprocessors'].transformers_[4][1]['encoder'].get_feature_names_out(cat_style_fuel)
cat_make_names =  pipe_all['preprocessors'].transformers_[5][1]['encoder'].get_feature_names_out(cat_make)
cat_model_names =  pipe_all['preprocessors'].transformers_[6][1]['encoder'].get_feature_names_out(cat_model)

# объединяем названия колонок в один список (важен порядок как в ColumnTransformer)
columns = np.hstack([num_distance,
                    num_engine,
                    num_year,
                     num_price,
                    cat_style_fuel_names,
                    cat_make_names,
                    cat_model_names])

In [None]:
B0, B = get_coefs(pipe_all['model'])
features_names = list(columns)

print_model (B0,B,features_names)

Решение
-1.667+0.04*Distance-0.70*Engine_capacity(cm3)-1.03*Year-0.63*Price(euro)-0.71*Style_Cabriolet+0.22*Style_Combi-0.09*Style_Coupe-0.73*Style_Crossover-0.22*Style_Hatchback+0.27*Style_Microvan+0.11*Style_Minivan+0.91*Style_Pickup+0.70*Style_Roadster-0.71*Style_SUV-0.21*Style_Sedan+0.05*Style_Universal+2.51*Fuel_type_Diesel-2.92*Fuel_type_Electric-1.65*Fuel_type_Hybrid+1.64*Fuel_type_Metan/Propan+1.80*Fuel_type_Petrol-1.79*Fuel_type_Plug-in Hybrid+0.90*Make_Alfa Romeo-1.04*Make_Audi-0.86*Make_BMW+0.36*Make_Chevrolet-1.44*Make_Chrysler+0.23*Make_Citroen+2.96*Make_Dacia+1.07*Make_Daewoo-1.21*Make_Dodge+0.66*Make_Fiat+0.76*Make_Ford+0.06*Make_Honda+0.13*Make_Hyundai-1.27*Make_Infiniti-1.15*Make_Jaguar-0.21*Make_Jeep+0.03*Make_KIA-0.92*Make_Land Rover-1.59*Make_Lexus-0.94*Make_Lincoln+0.11*Make_Mazda-1.34*Make_Mercedes-0.37*Make_Mini-0.13*Make_Mitsubishi+0.73*Make_Nissan+0.71*Make_Opel+0.05*Make_Other+0.12*Make_Peugeot-1.29*Make_Porsche+0.01*Make_Rare+0.59*Make_Renault+0.19*Make_Rover

**Модификация функции для отрисовки весов**

In [None]:
def vis_weigths_threshold(weights, feature_names, threshold, width = 1200, height = 600):
    """Отрисовка весов с фильтром.
    Входные переменные:
    ===========
    weights: веса признаков
    features_names: список названий признаков
    threshold: порог "значимости" коэффициентов
    """
    # фильтруем веса коэффициентов
    mask = np.abs(weights) >= threshold
    weights_filtered = weights[mask]
    feature_names_filtered = [name for name, m in zip(feature_names, mask[1:]) if m]

    # Рисуем столбчатую диаграмму
    vis_weigths(weights_filtered,feature_names_filtered, width = width, height = height)

In [None]:
Bs = np.hstack([B0,B])
vis_weigths_threshold(Bs,columns, 1,  width = 1600)

In [None]:
print(f"f1 на тренировочной выборке: {calculate_metric(pipe_all, X_train, y_train):.4f}")
print(f"f1 на валидационной выборке: {calculate_metric(pipe_all, X_val, y_val):.4f}")

f1 на тренировочной выборке: 0.8742
f1 на валидационной выборке: 0.8716


In [None]:
print(classification_report(y_val, pipe_all.predict(X_val), target_names=Label.classes_))

              precision    recall  f1-score   support

   Automatic       0.86      0.82      0.84      4383
      Manual       0.85      0.89      0.87      5363

    accuracy                           0.86      9746
   macro avg       0.86      0.85      0.85      9746
weighted avg       0.86      0.86      0.86      9746



In [None]:
cross_validation (X_train, y_train,
                  pipe_all,
                  scoring_clf,
                  StratifiedKFold(n_splits=5, shuffle= True, random_state = 42))

Ошибка на кросс-валидации


Unnamed: 0,fit_time,score_time,test_ACC,test_F1,test_Precision,test_Recall
0,3.309735,0.121347,0.851143,0.865701,0.852344,0.879484
1,2.997742,0.185084,0.859719,0.873663,0.8587,0.889158
2,4.365328,0.096603,0.855321,0.870879,0.848566,0.894397
3,2.765385,0.089904,0.852902,0.868643,0.846861,0.891576
4,3.014287,0.092323,0.849351,0.866185,0.840091,0.893952




test_ACC          0.853687
test_F1           0.869014
test_Precision    0.849312
test_Recall       0.889713
dtype: float64


Небольшие выводы по модели:

* категориальные признаки дают прирост качества предсказания (метрика Accuracy на кросс-валидации растет с `0.78` до `0.85`

* добавляется интерпритация некоторых категориальных признаков: некоторые категории "увеличивают" вероятность того что автомобиль - с ручной коробкой, а другие -  вероятность того что автомобиль с автоматической коробкой

# Про то как Сохранять Модель

In [None]:
from joblib import dump, load # в scikit-learn ничего такого особенного нет
# пользуемся joblib

In [None]:
dump(model, 'model.joblib')  # чтобы сохранить объект
dump(pipe_num, 'pipe_num.joblib')  # чтобы сохранить объект
dump(pipe_all, 'pipe_all.joblib')  # чтобы сохранить объект

['pipe_all.joblib']

In [None]:
pipe_load = load('pipe_all.joblib')  # чтобы загрузить из файла в формате joblib

In [None]:
pipe_load