In [68]:
import pandas as pd
import numpy as np
from sklearn.svm import SVC, LinearSVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
import optuna
from scipy.stats import zscore, norm
import plotly
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots

In [123]:
rand = pd.DataFrame(
	{
        'normal': np.random.normal(loc=10, size=10000),
        'lognormal': np.random.lognormal(size=10000),
        'binomail': np.random.binomial(100, 0.5, size=10000)
    }
)

rand['tang_normal'] = [np.tanh(x) for x in rand['normal']]
rand['not_normal'] = [np.random.randint(1, 500) for _ in range(len(rand['normal']))]

In [124]:
rand

Unnamed: 0,normal,lognormal,binomail,tang_normal,not_normal
0,9.760867,12.414584,60,1.0,120
1,9.669561,0.594703,56,1.0,236
2,9.832462,1.424922,47,1.0,150
3,10.117209,2.802335,44,1.0,73
4,9.229199,0.817654,50,1.0,387
...,...,...,...,...,...
9995,9.383256,2.199011,51,1.0,321
9996,8.760092,0.875120,57,1.0,324
9997,9.426829,0.126581,65,1.0,406
9998,9.877346,0.421020,56,1.0,368


In [125]:
fig = make_subplots(rows=3, cols=2)

fig.add_trace(go.Histogram({'x': rand['normal'], 'name': 'Normal'}), 1, 1)
fig.update_xaxes(
    title='Normal deviation values',
    row=1,
    col=1
)
fig.update_yaxes(
    title='Count',
    row=1,
    col=1
)

fig.add_trace(go.Histogram({'x': zscore(rand['normal']), 'name': 'Z-Normal'}), 1, 2)
fig.update_xaxes(
    title='Z_score deviation values',
    row=1,
    col=2
)
fig.update_yaxes(
    title='Count',
    row=1,
    col=2
)

fig.add_trace(go.Histogram({'x': [np.tanh(x) for x in zscore(rand['normal'])], 'name': 'TanhNormal'}), 2, 1)
fig.update_xaxes(
    title='Tanh from a_score values',
    row=2,
    col=1
)
fig.update_yaxes(
    title='Count',
    row=2,
    col=1
)

fig.add_trace(go.Histogram({'x': [np.arctanh(x) for x in [np.tanh(x) for x in zscore(rand['normal'])]], 'name': 'ArcTanh from Tanhnormal'}), 2, 2)
fig.update_xaxes(
    title='Restore normal deviation from tanh values',
    row=2,
    col=2
)
fig.update_yaxes(
    title='Count',
    row=2,
    col=2
)

fig.add_trace(go.Histogram({'x': rand['not_normal'], 'name': 'Not normal'}), 3, 1)
fig.update_xaxes(
    title='Restore normal deviation from tanh values',
    row=3,
    col=1
)
fig.update_yaxes(
    title='Count',
    row=3,
    col=1
)

fig.update_layout(
    title='Преобразование нормального распределения',
    legend_orientation="h",
    legend=dict(x=.62, y=-.2),
    margin=dict(l=20, r=10, t=80, b=10),
    hovermode="x"
)

fig.update_traces(hovertemplate="Аргумент: %{x}<br>"
                                "Функция: %{y}")
fig.show()

In [127]:
p = pd.DataFrame([1, 0, 1])
(p == 1).sum()

0    2
dtype: int64

In [2]:
data = np.arange(0, 10, 0.1)

def f(x):
    return np.tanh(x)

In [81]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=data, y=data, name='Normal'))
fig.add_trace(go.Scatter(x=data, y=f(data), name='Stepen'))
fig.update_layout(
    title='Title',
    xaxis_title='Title X',
    yaxis_title='Title Y',
    legend_orientation="h",
    legend=dict(x=.85, y=-.1),
    margin=dict(l=20, r=20, t=80, b=10),
    hovermode="x"
)
fig.update_traces(hovertemplate="Аргумент: %{x}<br>Функция: %{y}")
fig.show()

In [40]:
# создаем фигуру с 2 графиками
fig = make_subplots(rows=1, cols=3)

# создаем левый график с данными
fig.add_trace(go.Scatter(x=data, y=data, name='Normal'), 1, 1)
# подписываем оси левого графика row=1, col=1
fig.update_xaxes(
    title='Ось Х левого графика', row=1, col=1
)
fig.update_yaxes(
    title='Ось У левого графика', row=1, col=1
)

# создаем правый график с данными
fig.add_trace(go.Scatter(x=data, y=f(data), name='Stepen'), 1, 2)
# Подписываем оси правого графика row=1, col=2
fig.update_xaxes(
    title='Ось Х правого графика', row=1, col=2
)
fig.update_yaxes(
    title='Ось У правого графика', row=1, col=2
)

# создаем 3 график с данными
fig.add_trace(go.Histogram({'x': np.random.lognormal(sigma=0.1, size=100000)}), 1, 3)
fig.update_xaxes(
    title='Ось X самого правого графика', row=1, col=3
)
# обновляем всю фигуру
fig.update_layout(
    title='Title',
    legend_orientation="h",
    legend=dict(x=.85, y=-.1),
    margin=dict(l=20, r=20, t=80, b=10),
    hovermode="x"
)
fig.update_traces(hovertemplate="Аргумент: %{x}<br>"
                                "Функция: %{y}")
fig.show()

In [23]:
np.random.normal(loc=10, size=100)

array([10.79385491,  8.72561736, 10.74858365, 10.8848735 , 12.31747396,
       11.20304097, 10.40155289, 10.0834265 ,  9.01579871, 11.52893002,
        8.72903524, 11.92951387, 12.21058001, 10.29014537, 10.02400849,
       11.89369221,  9.80393977,  8.48403613, 10.01421999, 10.76769915,
        9.92218567,  8.76919753,  9.04080304,  8.56279258, 11.60399981,
        8.22127991,  9.34398835, 10.53202143,  7.91148936, 10.48356462,
       10.18302372,  8.82914554,  9.41048108, 10.56365406, 10.11550899,
       10.59848317,  9.09236926, 10.85723927, 10.16752746,  8.76134771,
        9.62656878,  8.64331097,  7.94277662,  9.74704736, 11.58998375,
       10.69155082, 10.07385243, 10.86985875, 10.57122053,  9.8588299 ,
        8.6916372 , 10.52154313,  9.60801274,  8.83822573,  8.4702037 ,
        9.93436577, 10.13523377, 10.23164259, 10.2669135 ,  9.88863386,
        9.02027229,  9.76016546,  8.47245882,  9.94402158, 11.35199252,
       11.0654412 ,  9.34787659,  9.80838478, 10.91667542,  9.86

In [6]:
# загрузим датасет
data = pd.read_csv('https://code.s3.yandex.net/datasets/users_behavior.csv')
data.name = 'megaline_users'
# выделим из датасета признаки и разметку
features = data.drop('is_ultra', axis=1)
target = data['is_ultra']
# разделим признаки и разметку на обучающую и валидационную выборки
features_train, features_valid, target_train, target_valid = train_test_split(features, target, test_size=0.25, random_state=12345)

In [9]:
optuna.visualization.plot_slice()

AttributeError: 'int' object has no attribute '_is_multi_objective'