 Развертывание веб-приложения для моделей машинного обучения 

# Streamlit

Streamlit - это быстрый способ создать приложение для обработки данных

Допустим, вам нужно быстро создать приложение для обработки данных. Оно может включать в себя панель инструментов и работать с моделью. Или, если вам нужен быстрый прототип для демонстрации заказчику, что можно сделать за несколько часов и бесплатно.

Streamlit  подходит для этих задач. 

Сделаем  простой дашборд с выбором типа ирисов и построением гистограмм. Также в Streamlit вы можете обучать и создавать модели вывода.

In [None]:
### УСТАНОВКА
!pip install streamlit

Collecting streamlit
[?25l  Downloading https://files.pythonhosted.org/packages/8f/5c/ab7eb2b8577469981707ae2c8e3709c9fe99cca0026cad4bedaa1d980c56/streamlit-0.81.1-py2.py3-none-any.whl (8.2MB)
[K     |████████████████████████████████| 8.2MB 6.6MB/s 
[?25hCollecting gitpython
[?25l  Downloading https://files.pythonhosted.org/packages/f3/2b/92c1bab288255e6bf3ec9e11218eb19ce507f374e7f253029a46e3c1cb1e/GitPython-3.1.16-py3-none-any.whl (166kB)
[K     |████████████████████████████████| 174kB 37.3MB/s 
Collecting blinker
[?25l  Downloading https://files.pythonhosted.org/packages/1b/51/e2a9f3b757eb802f61dc1f2b09c8c99f6eb01cf06416c0671253536517b6/blinker-1.4.tar.gz (111kB)
[K     |████████████████████████████████| 112kB 46.6MB/s 
Collecting base58
  Downloading https://files.pythonhosted.org/packages/b8/a1/d9f565e9910c09fd325dc638765e8843a19fa696275c16cc08cf3b0a3c25/base58-2.1.0-py3-none-any.whl
Collecting watchdog; platform_system != "Darwin"
[?25l  Downloading https://files.pythonhos

В этих строках мы импортируем библиотеки streamlit и pandas, назначая им, соответственно, псевдонимы st и pd. Мы, кроме того, импортируем пакет datasets из библиотеки scikit-learn (sklearn). Мы воспользуемся этим пакетом ниже, в команде iris = datasets.load_iris(), для загрузки интересующего нас набора данных. И наконец, тут мы импортируем функцию RandomForestClassifier() из пакета sklearn.ensemble.

In [None]:
import streamlit as st
import pandas as pd
from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

В этой строке мы описываем заголовок боковой панели, используя функцию st.sidebar.header(). Обратите внимание на то, что тут sidebar стоит между st и header(), что и даёт полное имя функции st.sidebar.header(). Эта функция сообщает библиотеке streamlit о том, что мы хотим поместить заголовок в боковую панель.

In [None]:
st.sidebar.header('User Input Parameters')

<streamlit.delta_generator.DeltaGenerator at 0x1ea88905ee0>

Здесь мы объявляем функцию user_input_features(), которая берёт данные, введённые пользователем (то есть — четыре характеристики цветка, которые вводятся с использованием ползунков), и возвращает результат в виде датафрейма. Стоит отметить, что каждый входной параметр вводится в систему с помощью ползунка. Например, ползунок для ввода длины чашелистика (sepal length) описывается так: st.sidebar.slider(‘Sepal length’, 4.3, 7.9, 5.4). Первый из четырёх входных аргументов этой функции задаёт подпись ползунка, выводимую выше него. Это, в данном случае, текст Sepal length. Два следующих аргумента задают минимальное и максимальное значения, которые можно задавать с помощью ползунка. Последний аргумент задаёт значение, выставляемое на ползунке по умолчанию, при загрузке страницы. Здесь это — 5.4.

In [None]:
def user_input_features():
    sepal_length = st.sidebar.slider('Sepal length', 4.3, 7.9, 5.4)
    sepal_width = st.sidebar.slider('Sepal width', 2.0, 4.4, 3.4)
    petal_length = st.sidebar.slider('Petal length', 1.0, 6.9, 1.3)
    petal_width = st.sidebar.slider('Petal width', 0.1, 2.5, 0.2)
    data = {'sepal_length': sepal_length,
            'sepal_width': sepal_width,
            'petal_length': petal_length,
            'petal_width': petal_width}
    features = pd.DataFrame(data, index=[0])
    return features

In [None]:
df = user_input_features()

Здесь датафрейм, сформированный функцией user_input_features() записываем в переменную df.

In [None]:
iris = datasets.load_iris()

Загрузка набора данных Iris из пакета sklearn.datasets и запись его в переменную iris.

Создание переменной Х, содержащей сведения о 4 характеристиках цветка, которые имеются в iris.data.


Создание переменной Y, которая содержит сведения о виде цветка. Эти сведения хранятся в iris.target.

In [None]:
X = iris.data
Y = iris.target


Здесь мы, пользуясь функцией RandomForestClassifier(), назначаем классификатор, основанный на алгоритме «случайный лес», переменной clf

In [None]:
clf = RandomForestClassifier()

Здесь мы, пользуясь функцией RandomForestClassifier(), назначаем классификатор, основанный на алгоритме «случайный лес», переменной clf.

In [None]:
clf.fit(X, Y)

RandomForestClassifier()


Получение сведений о виде цветка с помощью обученной модели.

In [None]:
prediction = clf.predict(df)


Получение сведений о прогностической вероятности.

In [None]:
prediction_proba = clf.predict_proba(df)

# Формирование основной панели

Здесь мы, пользуясь функцией st.write(), выводим текст. А именно, речь идёт о заголовке, выводимом в главной панели приложения, текст которого задан в формате Markdown. Символ # используется для указания того, что текст является заголовком. За строкой заголовка идёт строка обычного текста

In [None]:
st.write("""
# Simple Iris Flower Prediction App
This app predicts the **Iris flower** type!
""")

В этой строке, пользуясь функцией st.subheader(), мы указываем подзаголовок, выводимый в основной панели. Этот подзаголовок используется для оформления раздела страницы, в котором будет выведено содержимое датафрейма, то есть того, что было введено пользователем с помощью ползунков.

In [None]:
st.write(df)

Этой командой мы выводим на основную панель содержимое датафрейма df.

In [None]:
st.subheader('Class labels and their corresponding index number')

<streamlit.delta_generator.DeltaGenerator at 0x1ea88905e80>


Данный код описывает второй подзаголовок основной панели. В этом разделе будут выведены данные о видах цветков.

In [None]:
st.write(iris.target_names)

здесь, во второй раздел основной панели, выводятся названия видов цветков (setosa, versicolor и virginica) и соответствующие им номера (0, 1, 2)

In [None]:
st.subheader('Prediction')

<streamlit.delta_generator.DeltaGenerator at 0x1ea88905e80>

Вывод третьего подзаголовка для раздела, в котором будет находиться результат классификации.

Вывод результата классификации. Стоит отметить, что содержимое переменной prediction — это номер вида цветка, выданный моделью на основе входных данных, введённых пользователем. Для того чтобы вывести название вида, используется конструкция iris.target_names[prediction].

In [None]:
st.write(iris.target_names[prediction])

Выводим заголовок четвёртого (и последнего) раздела основной панели. Здесь будут представлены данные о прогностической вероятности.


In [None]:
st.subheader('Prediction Probability')

<streamlit.delta_generator.DeltaGenerator at 0x1ea88905e80>

Вывод данных о прогностической вероятности.

In [None]:
st.write(prediction_proba)

NameError: name 'prediction_proba' is not defined

# Запуск веб-приложения

In [None]:
streamlit run iris-ml-app.py

## Задание. Развернуть модель для задачи кредитного скоринга

Просмотреть и добавить 

Создание и развертывание веб-приложений машинного обучения с использованием Pycaret, Streamlit и Heroku   
    
    https://analyticsindiamag.com/guide-to-building-and-deploying-ml-web-applications-using-pycaret-streamlit-and-heroku/

Примеры
https://leaveprediction.herokuapp.com/
    
    
Установка

https://docs.streamlit.io/en/stable/installation.html


Пример разработки приложения

https://docs.streamlit.io/en/stable/tutorial/create_a_data_explorer_app.html#


https://ichi.pro/ru/kak-sozdat-prilozenie-dla-klassifikacii-izobrazenij-s-ispol-zovaniem-logisticeskoj-regressii-i-myslenia-nejronnoj-seti-33604303553365


Как развернуть приложение

https://docs.streamlit.io/en/stable/deploy_streamlit_app.html

https://medium.com/bloggers-bay/give-life-to-your-data-science-apps-using-streamlit-9b61dfe1085d

https://nuancesprog.ru/p/5097/

https://blog.skillfactory.ru/nauka-o-dannyh-data-science/kak-napisat-veb-prilozhenie-dlya-demonstratsii-data-science-proekta-na-python/
