<a href="https://colab.research.google.com/github/vladislav805/baccara-neural/blob/v3/Untitled1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import requests
import os

import numpy as np
import pandas as pd

from typing import Tuple, Union, List, Optional

import tensorflow as tf

from time import time

import sys


import os.path
from tensorflow.python.keras import regularizers

tf.random.set_seed(13)

def do_bot(_):
    # Вычисляем коэффицинты нормализации из обучающего датасета
    # mean, sd = get_normalization_params()

    # Создаём обработчик для бота
    bot_handler = bot_factory()

    bot_handler()
    set_interval(bot_handler, 30)


def bot_factory():
    # Создаём и загружаем модель
    model = get_model(path=MODEL_TRAINED_PATH)

    def handler():
        # Получаем предыдущие игры
        last_signals, last_signal_id = get_last_signals()

        if len(last_signals) == 0 and last_signal_id is None:
            print('not enough data')
            return

        # Предсказываем
        (predict_orig, predict_norm) = predict_by_last_signals(model=model,
                                                               dataset=last_signals,
                                                               # mean=mean,
                                                               # sd=sd
                                                               )

        card = get_card_by_id(predict_norm)

        text = "Signal = {0}\nPredict = {1}\nNormalized predict = {2}\nCard = {3}".format(
            last_signal_id + 1,
            predict_orig,
            predict_norm,
            card,
        )

        for chat_id in BOT_TARGET_IDS:
            send_telegram_message(chat_id=chat_id, text=text)

    return handler


def send_telegram_message(chat_id: int, text: str):
    token = os.getenv('TG_TOKEN')

    if token is None:
        print('TG_TOKEN not set')
        exit(1)

    requests.get('https://api.telegram.org/bot' + token + '/sendMessage',
                 params={
                     'chat_id': chat_id,
                     'text': text
                 }).json()



# Путь exit(0)(название директории) к уже обученной модели
MODEL_TRAINED_PATH = 'trained'

# Индекс параметра, который будем предсказывать
DATASET_COLUMN_INDEX = 0

# Количество строк, по которым будем пытаться предсказывать
HISTORY_SIZE = 1

# Сколько вперед будем предсказывать
TARGET_SIZE = 1

# Куда слать сообщения
BOT_TARGET_IDS = [63923, 485056]





def split_dataset(dataset: pd.Series, by: int):
    return dataset[:by], dataset[by:]


# нет поддержки single_step = False
def multivariate_dataset(dataset,  # наш датасет (матрица)
                         column_index: int,  # какой столбец будем обучать
                         history_size: int,  # сколько строк в прошлом будем брать
                         target_size: int,  # сколько вперед считаем
                         ):
    xs = []  # параметры
    ys = []  # ответы

    # последняя итерация на элементе, индекс которого:
    end_index = len(dataset) - target_size + 1

    for i in range(history_size, end_index):
        start = i - history_size
        end = i

        # берем строки с индексом от `i` до `i + history_size`
        indexes = range(start, end)

        # добавляем их в массив с параметрами
        xs.append(normalize_dataset(dataset[indexes]))

        # добавляем ответ из строки `текущая + target`
        ys.append(card_to_vector(dataset[end][column_index]))

    return np.array(xs), np.array(ys)


# Названия колонок, которые будут использоваться как параметры

features_considered = [
    'cardPlayer1', 'cardPlayer2', 'mastPlayer1', 'mastPlayer2',
    'cardBanker1', 'cardBanker2', 'mastBanker1', 'mastBanker2',
]


def get_last_signal_id(dataset) -> int:
    return int(dataset[-1:]['signal_id'])


# Получить датасет, по которому будем обучать
def get_train_data() -> Tuple[pd.Series, int]:
    zip_path = tf.keras.utils.get_file(
        # origin='http://longpoll.ru/dev/export.php?since=51587&count=54158',
        origin='http://185.93.111.205/zalupa_na_provode.csv',
        fname='zalupa_na_provode')

    csv_path, _ = os.path.splitext(zip_path)

    df = pd.read_csv(csv_path)

    last_signal_id = get_last_signal_id(df)

    # Получение только выбранных колонок (параметров)
    features = df[features_considered]
    features.index = df['id']  # добавление индекса

    return features.values, last_signal_id


# Получить последние сигналы
def get_last_signals() -> Tuple[Union[pd.Series, list], Optional[int]]:
    try:
        ncrnd = str(time())
        path = tf.keras.utils.get_file(
            'last_games' + ncrnd,
            origin='http://185.93.111.205/dev/export.php?' + ncrnd,
        )

        df = pd.read_csv(path)

        last_signal_id = get_last_signal_id(df)

        last_games = df[features_considered]
        last_games.index = df['id']

        return last_games.values, last_signal_id
    except Exception:
        return [], None


def get_signals_in_range(start, end) -> Tuple[Union[pd.Series, list], Optional[int]]:
    try:
        path = tf.keras.utils.get_file(
            'games_since_{0}_{1}'.format(start, end),
            origin='http://52.18.14.99/dev/export.php?since={0}&count={1}'.format(start, end - start),
        )

        data = pd.read_csv(path)

        last_signal_id = get_last_signal_id(data)

        games = data[features_considered]
        games.index = data['id']

        return games.values, last_signal_id
    except Exception:
        return [], None


os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
# os.environ["CUDA_VISIBLE_DEVICES"] = "-1"



def get_model(path: str = None,  # Путь к модели
              input_shape: Optional[Tuple[int, int]] = None,  # Размерность входа
              train: bool = False,  # Нужно ли её обучать или просто прочитать?
              ) -> tf.keras.models.Model:
    exists = os.path.exists(path) if path is not None else False
    if not train:
        if exists:
            return tf.keras.models.load_model(path)
        else:
            raise FileNotFoundError('Trained model on path {} not found'.format(path))
    else:
        if exists:
            answer = input('Model on path {} already exists. Rewrite? (y - continue): ')
            if answer != 'y' and answer != 'н':
                exit(0)

        if path is not None:
            return create_model(input_shape=input_shape)
        else:
            raise FileNotFoundError('path not specified')


# Просто создаём модель
def create_model(input_shape):

    print(input_shape)
    # Создание модели
    model = tf.keras.models.Sequential()
    # , activation='softmax, dropout=0.1'
    model.add(tf.keras.layers.LSTM(40, input_shape=input_shape, activation="tanh"))
    # model.add(tf.keras.layers.BatchNormalization())
    model.add(tf.keras.layers.Dense(200, activation="relu"))
    model.add(tf.keras.layers.Dense(13, activation='softmax'))
    # model.add(tf.keras.layers.BatchNormalization())

    # Компиляция модели learning_rate=0.0000005
    model.compile(optimizer=tf.keras.optimizers.RMSprop(learning_rate=0.000005), loss='categorical_crossentropy')

    return model




def normalize_dataset(dataset: pd.DataFrame) -> Tuple[pd.DataFrame]:

    # Нормализация данных
    dataset = tf.keras.utils.normalize(dataset, axis=-1, order=2)

    return dataset


def normalize_value(value: float, mean: float, sd: float) -> float:
    return value * sd + mean


SINCE = 147141


def predict_by_last_signals(model,
                            dataset,
                            #mean: List[float],
                            #sd: List[float]
                            ):
    last_signals = dataset
    #last_signals, _, _ = normalize_dataset(dataset, mean, sd)

    # Формируем датасет
    dataset = tf.data.Dataset.from_tensors(last_signals) \
        .batch(1) \
        .repeat()

    # Берем из датасета одну матрицу
    item = dataset.take(1)

    if model is None:
        model = get_model(MODEL_TRAINED_PATH)

    predict = vector_to_card(model.predict(item)[0])

    # Предсказываем
    """
        predicted = normalize_value(
            predict,
            mean[DATASET_COLUMN_INDEX],
            sd[DATASET_COLUMN_INDEX])
    """
    return predict, int(np.fix(predict))


def do_predict(_):
    real = None

    # Если не укзано с какого сигнала брать (для тестов), то берем последние
    # Иначе берем от SINCE до SINCE + 720
    if SINCE is None:
        last_signals, last_signal_id = get_last_signals()
    else:
        last_signals, last_signal_id = get_signals_in_range(SINCE, SINCE + HISTORY_SIZE + 1)
        last_signals, real = split_dataset(last_signals, by=HISTORY_SIZE)

    # Получаем номер следущего сигнала
    target_signal_id = last_signal_id + 1

    # Вычисляем коэффицинты нормализации из обучающего датасета
    #mean, sd = get_normalization_params()

    # Создаём и загружаем модель
    model = get_model(path=MODEL_TRAINED_PATH)

    # Предсказываем
    predicted = predict_by_last_signals(model, last_signals)

    if SINCE is not None:
        print('predicted =', predicted, 'real =', real[0][DATASET_COLUMN_INDEX])
    else:
        print('in id = ', target_signal_id, 'predicted = ', predicted)


MASS_TEST_SINCE = 147141
MASS_TEST_ITERATIONS = 250


def do_mass_test(_):
    # mean, sd = get_normalization_params()
    passed = 0

    # Создаём и загружаем модель
    model = get_model(path=MODEL_TRAINED_PATH)

    for row_id in range(MASS_TEST_SINCE, MASS_TEST_SINCE + MASS_TEST_ITERATIONS):
        last_signals, last_signal_id = get_signals_in_range(row_id, row_id + HISTORY_SIZE + 1)
        last_signals, real = split_dataset(last_signals, by=HISTORY_SIZE)

        predicted, predicted_value = predict_by_last_signals(model=model,
                                                             dataset=last_signals,
                                                             # mean=mean,
                                                             # sd=sd
                                                             )
        val = real[0][DATASET_COLUMN_INDEX]
        print('predicted =', predicted, 'value =', predicted_value, 'real =', val)
        if val == predicted_value:
            passed = passed + 1

    print('passed ', passed, 'of', MASS_TEST_ITERATIONS, ', ', round(passed * 100 / MASS_TEST_ITERATIONS, 2), '%')

import matplotlib.pyplot as plt


DATASET_TRAIN_SPLIT = 24991

# tf.keras.backend.set_floatx('float64')


def get_normalization_params():
    dataset, _ = get_train_data()
    train, _ = split_dataset(dataset, DATASET_TRAIN_SPLIT)
    _, mean, sd = normalize_dataset(train)
    return mean, sd


def do_train(_: None):
    # скачали и подготовили датасет
    dataset, _ = get_train_data()

    train, validate = split_dataset(dataset, DATASET_TRAIN_SPLIT)

    # нормализовали данные для обучения
    # train = normalize_dataset(train)

    # разбили данные для обучения
    train_x, train_y = multivariate_dataset(
        dataset=train,
        column_index=DATASET_COLUMN_INDEX,
        history_size=HISTORY_SIZE,
        target_size=TARGET_SIZE,
    )

    # validate = normalize_dataset(validate)

    # разбили данные для валидации
    validate_x, validate_y = multivariate_dataset(
        dataset=validate,
        column_index=DATASET_COLUMN_INDEX,
        history_size=HISTORY_SIZE,
        target_size=TARGET_SIZE,
    )

    batch = 1

    train_dataset = tf.data.Dataset.from_tensor_slices((train_x, train_y))\
        .shuffle(1440)\
        .batch(batch) \
        .cache()\
        # .repeat()

    validate_dataset = tf.data.Dataset.from_tensor_slices((validate_x, validate_y))\
        .batch(batch)\
        # .repeat()

    print(validate_y)

    model = get_model(path=MODEL_TRAINED_PATH,
                      input_shape=(1, 8),
                      train=True)

    model_history = model.fit(
        train_dataset,
        validation_data=validate_dataset,
        validation_steps=1440,
        epochs=30,
        # steps_per_epoch=19280,
        # initial_epoch=10,
        batch_size=1,
        callbacks=[
            tf.keras.callbacks.ModelCheckpoint(
                filepath=MODEL_TRAINED_PATH,
                save_weights_only=False,
                save_best_only=True,
            )
        ],
        use_multiprocessing=True,
    )

    loss = model_history.history['loss']
    val_loss = model_history.history['val_loss']
    epochs = range(len(loss))
    plt.figure(1)
    plt.plot(epochs, loss, 'b', label='Training loss')
    plt.plot(epochs, val_loss, 'r', label='Validation loss')
    plt.legend(loc='upper left')
    plt.show()


import threading

def set_interval(func, sec):
    def func_wrapper():
        set_interval(func, sec)
        func()
    t = threading.Timer(sec, func_wrapper)
    t.start()
    return t


__cards = {
    1: '1️⃣',
    2: '2️⃣',
    3: '3️⃣',
    4: '4️⃣',
    5: '5️⃣',
    6: '6️⃣',
    7: '7️⃣',
    8: '8️⃣',
    9: '9️⃣',
    10: '🔟',
    11: "J",
    12: "Q",
    13: "K",
    14: "A",
}


def get_card_by_id(id: float) -> str:
    i = int(id)
    return 'UNKNOWN' if i not in __cards else __cards[i]


def card_to_vector(n: int) -> List[int]:
    vec = [0] * 13
    vec[n - 2] = 1
    return vec


def vector_to_card(vec) -> int:
    return numpy.argmax(vec) + 2



commands = {
    'train': do_train,
    'predict': do_predict,
    'bot': do_bot,
    'mass_test': do_mass_test,
}


do_mass_test(_)

FileNotFoundError: ignored