# Игра угадай число

*также смотри [технические данные о среде выполнения](#технические-данные-о-среде-выполнения)

## Предпосылки

Для завершения модуля "PYTHON-8. Инструменты для Data Science" ставится задача требующая навыков владения инструментами, изложенными в данном модуле. Для этого предоставляется код, созданный к этому моменту в рамках модуля.

Давайте проверим его работоспособность.

### Импортируем функции модуля

In [1]:
from game_v2 import score_game
from game_v2 import random_predict

Здесь мы делаем доступными функции модуля game_v2:
- *score_game* - функция, выявляющая через [среднее арифмитическое](https://ru.wikipedia.org/wiki/Среднее_арифметическое) за сколько попыток переданная ей функция поиска находит результат;
- *random_predict* - функция поиска заданного числа [методом научного тыка](https://ru.wikipedia.org/wiki/Метод_проб_и_ошибок) без запоминания истории, возвращающая количество потребовавшихся попыток.

### Проверим работоспособность *random_predict* несколько раз

In [7]:
score_game(random_predict)
score_game(random_predict)
score_game(random_predict)
score_game(random_predict)
score_game(random_predict)

Ваш алгоритм угадывает число в среднем за:98 попыток
Ваш алгоритм угадывает число в среднем за:96 попыток
Ваш алгоритм угадывает число в среднем за:101 попыток
Ваш алгоритм угадывает число в среднем за:96 попыток
Ваш алгоритм угадывает число в среднем за:99 попыток


99

Как видим, количество требующихся для нахождения заданного числа попыток варьируется около 100.

## Постановка задачи

Взяв предоставленный код за отправную точку добиться следующего:
- новая программа должна достигать результата менее чем за 20 попыток;
- код программы должен быть предоставлен через GitHub;
- также, созданный для решения данной задачи код необходимо оформить соответствующим для GitHub образом;
- поскольку код создаётся на языке Python он должен соответствовать PEP8;
- как и любой другой код, необходимо, чтобы он был воспроизводим;
- **согласно пункту 2 условий задания, должна быть реализована функция которая:**
  - для каждой попытки использует случайное число из известного нам диапазона
  - начальный диапазон - от 1 до 100;
  - очередной диапазон определяется из предыдущего путём отсечения по информации - меньше или больше искомого числа выбранное на предыдущей попытке число.

*P.S.: поскольку последний пункт (выделенный жирным) не учитвался при составлении кода, то для его реализации добавлена дополнительная функция (см. раздел [Создание функции поиска методом тыка](#создание-функции-поиска-методом-тыка))*

МЕТРИКА КАЧЕСТВА

Результаты оцениваются по среднему количеству попыток при 1000 повторений.

## Выбор алгоритма

Возьмём за основу [алоритм бинарного поиска](https://ru.wikipedia.org/wiki/Двоичный_поиск). Следуя его правилам поиск числа от 1 до 100 не должен превысить 7 шагов.

Так, например, если загадано число 1, то следуя правилу не оставлять ниже выбранного для попытки числа меньше вариантов чем выше, получим следующие шаги:
1. 100/2 = 50 => 51
2. 50/2 = 25 => 26
3. 25/2 = 12.5 => 13
4. 12/2 = 6 => 7
5. 6/2 = 3 => 4
6. 3/2 = 1.5 => 2
7. 1/2 = 0.5 => 1

## Организация кода

Для обратной совместимости оставим предоставленный код в оригинальном виде. А новый код оформим в файле [*result_game.py*](result_game.py).

Предоставим информацию по задаче отредактировав файл [*README.md*](README.md).

Воспользуемся имеющимся Jupyter Notebook [*game.ipynb*](game.ipynb), чтобы более подробно зафиксировать процесс выполнения задачи.

## Создание функции поиска

Создадим функцию *binary_search*:

In [11]:
from math import log2

def binary_search(hidden_number=1):
    
    interval = (1, 101) # mathematially half-open left-closed interval - [1, 101)
    max_attempts_to_panic = int(1 + log2(len(range(*interval))))
    
    for attempt_index in range(max_attempts_to_panic):
        
        predict_number = int(sum(interval) / 2)
        
        if predict_number == hidden_number:
            return attempt_index+1

        if predict_number < hidden_number:
            interval = (predict_number+1, interval[1])
        elif hidden_number < predict_number:
            interval = (interval[0], predict_number)

    raise RuntimeError('Algorithm working not like expected')

И проверим её работоспособность уже имеющейся функцией *score_game*:

In [35]:
from game_v2 import score_game

score_game(binary_search)
score_game(binary_search)
score_game(binary_search)
score_game(binary_search)
score_game(binary_search)

Ваш алгоритм угадывает число в среднем за:5 попыток
Ваш алгоритм угадывает число в среднем за:5 попыток
Ваш алгоритм угадывает число в среднем за:5 попыток
Ваш алгоритм угадывает число в среднем за:5 попыток
Ваш алгоритм угадывает число в среднем за:5 попыток


5

Таким образом легко убедиться в значительном преимуществе функции *binary_search* перед изначальной *random_predict*.

Также, можно заметить, что функция *binary_search* использует самоограничение по количеству попыток. Это сделано для того для того, чтобы случайно внесённая (или не выявленная при создании функции) ошибка не приводила к бесконечному циклу.

Убедимся в полезности этого самоограничения.

In [56]:
binary_search(0)

RuntimeError: Algorithm working not like expected

Однако, если задать выходящее за диапазон число 101:

In [58]:
binary_search(101)

7

То мы увидим, что фунция отработала, но не ожиданным образом. А именно нашла число не входящее в диапазон.

Что очередной раз свидетельствует о необходимости проверки входных параметров. Доработаем функцию *binary_search*.

In [4]:
from math import log2

def binary_search(hidden_number=1):
    if not(1 <= hidden_number <= 100):
        raise ValueError('Expected value from 1 to 100')
    
    interval = (1, 101) # mathematially half-open left-closed interval - [1, 101)
    max_attempts_to_panic = int(1 + log2(len(range(*interval))))
    
    for attempt_index in range(max_attempts_to_panic):
        
        predict_number = int(sum(interval) / 2)
        
        if predict_number == hidden_number:
            return attempt_index+1

        if predict_number < hidden_number:
            interval = (predict_number+1, interval[1])
        elif hidden_number < predict_number:
            interval = (interval[0], predict_number)

    raise RuntimeError('Algorithm working not like expected')

Проверим снова:

In [60]:
binary_search(101)

ValueError: Expected value from 1 to 100

Теперь можно сказать, что функция работает как надо. И хотя необходимость проверки входных параметров на соответсвие типу никто не отменял, будем считать, что поставленная задача выполнена. Поскольку в реальных задачах проверка входных параметров истекает из логики построения кода и излишние проверки только замедлят выполнение кода поставленной задачи.

## Проверка функции поиска

Используя существующую функцию *score_game* мы убедились в качестве созданной функции *binary_search*. Задание, тем не менее гласит: "новая программа должна достигать результата менее чем за 20 попыток".

Создадим аналогичную *score_game* функцию для такой проверки и назовём её *reveal_max_attempts*.

In [5]:
import numpy as np

def reveal_max_attempts(search_function,
                       number_of_repetitions: int = 1000) -> int:
    
    hidden_numbers = np.random.randint(1, 101, size=number_of_repetitions)
    
    attempts_count = []
    for hidden_number in hidden_numbers:
        attempts_count.append(search_function(hidden_number))
        
    max_attempt_count = max(*attempts_count)
    print(f'Search algorithm needs maximum {max_attempt_count} attempts count')
    
    return max_attempt_count

И на практике убедимся в достаточности функции *binary_search*:

In [5]:
reveal_max_attempts(binary_search)
reveal_max_attempts(binary_search)
reveal_max_attempts(binary_search)
reveal_max_attempts(binary_search)
reveal_max_attempts(binary_search)

Search algorithm needs maximum 7 attempts count
Search algorithm needs maximum 7 attempts count
Search algorithm needs maximum 7 attempts count
Search algorithm needs maximum 7 attempts count
Search algorithm needs maximum 7 attempts count


7

## Оценка функции поиска

Ранее мы воспользовались предоставленной функцией *score_game* для оценки функции *binary_search*. Но, чтобы эта функциональность была доступна в создаваемом модуле, а также код соответствовал PEP8, создадим функцию *score_attempts*.

In [3]:
import numpy as np

def score_attempts(search_function,
                   number_of_repetitions: int = 1000) -> int:
    
    hidden_numbers = np.random.randint(1, 101, size=number_of_repetitions)
    
    attempts_count = []
    for hidden_number in hidden_numbers:
        attempts_count.append(search_function(hidden_number))
    
    score = int(np.mean(attempts_count))
    print(f'Search algorithm needs {score} attempts')
    
    return score

И воспользуемся ей:

In [7]:
score_attempts(binary_search)
score_attempts(binary_search)
score_attempts(binary_search)
score_attempts(binary_search)
score_attempts(binary_search)

Search algorithm needs 5 attempts
Search algorithm needs 5 attempts
Search algorithm needs 5 attempts
Search algorithm needs 5 attempts
Search algorithm needs 5 attempts


5

Как видно, количество шагов уменьшилось в 20 раз.

## Создание функции поиска методом тыка

Создадим функцию *random_binary_search*, которая совмещает в себе случайный выбор очередного числа и сужение диапазона поиска.

In [1]:
import numpy as np

def random_binary_search(hidden_number: int = 1) -> int:
    if not(1 <= hidden_number <= 100):
        raise ValueError('Expected value from 1 to 100')
    
    if not(1 <= hidden_number <= 100):
        raise ValueError('Expected value from 1 to 100')
    
    interval = (1, 101) # mathematially half-open left-closed interval - [1, 101)
    max_attempts_to_panic = 1 + len(range(*interval))
    
    for attempt_index in range(max_attempts_to_panic):
        
        predict_number = np.random.randint(*interval)

        if predict_number == hidden_number:
            return attempt_index+1

        if predict_number < hidden_number:
            interval = (predict_number+1, interval[1])
        elif hidden_number < predict_number:
            interval = (interval[0], predict_number)

    raise RuntimeError('Algorithm working not like expected')

## Оценка функции поиска методом тыка

### Согласно метрике качества

In [16]:
score_attempts(random_binary_search)
score_attempts(random_binary_search)
score_attempts(random_binary_search)
score_attempts(random_binary_search)
score_attempts(random_binary_search)

Search algorithm needs 7 attempts
Search algorithm needs 7 attempts
Search algorithm needs 7 attempts
Search algorithm needs 7 attempts
Search algorithm needs 7 attempts


7

### На максимальное количество попыток

In [28]:
reveal_max_attempts(random_binary_search)
reveal_max_attempts(random_binary_search)
reveal_max_attempts(random_binary_search)
reveal_max_attempts(random_binary_search)
reveal_max_attempts(random_binary_search)

Search algorithm needs maximum 16 attempts count
Search algorithm needs maximum 18 attempts count
Search algorithm needs maximum 16 attempts count
Search algorithm needs maximum 17 attempts count
Search algorithm needs maximum 17 attempts count


17

### Факты

- функция *random_binary_search* (основанная на методе тыка), как и функция *binary_search* (основанная на половинном делении), является сходящейся и выполняется за ограниченное количество шагов. В отличии от функции *random_predict*
- согласно метрике качества (функция *score_attempts*):
  - функция *binary_search* выполняется за 5 шагов
  - функция *random_binary_search* выполняется за 7 шагов
  - функция *random_predict* выполняется за 100 шагов
- согласно *reveal_max_attempts* (максимальное количество шагов в большинстве случаев):
  - функция *binary_search* - 7 шагов
  - функция *random_binary_search* - 18 шагов
  - функция *random_predict* - 850 шагов
- для реализации функции *random_binary_search* не требуется знание и воплощение специальных теорий. В отличии от функции *binary_search*

In [33]:
from game_v2 import random_predict

reveal_max_attempts(random_predict)
reveal_max_attempts(random_predict)
reveal_max_attempts(random_predict)
reveal_max_attempts(random_predict)
reveal_max_attempts(random_predict)

Search algorithm needs maximum 759 attempts count
Search algorithm needs maximum 832 attempts count
Search algorithm needs maximum 620 attempts count
Search algorithm needs maximum 670 attempts count
Search algorithm needs maximum 575 attempts count


575

### Выводы

- для достижения цели достаточна функция *random_binary_search*
- функция *binary_search* требует:
  - специальных знаний
  - дополнительного времени на их воплощение (написание и отладка кода)
- функция *binary_search* (по сравнению с функцией *random_binary_search*) не предлагает значительный прирост в большинстве случаев
- функция *random_binary_search* в большинстве случаев укладывается в 20 шагов

Я бы сравнил функции *binary_search* и *random_binary_search* как результат работы: 1) программиста по заданию аналитика, и; 2) дата сайентиста.

Т.е.:
- для поиска быстрого решения следует создать такую функцию, как *random_binary_search*
- а при необходимости и возможности можно создать специальную версию, такую как функция *binary_search*

## GitHub

Для того, чтобы опубликованый на GitHub код был доступен для понимания без необходимости его изучения, оформим поясняющий файл [*README.md*](README.md).

## Технические данные о среде выполнения

In [4]:
import sys
print(sys.version)

3.9.12 (main, Apr 18 2022, 22:40:46) 
[GCC 9.4.0]


In [10]:
#pip freeze
#pip freeze > requirements.txt
#pip install -r requirements.txt