# НИС «Основы анализа данных в Python»

*Алла Тамбовцева*

## Дополнительные задачи на классы

### Задача 1

Определите класс `DiscreteVar`, который описывает объект типа *дискретная величина*.

Атрибуты класса:

* `.values`: значения дискретной случайной величины (тип `numpy.array`);
* `.probs`: вероятности, соответствующие заданным значениям (тип `numpy.array`);
* `.pairs`: пары значение-вероятность в виде кортежей (тип `list`, внутри элементы типа `tuple`);
* `.n`: число значений.

Методы класса:

* `.expectation()`: вычисляет на основе `.values` и `.probs` математическое ожидание (тип `float`);
* `.variance()`: вычисляет на основе `.values` и `.probs` дисперсию (тип `float`).

Пример кода для создания объекта такого класса на основе списков:

    dv = DiscreteVar([-1, 0, 2], [0.2, 0.5, 0.3])

Уточнение: давайте пока считать, что на вход пользователь подает корректные массивы (одинаковой длины) с корректными значениями (дробные вероятности, сумма вероятностей 1). 

Дополнительно можно доработать этот класс – проверять условия, в случае их невыполнения в `.values`, `.probs` и `.pairs` сохранять пустые массивы/списки, в `.n` – 0, при вызове методов показывать сообщения об ошибках.

In [None]:
### YOUR CODE HERE ###

### Задача 2

Определите класс `DiscreteProblem`, который описывает *задачу на описание дискретной случайной величины*.

Атрибуты класса:

* все, что были у объекта класса `DiscreteVar`;
* `.missing`: добавлять пропуск одной случайно выбранной вероятности или нет (тип `bool`, по умолчанию `False`);
* `.text`: текст задачи (тип `str`, шаблон строки – см ниже, по умолчанию – пустая строка);
* `.answer`: текст ответа (тип `str`, шаблон строки – см ниже, по умолчанию – пустая строка).

Методы класса:

* все, что были у объекта класса `DiscreteVar`;
* `.generate_text()`: изменяет значение `.text` с пустой строки на сгенерированный текст;
* `.generate_answer()`: изменяет значение `.answer` с пустой строки на сгенерированный текст.

**Пояснения**

Код

    problem = DiscreteProblem([-1, 0, 2], [0.2, 0.5, 0.3])
                    
создает объект класса `DiscreteProblem`, где в `.missing` сохранено `False`, в `.text` и `.answer` – пустые строки `''`. После вызова метода `.generate_text()` значение `.text` изменяется на текст задачи (без пропущенной вероятности), после вызова метода `.generate_answer()` значение `.answer` изменяется на текст ответа. 

Код:

    problem = DiscreteProblem([-1, 0, 2], [0.2, 0.5, 0.3], missing = True)
                    
проделывает то же самое, только в тексте задачи в `.text` вместо случайно выбранной вероятности стоит `?`.

In [None]:
### YOUR CODE HERE ###

### Текстовые шаблоны для задачи 2

Как на основе двух списков со значениями и вероятностями получить код LaTeX для таблицы?
Пусть нам нужна такая таблица:

<img src="https://quicklatex.com/cache3/7d/ql_2ecb2f2f202096bb21cdd62ec379677d_l3.png">

Код LaTeX для такой таблицы выглядит так:

In [None]:
"""
\begin{tabular}{cccc}
\hline
X &   -1 & 0 & 2 \\
\hline
p &  0.2 & 0.5 & 0.3 \\
\hline
\end{tabular}
"""

Как получить такой код, если есть готовые списки значений? Зафиксируем сами списки и их длину:

In [32]:
values = [-1, 0, 2]
probs = [0.2, 0.5, 0.3]
n = len(values)

Какая часть кода LaTeX зависит от длины списков и их значений? 

* Во-первых, фрагмент в `{}` после `\begin{tabular}`. Буква `c` означает выравнивание текста в столбце по центру, а количество таких букв совпадает с числом столбцов. Число столбцов в таблице на 1 больше, чем число значений в списках, так как есть еще один столбец с названиями строк `X` и `p`. 

* Во-вторых, фрагмент после `X` и до `\\` и аналогичный фрагмент после `p` и до `\\`. Эти фрагменты представляют собой значения списков, объединенные через `&`.

Вот нехитрый код, который сгенерирует нам подходящие фрагменты:

In [33]:
# повторяем букву n+1 раз
# превращаем числа в текст и склеиваем через &

cols_letters = "c" * (n + 1)
row01 = " & ".join([str(v) for v in values])
row02 = " & ".join([str(p) for p in probs])

print(cols_letters)
print(row01)
print(row02)

cccc
-1 & 0 & 2
0.2 & 0.5 & 0.3


Подставляем результаты выше в шаблон через `%s`:

In [34]:
# r в начале – чтобы не «съедались» слэши,
# они воспринимаются как спец символы

text_template = r"""
\begin{tabular}{%s}
\hline
X &   %s \\
\hline
p &  %s \\
\hline
\end{tabular}
""" % (cols_letters, row01, row02)

print(text_template)


\begin{tabular}{cccc}
\hline
X &   -1 & 0 & 2 \\
\hline
p &  0.2 & 0.5 & 0.3 \\
\hline
\end{tabular}



Вуаля, у вас есть готовый код, который на основе списков генерирует табличку! Если добавить к коду LaTeX условие задачи вида «дан ряд распределения случайной величины, найдите E(X) и D(X)», получим значение атрибута `.text` для класса `DiscreteProblem`. Осталось подумать, как выполнить замену одного из значений `p` на `?` при `missing = True`.

А со значением атрибута `.answer` все просто: подставьте в строку ниже значения математического ожидания и дисперсии.

    E(X) = [value1]
    D(X) = [value2]