# Matplotlib. Построение графиков 

1. Постройте график функции $y=\dfrac{1}{1+e^{-x}}$ при $x\in [-6; 6]$.
2. Оформите предыдущий график: добавьте подписи к осям, название рисунка (в виде $\LaTeX$-формулы).
3. Попробуйте изменить некоторые основные параметры: цвет, тип линии, толщину линии, тип и размер маркера.
4. Постройте два графика в одной системе координат: 
    - $y=\dfrac{1}{1+e^{-x}}$; 
    - $y=\dfrac{x}{\sqrt{1+x^2}}$. 
    
    Отрезок построения $x\in[-2.5; 2.5]$. Параметры линий и рисунка задайте самостоятельно. Легенду расположите в правом нижнем углу.
5. Постройте два графика из предыдущего пункта в разных системах координат, расположив их 
    - рядом по горизонтали с общей осью $Oy$ (параметр **sharey=True**); 
    - один под другим с общей осью $Ox$ (параметр **sharex=True**).
    
    Настройте параметры рисунка: шрифты, размер, подписи, легенду.
6. Постройте график функции
$$
f(x)=\left\{\begin{array}{l} \sin (-2x), \quad x\in [-2\pi; 0],\\
x^2-x, \quad x\in[0; 5].\end{array}\right.
$$
7. Постройте график процесса **случайного блуждания**: начальное состояние $x_0=0$, далее для каждого $i=\overline{1, 100}$: $x_i=x_{i-1}+N(0, \sigma)$, где $N(0, \sigma)$ --- некоторое случайное число, взятое из нормального распределения со средним $\mu=0$ и стандартным отклонением $\sigma$. Значение $\sigma$ выбрать произвольно.
8. Постройте графики случайного процесса
    - $x_0=0$;
    - $x_{i}=\alpha x_{i-1}+N(0, 1)$, $i=\overline{1, 100}$
    
    при различных $\alpha: 1, 0.8, 0.6, 0.4, 0.2$. Графики отобразите в одной системе координат различными цветами. В легенде укажите значение $\alpha$.

In [None]:
import matplotlib as mpl
import matplotlib.pyplot as plt


In [None]:
import numpy as np

x = np.linspace(-6, 6, 100)
y = 1/(1+np.exp(-x))
plt.plot(x, y)


plt.show()

In [None]:
x = np.linspace(-6, 6, 100)
y = 1/(1+np.exp(-x))
plt.plot(x, y)

plt.xlabel('x')
plt.ylabel('y')
plt.title(r'График $y=\dfrac{1}{1+e^{-x}}$')

plt.show()

In [None]:
x = np.linspace(-6, 6, 10)
y = 1/(1+np.exp(-x))
plt.plot(x, y, linestyle='dashdot', linewidth=2, color='pink', marker='o', markersize=12, markerfacecolor='white')

plt.xlabel('x')
plt.ylabel('y')
plt.title(r'График $y=\dfrac{1}{1+e^{-x}}$')

plt.show()

In [None]:
x = np.linspace(-2.5, 2.5, 10)
y_1 = 1/(1+np.exp(-x))
y_2 = x/(1+x**2)**0.5
plt.plot(x, y_1, label='$y=\dfrac{1}{1+e^{-x}}$', linestyle='solid', linewidth=2, color='b', marker='o', markersize=12)
plt.plot(x, y_2, label='$y=\dfrac{x}{\sqrt{1+x^2}}$', linestyle='dotted', linewidth=2, color='c', marker='s', markersize=6, markerfacecolor='white')

plt.xlabel('x')
plt.ylabel('y')

plt.legend(loc=4)

plt.show()

In [None]:
fig, ax = plt.subplots(1, 2, figsize=(12, 8), sharey=True)

mpl.rcParams.update({'font.size':22, 'font.family':'Sans Serif', 'font.weight':'bold'})


x = np.linspace(-2.5, 2.5, 10)
y_1 = 1/(1+np.exp(-x))
y_2 = x/(1+x**2)**0.5

ax[0].plot(x, y_1, label='$y=\dfrac{1}{1+e^{-x}}$', linestyle='solid', linewidth=2, color='b', marker='o', markersize=12)
ax[1].plot(x, y_2, label='$y=\dfrac{x}{\sqrt{1+x^2}}$', linestyle='dotted', linewidth=2, color='c', marker='s', markersize=6, markerfacecolor='white')

ax[0].legend(loc=4)
ax[1].legend(loc=4)

ax[0].set(xlabel='x', ylabel='y')
ax[1].set(xlabel='x')

ax[0].set_title(r'График $y=\dfrac{1}{1+e^{-x}}$')
ax[1].set_title(r'График $y=\dfrac{x}{\sqrt{1+x^2}}$');



In [None]:
fig, ax = plt.subplots(2, 1, figsize=(18, 8), sharex=True)

mpl.rcParams.update({'font.size':18, 'font.family':'Sans Serif', 'font.weight':'medium', 'font.style':'italic'})


y_1 = 1/(1+np.exp(-x))
y_2 = x/(1+x**2)**0.5

ax[0].plot(x, y_1, label='$y=\dfrac{1}{1+e^{-x}}$', linestyle='solid', linewidth=2, color='b', marker='o', markersize=12)
ax[1].plot(x, y_2, label='$y=\dfrac{x}{\sqrt{1+x^2}}$', linestyle='dotted', linewidth=2, color='c', marker='s', markersize=6, markerfacecolor='white');

ax[0].legend(loc=2)
ax[1].legend(loc=2)

ax[0].set(ylabel='y')
ax[1].set(xlabel='x', ylabel='y')

ax[0].set_title(r'График $y=\dfrac{1}{1+e^{-x}}$')
ax[1].set_title(r'График $y=\dfrac{x}{\sqrt{1+x^2}}$');

In [None]:
x = np.linspace(-2*np.pi, 0, 10000)
plt.plot(x, np.sin(-2*x))
x = np.linspace(0, 5, 10000)
plt.plot(x, x*x-x)

plt.show()

7. Постройте график процесса **случайного блуждания**: начальное состояние $x_0=0$, далее для каждого $i=\overline{1, 100}$: $x_i=x_{i-1}+N(0, \sigma)$, где $N(0, \sigma)$ --- некоторое случайное число, взятое из нормального распределения со средним $\mu=0$ и стандартным отклонением $\sigma$. Значение $\sigma$ выбрать произвольно.

In [None]:
L_y = [0]
y = 0
for i in range (1, 101):
    y = y + np.random.normal(0, 2)
    L_y.append(y)
plt.plot(L_y)
plt.show()
    

8. Постройте графики случайного процесса
    - $x_0=0$;
    - $x_{i}=\alpha x_{i-1}+N(0, 1)$, $i=\overline{1, 100}$
    
    при различных $\alpha: 1, 0.8, 0.6, 0.4, 0.2$. Графики отобразите в одной системе координат различными цветами. В легенде укажите значение $\alpha$.

In [None]:

fig, ax = plt.subplots(figsize=(18, 8), sharey=True)
A = [1, 0.8, 0.6, 0.4, 0.2]
for a in A:
    L_y = [0]
    y = 0
    for i in range (1, 101):
        y = a*y + np.random.normal(0, 2)
        L_y.append(y)
    plt.plot(L_y, label=a)
plt.legend(loc=0)
plt.show()

# Matplotlib. Визуализация числовых данных

In [None]:
import os
os.listdir('../input')

1. Загрузите набор данных **Cardiovascular Disease**. Обратите внимание, что при чтении в массив NumPy нужно пропустить строку-заголовок. 

2. Проверьте тип данных в массиве (атрибут **dtype**).

3. Визуализируйте распределение признака **age** наиболее подходящим образом. Что можно сказать об этом распределении?

4. Визуализируйте распределение признака **weight** наиболее подходящим образом. Много ли аномальных значений веса в датасете?

5. Визуализируйте пару признаков "рост" и "вес" в виде **scatter plot**. Настройте параметры.

6. Как отличается средний вес здоровых и больных пациентов? Визуализируйте ответ в виде **bar plot**.

7. Каково соотношение больных и здоровых в трёх различных группах по уровню холестерина? Визуализируйте ответ в виде **bar plot**.


In [None]:
cardio_data = np.loadtxt('../input/cardiovascular-disease-dataset/cardio_train.csv', delimiter=';', skiprows=1)
print(cardio_data[:5, :])
print(cardio_data.shape)

In [None]:
cardio_data.dtype

In [None]:
age = cardio_data[:, 1] / 365

fig, ax = plt.subplots(figsize=(20, 7))
plt.plot(age);

Не подходит

In [None]:
fig, ax = plt.subplots(figsize=(20, 7))
plt.scatter(cardio_data[:, 0], age, marker='v', s = 100);

Не подходит

In [None]:
fig, ax = plt.subplots(figsize=(20, 7))

ax.hist(age);

Похоже на нормальное распределение со средним примерно 53 года.


In [None]:
weight = cardio_data[:, 4]

fig, ax = plt.subplots(figsize=(20, 7))
plt.plot(weight);

Не очень

In [None]:
fig, ax = plt.subplots(figsize=(20, 7))
ax.hist(weight);

Нормально

In [None]:
fig, ax = plt.subplots(figsize=(20, 7))
plt.boxplot(weight, vert=False);

##### Аномальных явлений с весом меньше 40 и больше 110 достаточно много.

In [None]:
height = cardio_data[:, 3]


fig, ax = plt.subplots(figsize=(14, 7))
plt.scatter(height, weight)
plt.xlabel('height, cm')
plt.ylabel('weight, kg')
plt.title('Height vs. Weight');

Как отличается средний вес здоровых и больных пациентов? Визуализируйте ответ в виде **bar plot**.



In [None]:
fig, ax = plt.subplots()

plt.bar([1, 2], height=[np.mean(cardio_data[cardio_data[:, -1] == 0, 4]), np.mean(cardio_data[cardio_data[:, -1] == 1, 4])], color=['red', 'blue'])
ax.set_xticks([1, 2])
ax.set_xticklabels(['good', 'no_good']);

Каково соотношение больных и здоровых в трёх различных группах по уровню холестерина? Визуализируйте ответ в виде **bar plot**.

In [None]:
good = (cardio_data[(cardio_data[:, -1] == 0) & (cardio_data[:, 7] == 1), :].shape[0], cardio_data[(cardio_data[:, -1] == 0) & (cardio_data[:, 7] == 2), :].shape[0], 
        cardio_data[(cardio_data[:, -1] == 0) & (cardio_data[:, 7] == 3), :].shape[0])
no_good = (cardio_data[(cardio_data[:, -1] == 1) & (cardio_data[:, 7] == 1), :].shape[0], cardio_data[(cardio_data[:, -1] == 1) & (cardio_data[:, 7] == 2), :].shape[0], 
           cardio_data[(cardio_data[:, -1] == 1) & (cardio_data[:, 7] == 3), :].shape[0])

ind = np.arange(len(good))
width = 0.35

fig, ax = plt.subplots()
rects1 = ax.bar(ind - width/2, good, width,
                label='good')
rects2 = ax.bar(ind + width/2, no_good, width,
                label='no_good')

# Add some text for labels, title and custom x-axis tick labels, etc.
ax.set_ylabel('Numbers_of_holestirin')
ax.set_xlabel('Groups_of_holestirin')
ax.set_title('Health by group holestirin')
ax.set_xticks(ind)
ax.set_xticklabels(('H1', 'H2', 'H3'))
ax.legend();
