### NumPy

#### 1.1 Основы

**Зачем нужен NumPy?**

Основное преимущество NumPy заключается в его **высокой производительности**.  Библиотека NumPy написана на языке C, что обеспечивает **значительное ускорение** операций по сравнению с выполнением аналогичных действий с использованием стандартных циклов Python. В области машинного обучения **постоянно возникает необходимость работать с векторами и матрицами**, и NumPy предоставляет для этого **структуру данных `ndarray`**, которая идеально подходит для эффективного представления и обработки многомерных массивов.

Массивы NumPy (`ndarray`) обладают важной особенностью: они могут хранить **только данные одного типа** (например, только целые числа `int` или только числа с плавающей точкой `float`).  Это ограничение компенсируется **существенным выигрышем в скорости выполнения операций**, поскольку NumPy может эффективно организовывать данные в памяти и использовать оптимизированные алгоритмы для их обработки.

**Создание массива NumPy**

Самый простой способ создать массив NumPy – это **преобразовать существующий список Python** в массив NumPy с помощью функции `np.array()`.

In [2]:
import numpy as np # NumPy принято сокращать как np для краткости
python_list = [1, 2, 3, 4, 5]
numpy_array = np.array(python_list)

print(python_list)
print(numpy_array)
print(type(numpy_array))

[1, 2, 3, 4, 5]
[1 2 3 4 5]
<class 'numpy.ndarray'>


Ключевые характеристика массивов Numpy:     
1. __Однородность типа данных (dtype):__ Все элементы должны быть одного типа данных. Это может быть и __int__ и __float__ и __bool__ и многое другое. Проверть тип данных можно с помощью атрибута __.dtype__.
```python
        print(numpy_array.dtype)
```
2. __Размерность (ndim):__ Количество измерений массива. Вектор - одномерный массив (ndim = 1), матрица - двумерный (ndim = 2), и т.д. Размерность можно узнать с помощью атрибута **.ndim**.
```python
        print(numpy_arraay.ndim)
```
3. **Форма (shape):** Размер массива по каждому измерению. Форма возвращается в виде кортежа (tuple). Для одномерного массива форма - это количество элемнтов. Для двумерного - количество строк и столбцов. Форму можно узнать с помощью атрибута **.shape**.
```python 
        print(numpy_array.shape)
```

In [None]:
python_list_of_lists = [[1, 2, 3], [4, 5, 6]]

numpy_matrix = np.array(python_list_of_lists)

print(numpy_matrix, '\n', type(numpy_matrix), '\n', 
      numpy_matrix.dtype, '\n', numpy_matrix.ndim, '\n', numpy_matrix.shape)


----

#### 1.2 Базовые операции c векторами и матрицами

* **Поэлементные операции:**

   Операции NumPy применяются к каждому элементу массива **независимо**.  При сложении двух массивов **одинаковой формы**, элементы на **соответствующих позициях** складываются поэлементно.

In [None]:
array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])

print('Сумма:', array1 + array2)
print('Разность', array2 - array1)
print('Произведение', array1 * array2)
print('Деление', array2 / array1) # при делении тип данных автоматически меняется на float

##### Векторы

1. **Векторные операции:**  Векторные операции – это операции, которые выполняются над массивами NumPy как над векторами.  Векторы, по сути, являются **одномерными массивами чисел**, над которыми можно производить различные базовые операции, включая вычисление **скалярного произведения**.

In [None]:
vector = np.array([1, 2, 3])
scalar = 2

scaled_vector = vector * scalar
print('Исходный вектор:', vector)
print('Скаляр:', scalar)
print('Вектор, умноженный на скаялр:', scaled_vector)

2. **Сложение и вычитание векторов:**  Сложение и вычитание векторов **возможно только** для векторов **одинаковой длины**.

In [None]:
vector1 = np.array([1, 2, 3])
vector2 = np.array([4, 5, 6])

print('Вектор 1:', vector1)
print('Вектор 2:', vector2)
print('Сумма векторов:', vector1 + vector2)
print('Разность векторов:', vector2 - vector1)

3. **Скалярное произведение векторов (dot product):** Скалярное произведение двух векторов **одинаковой длины** – это **сумма произведений их соответствующих элементов**.

    * Способ первый: функция **`np.dot()`**
    * Способ второй: оператор **`@`**

In [None]:
vector3 = np.array([1, 2, 3])
vector4 = np.array([4, 5, 6])

print('Вектор 3:', vector3)
print('Вектор 4:', vector4)
print('Скаллярное произведение (np.dot):', np.dot(vector3, vector4))
print('Скалярное произведение (@):', vector3 @ vector4, ' - приоритетный вариант')

---

#### Матрицы
Матрицы в NumPy **представлены** как двумерные массивы (`ndarray` с `ndim=2`).

1. **Создание матриц:**

In [None]:
matrix1 = np.array([[1, 2, 3], [4, 5, 6]])
print('Матрица 1:\n', matrix1)

2. **Поэлементальные операции с матрицами:**

In [None]:
matrix2 = np.array([[7, 8, 9], [10, 11, 12]])

print('\nМатрица 1:\n', matrix1)
print('\nМатрица 2:\n', matrix2)
print('\nПоэлементальная сумма матриц:\n', matrix1 + matrix2)
print('\nПоэлементальная разность матриц:\n', matrix2 - matrix1)
print('\nПоэлементальное произведение матриц:\n', matrix1 * matrix2)
print('\nПоэлементальная деление матриц:\n', matrix2 / matrix1)

3. **Матричное умножение:**

   **Важно:** Матричное умножение – это **не** поэлементное умножение! Это принципиально иная операция, которая определяется правилами линейной алгебры.

   * **Правило матричного умножения:**  Для того чтобы матрицу A можно было умножить на матрицу B, **количество столбцов матрицы A должно быть равно количеству строк матрицы B**.  Если матрица A имеет размерность (m x n), а матрица B имеет размерность (n x p), то результатом матричного умножения будет матрица C размерности (m x p).

   * Элемент C[i, j] результирующей матрицы C вычисляется как **скалярное произведение i-й строки матрицы A и j-го столбца матрицы B**.

   * В NumPy для выполнения матричного умножения используются функция **`np.dot()`** и оператор **`@`**.

In [None]:
matrix3 = np.array([[1, 2], [3, 4]])
matrix4 = np.array([[5, 6, 7], [8, 9, 10]])

matrix_product = matrix3 @ matrix4

print('\nМатрица 1:\n', matrix3)
print('\nМатрица 2:\n', matrix4)
print('\nМатричное произведение:\n', matrix_product)


4. **Транспонирование матрицы:**

   Транспонирование – это операция, которая **меняет местами** строки и столбцы матрицы.  В NumPy транспонированную матрицу можно получить, используя **атрибут `.T`**.

In [None]:
matrix5 = np.array([[1, 2, 3], [4, 5, 6]])
matrix5_transposed = matrix5.T
print('\nМатрица 5:\n', matrix5)
print('\nТранспонированная матрица:\n', matrix5_transposed)

___

#### **Индексация и срезы**


1. **Индексация одномерных массивов:**

In [None]:
vector = np.array([10, 20, 30, 40, 50])
 
first_element = vector[0] # Первый элемент
second_element = vector[1] # Второй элемент
last_element = vector[-1] # Последний элемент
penultimate_element = vector[-2] # Предпоследний элемент 

print('Исходный вектор:', vector)   
print('Первый элемент', first_element)
print('Второй элемент', second_element)
print('Последний элемент', last_element)
print('Предпоследний элемент', penultimate_element)

2. **Индексация двумерных массивов (матриц):**

   В двумерных массивах, каждый элемент **определяется двумя индексами**: номером строки и номером столбца.  Индексация, как и в одномерных массивах, **начинается с 0**.

   Для доступа к конкретному элементу матрицы, необходимо указать **оба индекса через запятую** внутри квадратных скобок, в следующем порядке: `matrix[номер_строки, номер_столбца]`.

In [None]:
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

element_0_0 = matrix[0, 0] # Элемент в 0-й строке и 0-м столбце
element_1_2 = matrix[1, 2] # Элемент в 1-й строке и 2-м столбце
element_2_1 = matrix[2, 1] # Элемент в 2-й строке и 1-и стобце
element_last_row_last_col = matrix[-1, -1] # Последний элемент

print("Исходная матрица:\n", matrix)
print("Элемент [0, 0]:", element_0_0)
print("Элемент [1, 2]:", element_1_2)
print("Элемент [2, 1]:", element_2_1)
print("Последний элемент [-, -]:", element_last_row_last_col)

3. **Срезы (slicing) одномерных массивов:**

   Срезы (slicing) позволяют **выделить диапазон элементов** из массива.  Для указания диапазона используется **синтаксис срезов**: `[start:stop:step]`.

In [None]:
vector_slice = np.array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100])

slice_1_to_4 = vector_slice[1:5]    # Элементы с индексами 1, 2, 3, 4 (до 5, не включая 5)
slice_from_begin_to_3 = vector_slice[:4] # С начала до индекса 4 (не включая 4)
slice_from_5_to_end = vector_slice[5:]   # С индекса 5 до конца
slice_even_indices = vector_slice[::2]  # Каждый второй элемент (шаг 2)
slice_reverse = vector_slice[::-1]     # В обратном порядке (шаг -1)

print("Исходный вектор:", vector_slice)
print("Срез [1:5]:", slice_1_to_4)
print("Срез [:4]:", slice_from_begin_to_3)
print("Срез [5:]:", slice_from_5_to_end)
print("Срез [::2]:", slice_even_indices)
print("Срез [::-1]:", slice_reverse)

4. **Срезы матриц:**

   Для двумерных массивов (матриц) срезы применяются **отдельно для строк и для столбцов**, и указываются **через запятую**.  Общий синтаксис среза матрицы выглядит следующим образом:
   ```python
   matrix[срез_строки, срез_столбца]
   ```

In [None]:
matrix_slice = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16]])

slice_rows_0_to_2 = matrix_slice[0:3, :]    # Строки с 0 по 2 (не включая 3), все столбцы (:)
slice_cols_1_to_3 = matrix_slice[:, 1:4]    # Все строки (:), столбцы с 1 по 3 (не включая 4)
slice_top_left_2x2 = matrix_slice[:2, :2]   # Верхний левый угол 2x2
slice_bottom_right_2x2 = matrix_slice[2:, 2:] # Нижний правый угол 2x2
slice_every_other_row_col = matrix_slice[::2, ::2] # Каждая вторая строка и каждый второй столбец

print("Исходная матрица:\n", matrix_slice)
print("\nСрез строк [0:3, :]:\n", slice_rows_0_to_2)
print("\nСрез столбцов [:, 1:4]:\n", slice_cols_1_to_3)
print("\nСрез верхний левый 2x2:\n", slice_top_left_2x2)
print("\nСрез нижний правый 2x2:\n", slice_bottom_right_2x2)
print("\nСрез каждая вторая строка/столбец:\n", slice_every_other_row_col)

---

#### Изменение формы массивов

Для изменения формы массива используется метод `.reshape()`.
**Важно помнить:** **Общее количество элементов массива должно оставаться неизменным!**
*   При изменении формы, произведение размеров измерений (например, строк и столбцов) должно быть равно исходному количеству элементов.
1. **Преобразование одномерного массива в двумерный:**

In [None]:
vector_reshape = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
print("Исходный вектор:\n", vector_reshape)
print("Форма исходного вектора:", vector_reshape.shape) # (12,)

# Мы можем преобразовать его в матрицу 3x4 (3 строки, 4 столбца), потому что 3 * 4 = 12:

matrix_reshaped_3x4 = vector_reshape.reshape((3, 4)) # Обрати внимание на двойные скобки!
print("\nМатрица 3x4:\n", matrix_reshaped_3x4)
print("Форма матрицы 3x4:", matrix_reshaped_3x4.shape) # (3, 4)

2. **Преобразование двумерного массива в одномерный:**

   Возможно и обратное действие – "развернуть" матрицу (двумерный массив) в вектор (одномерный массив).  Рассмотрим, например, матрицу 3x4, созданную ранее:

In [None]:
print("\nИсходная матрица 3x4:\n", matrix_reshaped_3x4)
print("Форма исходной матрицы:", matrix_reshaped_3x4.shape) # (3, 4)

vector_reshaped_again = matrix_reshaped_3x4.reshape((12,)) # Или можно просто reshape(-1)
print("\nВектор из матрицы:\n", vector_reshaped_again)
print("Форма вектора:", vector_reshaped_again.shape) # (12,)

3. **Использование `-1` в `reshape()` для автоматического размера:**

   В методе `.reshape()` можно указать `-1` для одного из размеров. NumPy **автоматически вычислит этот размер**, исходя из общего количества элементов и других размеров.

   **Преимущества `-1`:**

   *   **Автоматический расчет размера:**  NumPy сам определяет нужный размер.
   *   **Удобство:**  Избавляет от ручных вычислений.
   *   **Гибкость кода:**  Код работает с массивами разного размера (если это возможно для `reshape`).

In [None]:
print("Исходная матрица 3x4:\n", matrix_reshaped_3x4)
print("Форма исходной матрицы:", matrix_reshaped_3x4.shape) # (3, 4)

matrix_reshaped_auto_rows = matrix_reshaped_3x4.reshape((-1, 2)) # -1 для автоматического расчета строк, 2 столбца
print("\nМатрица с авто-строками и 2 столбцами:\n", matrix_reshaped_auto_rows)
print("Форма матрицы:", matrix_reshaped_auto_rows.shape) # (6, 2) - получилось 6 строк и 2 столбца

---

#### **Бродкастинг (транслирование)**

Бродкастинг – это **мощный механизм NumPy**, позволяющий выполнять **арифметические операции** с массивами **разных форм** при условии их **совместимости**.  Хотя на первый взгляд это может показаться сложным, на практике бродкастинг – **интуитивно понятный и очень полезный** инструмент.

**Правила транслирования:**

1.  **Сравнение размерностей:** Размерности массивов сравниваются **справа налево**.
2.  **Условия совместимости:** Размерности **совместимы**, если выполняется **хотя бы одно** из условий:
    *   Размерности **равны**.
    *   Одна из размерностей равна **1**.
3.  **Выравнивание размерностей:** К массиву с **меньшим числом размерностей** **слева** добавляются "единичные" размерности для выравнивания размерности.
1.  **Скаляр и массив:**

In [None]:
scalar_broadcast = 2
vector_broadcast = np.array([1, 2, 3])
matrix_broadcast = np.array([[1, 2], [3, 4]])

vector_scaled_broadcast = vector_broadcast * scalar_broadcast
matrix_scaled_broadcast = matrix_broadcast * scalar_broadcast

print("Скаляр:", scalar_broadcast)
print("Вектор:\n", vector_broadcast)
print("Матрица:\n", matrix_broadcast)
print("\nВектор, умноженный на скаляр (транслирование):\n", vector_scaled_broadcast)
print("\nМатрица, умноженная на скаляр (транслирование):\n", matrix_scaled_broadcast)

2. **Транслирование вектора и матрицы (транслирование по строкам):**

   Для того чтобы транслировать вектор **по столбцам** матрицы, необходимо **преобразовать вектор в вектор-столбец** с помощью метода `.reshape()`.

In [None]:
matrix_broadcast_2 = np.array([[1, 2, 3], [4, 5, 6]]) # Матрица 2x3
vector_col_broadcast = np.array([100, 200]).reshape((2, 1)) # Вектор-столбец (форма (2, 1))

matrix_plus_col = matrix_broadcast_2 + vector_col_broadcast

print("\nМатрица:\n", matrix_broadcast_2)
print("Вектор-столбец:\n", vector_col_broadcast)
print("\nМатрица + вектор-столбец (транслирование по столбцам):\n", matrix_plus_col)

Здесь вектор-столбец `[[100], [200]]` **транслируется** и **"растягивается"** для соответствия столбцам матрицы.  Вектор-столбец **повторяется** для каждого столбца матрицы и **поэлементно прибавляется** к каждому столбцу.

**Преимущества транслирования:**

*   **Краткость кода:**  Транслирование позволяет **избежать циклов**, делая код **компактнее, выразительнее и легче для чтения**.
*   **Эффективность:**  Операции транслирования в NumPy **выполняются очень эффективно**, часто **быстрее циклов Python**.  NumPy использует оптимизированный векторизованный код на C/Fortran для бродкастинга.

---

#### Зачем нужны универсальные функции (ufuncs)?

**Производительность:** Ufuncs в NumPy написаны на C, что обеспечивает **значительное ускорение** операций. Ufuncs **намного быстрее** циклов Python. В областях, где **скорость важна**, например, в машинном обучении, ufuncs **необходимы** для эффективности.

**Удобство:** Ufuncs делают код NumPy **лаконичнее и читаемее**. Вместо циклов для обработки элементов, можно **вызвать ufunc для массива целиком**. Это упрощает код и уменьшает вероятность ошибок.

**Векторизация:** Ufuncs **обеспечивают векторизацию вычислений**. **Векторизация** - это применение операций **к массивам целиком**, а не к элементам по отдельности. **Векторизованный код** с ufuncs **быстрее и эффективнее** кода на циклах Python.

**Типы универсальных функций (ufuncs):**

Ufuncs делятся на типы в зависимости от количества входных массивов:

* **Унарные ufuncs:**  Работают **с одним массивом**. Примеры:
    * **Математические:** `np.abs()`, `np.sqrt()`, `np.exp()`, `np.log()`, `np.sin()`, `np.cos()`, `np.tan()`, `np.floor()`, `np.ceil()`, `np.round()` и др.
    * **Логические:** `np.logical_not()`.

* **Бинарные ufuncs:** Работают **с двумя массивами (поэлементно)**. Примеры:
    * **Арифметические:** `np.add()`, `np.subtract()`, `np.multiply()`, `np.divide()`, `np.power()`, `np.mod()`. **Важно:** **арифметические операторы Python** (`+`, `-`, `*`, `/`, `**`, `%`) **тоже ufuncs**, это "синтаксический сахар" для `np.add()`, `np.subtract()` и т.д.
    * **Логические:** `np.logical_and()`, `np.logical_or()`, `np.logical_xor()`, `np.equal()`, `np.not_equal()`, `np.less()`, `np.greater()`, `np.less_equal()`, `np.greater_equal()`.
    * **Битовые:** `np.bitwise_and()`, `np.bitwise_or()`, `np.bitwise_xor()`, `np.bitwise_not()`.

1. **Унарные функици:**

In [None]:
array_ufunc = np.array([-1, 2, -3, 4, -5])

abs_array = np.abs(array_ufunc) # Модуль каждого элемента
sqrt_array = np.sqrt(abs_array) # Квадратный корень из модуля  
exp_array = np.exp(array_ufunc) # Экспонента каждого элемента
sin_array = np.sin(array_ufunc) # Синус каждого элемента
rounded_array = np.round(array_ufunc, decimals=1) # Округление до 1 знака после запятой

print("Исходный массив:\n", array_ufunc)
print("\nМодуль (np.abs):\n", abs_array)
print("\nКвадратный корень (np.sqrt):\n", sqrt_array)
print("\nЭкспонента (np.exp):\n", exp_array)
print("\nСинус (np.sin):\n", sin_array)
print("\nОкругление (np.round):\n", rounded_array)

2. **Бинарные ufuncs:**

In [None]:
array_ufunc_1 = np.array([1, 2, 3, 4, 5])
array_ufunc_2 = np.array([6, 7, 8, 9, 10])

sum_arrays = np.add(array_ufunc_1, array_ufunc_2) # Поэлементное сложение
product_arrays = np.multiply(array_ufunc_1, array_ufunc_2) # Поэлементное умножение
power_arrays = np.power(array_ufunc_1, 2) # Возведение в степень (здесь второй массив - скаляр 2, транслируется)
greater_arrays = np.greater(array_ufunc_2, array_ufunc_1) # Поэлементное сравнение "больше" (возвращает массив boolean)

print("\nМассив 1:\n", array_ufunc_1)
print("\nМассив 2:\n", array_ufunc_2)
print("\nСумма (np.add):\n", sum_arrays)
print("\nПроизведение (np.multiply):\n", product_arrays)
print("\nСтепень (np.power):\n", power_arrays)
print("\nСравнение 'больше' (np.greater):\n", greater_arrays)

---

#### **Генерация случайных чисел**

Случайные числа **исключительно важны** в машинном обучении. Они необходимы для множества задач и алгоритмов.  Вот несколько **ключевых примеров**:

*   **Инициализация весов нейросетей:** Веса нейросетей **инициализируются случайными значениями** в начале обучения. **Правильная случайная инициализация критически важна** для обучения.
*   **Разделение данных на выборки:** Для **оценки качества модели**, данные **случайно разделяют** на обучающую и тестовую выборки.
*   **Перемешивание данных (shuffling):** Данные часто **перемешивают в случайном порядке** перед обучением, чтобы **избежать смещений** и **улучшить обучение**.
*   **Алгоритмы случайного поиска:** Для **оптимизации гиперпараметров** используют **алгоритмы случайного поиска**, которые **случайно перебирают комбинации** параметров.
*   **Моделирование случайных процессов:** В задачах машинного обучения нужно **моделировать случайные процессы**, например, генерировать случайные траектории или создавать случайные выборки.

NumPy предоставляет **мощный подмодуль `numpy.random`** с **большим набором инструментов** для генерации **разнообразных случайных чисел** и **выборок** из разных распределений.

1. `np.random.rand(d0, d1, ..., dn)`:  Генерирует массив случайных **чисел** с **равномерным** распределением в **диапазоне** `[0, 1)`.

In [None]:
random_array_rand = np.random.rand(3, 2) # Матрица 3x2 случайных чиесл от 0 до 1
print('Массив rand (3x2):\n', random_array_rand)

2. `np.random.randn(d0, d1, ..., dn)`:  Генерирует массив случайных чисел из **стандартного нормального распределения** (среднее **0**, стандартное отклонение **1**).

In [None]:
random_array_randn = np.random.randn(2, 4) # Матрица 2x4 случанйх чисел из нормального распределения
print('Массив randn (2x4):\n', random_array_randn)

3. `np.random.randint(low, high=None, size=None, dtype=int)`:  Генерирует массив **целых** случайных чисел, **равномерно распределенных** в дискретном диапазоне `[low, high)`.  **Если параметр `high` не указан**, диапазон генерируется как `[0, low)`.  Параметр `size` задает **форму** выходного массива.

In [None]:
random_integers_1_10 = np.random.randint(1, 11, size=5) # 5 случайных целых чисел от 1 до 10
random_integers_0_5_matrix = np.random.randint(0, 6, size=(2,3)) # Матрица 2x3 случайных чисел от 0 до 5

print("\nЦелые числа randint [1, 11) (5):\n", random_integers_1_10)
print("\nЦелые числа randint [0, 6) (2x3):\n", random_integers_0_5_matrix)

4. `np.random.random(size=None)`:  **Аналогична** функции `np.random.rand()`, но **принимает размер массива** в виде **кортежа** в аргументе `size`, а **не** как отдельные аргументы размерностей.  **Если `size=None`**, функция **возвращает одно случайное число** (скаляр).

In [None]:
random_array_random = np.random.random((4, 2)) # Матрица 4x2 случайных чисел от 0 до 1
single_random_number = np.random.random() # Одно случайное число от 0 до 1
print("\nМассив random (4x2):\n", random_array_random)
print("\nСлучайное число random (одно):\n", single_random_number)

5. `np.random.choice(a, size=None, replace=True, p=None)`:  Генерирует **случайную выборку** из **заданного массива `a`**.

    * `a` – **Исходный массив**, из которого производится выборка.  Может быть массивом NumPy или **целым числом**.  **Если `a` – целое число**, выборка будет производиться из массива, сгенерированного как `np.arange(a)` (последовательность целых чисел от 0 до `a-1`).

    * `size` –  **Форма** (размерность) **выходного массива**.

    * `replace=True` –  **Выборка с возвращением**.  Если `replace=True`, **один и тот же элемент** из массива `a` **может быть выбран несколько раз** в выходной выборке.  `replace=False` – **Выборка без возвращения**.  В этом случае, каждый элемент из `a` может быть выбран **не более одного раза**.

    * `p` –  **Вероятности выбора** каждого элемента из массива `a`.  Должен быть **одномерный массив** той же длины, что и `a`, содержащий **вероятности** (от 0 до 1) для каждого элемента.  **Если параметр `p` не указан**, то **вероятности считаются равномерными** для всех элементов массива `a`.

In [None]:
data_for_choice = np.array(['a', 'b', 'c', 'd', 'e'])
random_choice_1 = np.random.choice(data_for_choice) # Случайный выбор одного элемента из массива
random_choice_5 = np.random.choice(data_for_choice, size=5) # 5 случайных выборок с возвращением
random_choice_3_no_replace = np.random.choice(data_for_choice, size=3, replace=False) # 3 случайных выбора без возвращения
probabilities = [0.1, 0.2, 0.3, 0.25, 0.15] # Вероятности для каждого элемента
random_choice_weighted = np.random.choice(data_for_choice, size=5, p=probabilities) # Взвешенная случайная выборка

print("\nМассив для выбора:\n", data_for_choice)
print("\nСлучайный выбор (один):\n", random_choice_1)
print("\nСлучайный выбор (5 с возвращением):\n", random_choice_5)
print("\nСлучайный выбор (3 без возвращения):\n", random_choice_3_no_replace)
print("\nВзвешенный случайный выбор (5):\n", random_choice_weighted)

`np.random.seed(seed=None)`:

   **Фиксация "зерна" генератора случайных чисел.**  Это **ключевой инструмент для обеспечения воспроизводимости результатов**, которые зависят от случайной генерации чисел.

   **Важность воспроизводимости:**  В научных исследованиях, машинном обучении и многих других областях **воспроизводимость экспериментов и результатов является крайне важной**.  Когда вы используете случайные числа в своем коде, результаты могут меняться при каждом запуске, если не контролировать генерацию случайных чисел.  `np.random.seed()` позволяет **зафиксировать начальную точку (зерно)** для генератора псевдослучайных чисел, делая последовательность случайных чисел **детерминированной и воспроизводимой**.

   **Как работает `np.random.seed()`:**  Если вы **установите одно и то же значение параметра `seed`** перед генерацией случайных чисел, NumPy будет **использовать это значение в качестве "зерна"**.  В результате, при каждом запуске кода с **одним и тем же значением `seed`**, вы будете получать **абсолютно идентичную последовательность случайных чисел**.

   **Если `seed=None` (или параметр `seed` не указан)** при вызове `np.random.seed()`, NumPy будет **использовать "системное время" в качестве зерна**.  Поскольку "системное время" меняется при каждом запуске программы, **последовательность случайных чисел будет разной при каждом запуске кода** в этом случае, что подходит для ситуаций, когда воспроизводимость не требуется, и нужна именно случайность.

In [None]:
np.random.seed(42) # Фиксируем зерно 42
random_array_seed_1 = np.random.rand(2, 2)
np.random.seed(42) # Снова фиксируем зерно 42 (перед второй генерацией)
random_array_seed_2 = np.random.rand(2, 2)

print("\nМассив 1 с seed=42:\n", random_array_seed_1)
print("\nМассив 2 с seed=42:\n", random_array_seed_2) # Массивы будут идентичны!

np.random.seed(None) # Снимаем фиксацию зерна (или можно просто не вызывать seed())
random_array_no_seed = np.random.rand(2, 2)
print("\nМассив без seed (каждый раз разный):\n", random_array_no_seed) # Массив будет меняться при каждом запуске