## Функция np.vectorize

Функция np.vectorize в NumPy позволяет применять обычную функцию Python к массивам NumPy, делая её как бы "векторизованной". Это означает, что функция будет автоматически применена к каждому элементу массива, и результат будет возвращен в виде нового массива. Вместо написания циклов для обработки каждого элемента массива np.vectorize делает код более чистым и часто более эффективным, особенно при работе с большими массивами. 

По сути np.vectorize - это функция NumPy, которая обеспечивает удобный способ применения функции Python, ожидающей скалярных входных данных, к входным данным массива. При использовании с Pandas DataFrames или Series она позволяет применять пользовательскую функцию к данным поэлементно, подобно Series.apply() или DataFrame.apply().

Как это работает:

1. Определите скалярную функцию. Создайте стандартную функцию Python, которая принимает скалярные входные данные и возвращает скалярный выход. Эта функция представляет собой операцию, которую вы хотите выполнить над каждым элементом.

In [1]:
def my_function(x, y):
        if x > y:
            return x - y
        else:
            return x + y

2. Векторизируйте функцию. Используйте np.vectorize(), чтобы преобразовать скалярную функцию в «векторную» версию, которая может принимать массивоподобные входные данные.

In [2]:
import numpy as np
vectorized_my_function = np.vectorize(my_function)

3. Примените векторизованную функцию к данным pandas. Вы можете применить эту vectorized_my_function непосредственно к столбцам Pandas Series или DataFrame.

In [3]:
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 1, 2]})
display(df)
df['C'] = vectorized_my_function(df['A'], df['B'])
df

Unnamed: 0,A,B
0,1,4
1,2,1
2,3,2


Unnamed: 0,A,B,C
0,1,4,5
1,2,1,1
2,3,2,1


### Важно!


#### Удобство превыше производительности (Convenience over Performance):
Хотя np.vectorize предлагает удобство, важно понимать, что он не обеспечивает истинную векторизацию на уровне C, как встроенные операции NumPy или pandas. Под капотом np.vectorize - это, по сути, цикл Python for, что означает, что он может быть медленнее, чем действительно векторизованные операции.

#### Истинная векторизация (True Vectorization):
Для оптимальной производительности pandas отдавайте предпочтение использованию встроенных векторных операций (например, df['col1'] + df['col2']) или рассмотрите возможность написания функций, использующих непосредственно операции с массивами NumPy, если ваша задача позволяет это сделать.

#### Аргумент otypes:
Если тип вывода вашей функции может меняться, или автоматическое определение типа NumPy некорректно, вы можете указать ожидаемый тип вывода с помощью аргумента otypes в np.vectorize (например, np.vectorize(my_function, otypes=[float])).

#### Аргумент excluded:
Вы можете использовать аргумент excluded, чтобы запретить np.vectorize векторизовать определенные аргументы, которые должны рассматриваться как скаляры (например, константы или фиксированные параметры).