# Введение в **SciPy**

<div style="text-align:right;">Гейне М.А. <span style="font-style: italic;font-weight: bold;">(geine@bmstu.ru)</div>

**SciPy** - это библиотека Python, используемая для научных и технических вычислений. Построенная на основе **NumPy**, она расширяет возможности Python в таких областях, как **математика**, **инженерия** и **наука**, предлагая расширенные функции и алгоритмы в различных областях.

В то время как NumPy предлагает фундаментальную поддержку операций с массивами, SciPy включает специализированные методы для более сложных научных вычислений.

SciPy состоит из подмодулей, которые охватывают конкретные области, такие как линейная алгебра (`scipy.linalg`), оптимизация (`scipy.optimize`), статистика (`scipy.stats`), обработка сигналов (`scipy.signal`) и другие.

SciPy особенно полезен при работе с:

- Сложными научными вычислениями: Задачи, выходящие за рамки базовых числовых операций, такие как решение дифференциальных уравнений, выполнение преобразований Фурье или применение продвинутых статистических тестов.
- Математическим моделированием: Моделирование проблем, связанных с оптимизацией, интегрированием или линейной алгеброй.
- Научными и инженерными задачами: В таких областях, как физика, биология и инженерия, часто требуются специализированные процедуры, которые предоставляет SciPy.

На практике SciPy часто используется после первоначальной подготовки данных и манипулирования ими с помощью NumPy и Pandas. Функции SciPy могут решать более специализированные задачи, которые могут потребоваться при анализе данных или разработке модели.

## Обзор основных модулей

### Оптимизация

- Модуль SciPy `optimize` предоставляет инструменты для нахождения минимума или максимума функций, решения уравнений и аппроксимации кривых.
- **Общие функции**:
    - **`minimize()`**: Находит минимум функции, полезен в машинном обучении и статистическом моделировании.
    - **`curve_fit()`**: Подгоняет функцию к данным с помощью метода наименьших квадратов, идеально подходит для регрессионного анализа.
    - **`root()`**: Находит корни функции (т. е. значения, для которых функция равна нулю).

**`minimize()`**: Эта функция общего назначения находит минимум скалярной функции. Она поддерживает несколько алгоритмов оптимизации, таких как:

- **BFGS**: Градиентный метод, подходящий для гладких функций
- **Nelder-Mead**: Метод без производных, полезный для негладких функций
- **TNC**: Для функций с ограничениями на переменные

In [None]:
# %matplotlib inline
# или
# %pip install ipympl
%matplotlib widget

In [None]:
from scipy.optimize import minimize

# Define the function we want to minimize
def objective(x):
    return (x - 3) ** 2 + 4

# Minimize starting from an initial guess of 0
result = minimize(objective, x0=0)
print("Optimal x:", result.x)
print("Function minimum:", result.fun)


In [None]:
import numpy as np
import matplotlib.pyplot as plt

x_values = np.linspace(-2, 8, 100)
y_values = objective(x_values)
optimal_x = result.x[0]

plt.figure(0)
plt.plot(x_values, y_values, label="Objective Function")
plt.scatter(optimal_x, objective(optimal_x), color="red", label="Minimum Point")
plt.title("Minimizing a Function")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend()
plt.show()

- Функция `minimize` также может работать с ограничениями и границами, позволяя вам определить условия, которым должно удовлетворять решение.
- **Ограничения** могут быть равенствами (`type='eq'`) или неравенствами (`type='ineq'`), где вы задаете условия для выходов функции.

In [None]:
from scipy.optimize import minimize

# Define the objective function
def objective(x):
    return x[0]**2 + x[1]**2

# Define the constraint (x[0] + x[1] >= 1)
constraints = {'type': 'ineq', 'fun': lambda x: x[0] + x[1] - 1}

# Define bounds for each variable
bounds = [(0, None), (0, None)]

# Minimize with constraints and bounds
result = minimize(objective, x0=[1, 0], constraints=constraints, bounds=bounds)
print("Optimal x:", result.x)
print("Function minimum:", result.fun)


In [None]:
from mpl_toolkits.mplot3d import Axes3D

optimal_x = result.x

# Create a meshgrid for the 3D plot
x = np.linspace(-1, 2, 100)
y = np.linspace(-1, 2, 100)
X, Y = np.meshgrid(x, y)
Z = objective([X, Y])

# Plot the 3D surface of the objective function
fig = plt.figure(1, figsize=(10, 8))
ax = fig.add_subplot(111, projection='3d')
ax.plot_surface(X, Y, Z, cmap="viridis", alpha=0.8, edgecolor='k', linewidth=0.1)

# Plot the constraint plane where x0 + x1 = 1
constraint_x = np.linspace(0, 1, 100)
constraint_y = 1 - constraint_x
constraint_z = objective([constraint_x, constraint_y])
ax.plot(constraint_x, constraint_y, constraint_z, color="cyan", alpha=0.6, linewidth=3, label="Constraint boundary (x0 + x1 = 1)")

# Plot the optimal point
optimal_z = objective(optimal_x)
ax.scatter(optimal_x[0], optimal_x[1], optimal_z, color="red", s=100, label="Optimal Point")

# Set labels and title
ax.set_xlabel("x0")
ax.set_ylabel("x1")
ax.set_zlabel("Objective Function")
plt.title("3D Constrained Optimization Visualization")
ax.legend()
plt.show()

Предположим, мы хотим минимизировать $f(x, y) = (x - 1)^2 + (y - 2.5)^2$ с ограничениями:
   - $x + 2y \leq 4$
   - $x \geq 0$
   - $y \geq 0$
   - Ограничение равенства: $x - y = 0$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import minimize
from mpl_toolkits.mplot3d import Axes3D

# Define the objective function
def objective(vars):
    x, y = vars
    return (x - 1)**2 + (y - 2.5)**2

# Define constraints
constraints = [
    {'type': 'ineq', 'fun': lambda vars: 4 - vars[0] - 2 * vars[1]},  # x + 2y <= 4
    {'type': 'ineq', 'fun': lambda vars: vars[0]},  # x >= 0
    {'type': 'ineq', 'fun': lambda vars: vars[1]},  # y >= 0
    {'type': 'eq', 'fun': lambda vars: vars[0] - vars[1]}  # x = y
]

# Perform the minimization
initial_guess = [0.5, 0.5]
result = minimize(objective, initial_guess, constraints=constraints)
optimal_x, optimal_y = result.x

# Generate a meshgrid for plotting
x_vals = np.linspace(0, 2, 100)
y_vals = np.linspace(0, 3, 100)
X, Y = np.meshgrid(x_vals, y_vals)
Z = objective([X, Y])

# 3D plot of the objective function and constraints
fig = plt.figure(2, figsize=(12, 8))
ax = fig.add_subplot(111, projection='3d')
ax.plot_surface(X, Y, Z, cmap="viridis", alpha=0.7, edgecolor="none")

# Highlight the optimal point
ax.scatter(optimal_x, optimal_y, objective([optimal_x, optimal_y]), color="red", s=100, label="Optimal Point")
ax.set_title("3D Plot of Optimization with Constraints")
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_zlabel("f(x, y)")
plt.legend()
plt.show()


**`root()`**: Находит корни функции (т.е. места, где функция равна нулю). Это полезно для решения уравнений или систем уравнений

In [None]:
from scipy.optimize import root

# Define a function whose root we want to find
def func(x):
    return x**2 - 9

# Find the root (solution) starting from an initial guess
result = root(func, x0=3)
print("Root:", result.x)


In [None]:
root_x = result.x[0]

# Plot the function and the root
x_values = np.linspace(-5, 5, 100)
y_values = func(x_values)

plt.figure(3)

plt.plot(x_values, y_values, label="Function")
plt.axhline(0, color="gray", linestyle="--")
plt.scatter(root_x, func(root_x), color="red", label="Root")
plt.title("Root Finding")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend()
plt.show()

**`curve_fit()`**: Подгоняет пользовательскую функцию к набору точек данных с помощью нелинейных наименьших квадратов. Это особенно полезно в науке о данных для регрессионного анализа.

In [None]:
import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt

# Define a model function (e.g., linear in this case)
def model(x, a, b):
    return a * x + b

# Generate some synthetic data points
x_data = np.linspace(0, 10, 10)
y_data = 3 * x_data + 2 + np.random.normal(size=x_data.size)

# Fit the model to the data
params, covariance = curve_fit(model, x_data, y_data)
print("Fitted parameters:", params)

# Plot the data and the fitted model
plt.figure(4)
plt.scatter(x_data, y_data, label="Data")
plt.plot(x_data, model(x_data, *params), color='red', label="Fitted line")
plt.legend()
plt.show()


В реальных приложениях данные часто следуют нелинейному тренду. Давайте подгоним модель экспоненциального распада к синтетическим данным, что является распространенной задачей в биологических и физических науках.

Моделируемой функцией здесь является $y = a \cdot e^{-b \cdot x} + c$.


In [None]:
import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt

# Define the model function
def model(x, a, b, c):
    return a * np.exp(-b * x) + c

# Generate synthetic data with noise
x_data = np.linspace(0, 5, 50)
y_data = model(x_data, 2.5, 1.3, 0.5) + np.random.normal(scale=0.2, size=x_data.size)

# Fit the model to the data
params, covariance = curve_fit(model, x_data, y_data, p0=[2, 1, 0.5])

# Plot the data and the fitted curve
plt.figure(5)
plt.scatter(x_data, y_data, label="Data")
plt.plot(x_data, model(x_data, *params), color='red', label="Fitted Model")
plt.title("Non-Linear Curve Fitting")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.show()

# Show the fitted parameters
print("Fitted parameters:", params)

### Интегрирование



Предположим, мы хотим проинтегрировать простую функцию:
$$
f(x) = x^2
$$
по интервалу $[0, 2]$.

Функция SciPy `quad` может вычислить этот тип интеграла.

In [None]:
from scipy.integrate import quad

# Define the function to integrate
def f(x):
    return x**2

# Perform the integration over the interval [0, 2]
result, error = quad(f, 0, 2)
print("Integral of f(x) over [0, 2]:", result)
print("Estimated error:", error)

In [None]:
# Generate x values and corresponding y values
x_vals = np.linspace(0, 2, 100)
y_vals = f(x_vals)

plt.figure(6)
# Plot the function
plt.plot(x_vals, y_vals, label=r"$f(x) = x^2$", color='blue')
plt.fill_between(x_vals, y_vals, where=[(x >= 0 and x <= 2) for x in x_vals], alpha=0.3, color='cyan')

# Highlight the area and add annotations
plt.title(r"Integration of $f(x) = x^2$ from 0 to 2")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend()
plt.show()

Если у интегрируемой функции есть параметры, мы можем передать их, задав дополнительные аргументы.

Давайте проинтегрируем:
$$
f(x; a, b) = a \cdot x + b
$$
по интервалу $[0, 3]$, с параметрами $ a = 2 $ и $ b = 1 $.

In [None]:
# Define the function with parameters
def f_param(x, a, b):
    return a * x + b

# Set parameters
a, b = 2, 1

# Perform the integration
result, error = quad(f_param, 0, 3, args=(a, b))
print("Integral of f(x; a, b) over [0, 3]:", result)

Для функций двух переменных SciPy предоставляет функцию `dblquad`, которая выполняет двойное интегрирование. Давайте проинтегрируем:
$$
f(x, y) = x \cdot y
$$
по значениям $ x $ от 0 до 2 и $ y $ от 0 до 1.

In [None]:
from scipy.integrate import dblquad

# Define the function of two variables
def f(x, y):
    return x * y

# Perform the double integration
result, error = dblquad(f, 0, 2, lambda x: 0, lambda x: 1)
print("Double integral of f(x, y) over x=[0, 2] and y=[0, 1]:", result)

In [None]:
# Set up a meshgrid for plotting
x_vals = np.linspace(0, 2, 50)
y_vals = np.linspace(0, 1, 50)
X, Y = np.meshgrid(x_vals, y_vals)
Z = f(X, Y)

# Create the 3D plot
fig = plt.figure(7, figsize=(10, 6))
ax = fig.add_subplot(111, projection='3d')
ax.plot_surface(X, Y, Z, cmap="viridis", edgecolor="none", alpha=0.8)

# Labels and title
ax.set_title("Surface of f(x, y) = x * y")
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_zlabel("f(x, y)")
plt.show()

Для функций с тремя переменными можно использовать `tplquad` для тройного интегрирования. Рассмотрим функцию:
$$
f(x, y, z) = x + y + z
$$
интегрируемую по $ x $ от 0 до 1, $ y $ от 0 до 2 и $ z $ от 0 до 3.

In [None]:
from scipy.integrate import tplquad

# Define the function of three variables
def f(x, y, z):
    return x + y + z

# Perform the triple integration
result, error = tplquad(f, 0, 1, lambda x: 0, lambda x: 2, lambda x, y: 0, lambda x, y: 3)
print("Triple integral of f(x, y, z):", result)

Во многих случаях у вас могут быть дискретные данные, а не непрерывная функция. SciPy's `trapz` (правило трапеции) и `simps` (правило Симпсона) могут обрабатывать численное интегрирование для дискретных данных.

In [None]:
import numpy as np
from scipy.integrate import simpson, trapezoid

# Sample data points
x = np.linspace(0, 2, 100)
y = x**2

# Integrate using trapezoidal and Simpson's rule
trapz_result = trapezoid(y, x)
simps_result = simpson(y, x=x)

print("Trapezoidal integration result:", trapz_result)
print("Simpson's rule integration result:", simps_result)

In [None]:
# Plot data points and trapezoidal approximation
plt.figure(8)
plt.plot(x, y, 'o', label="Data Points", color='blue')
plt.fill_between(x, y, step="post", alpha=0.4, color='orange', label="Trapezoidal Approximation")
plt.plot(x, y, label=r"$f(x) = x^2$", color='blue')

# Labels and legend
plt.title("Trapezoidal Rule Approximation")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend()
plt.show()

SciPy's `solve_ivp` полезна для решения простых дифференциальных уравнений. Рассмотрим пример, в котором мы решаем:

$$
\frac{dy}{dt} = -2y
$$
с начальным условием $ y(0) = 1 $.

In [None]:
from scipy.integrate import solve_ivp
import matplotlib.pyplot as plt

# Define the differential equation dy/dt = -2y
def dydt(t, y):
    return -2 * y

# Solve the ODE with y(0) = 1 over the interval [0, 5]
solution = solve_ivp(dydt, [0, 5], [1], t_eval=np.linspace(0, 5, 100))

# Plot the solution
plt.figure(9)
plt.plot(solution.t, solution.y[0], label="y(t)")
plt.xlabel("t")
plt.ylabel("y")
plt.title("Solution of dy/dt = -2y")
plt.legend()
plt.show()

In [None]:
solution.t

In [None]:
solution.y[0]

Некоторые интегралы имеют границы, зависящие от переменных. Например:
$$
\int_0^2 \int_0^x x \cdot y \, dy \, dx
$$


In [None]:
from scipy.integrate import dblquad

# Define the function
def f(x, y):
    return x * y

# Perform the integration with variable bounds for y
result, error = dblquad(f, 0, 2, lambda x: 0, lambda x: x)
print("Integral with variable bounds:", result)

In [None]:
# Generate meshgrid
x_vals = np.linspace(0, 2, 50)
y_vals = np.linspace(0, 2, 50)
X, Y = np.meshgrid(x_vals, y_vals)
Z = np.where(Y <= X, f(X, Y), np.nan)  # Apply variable bounds

# Set up the figure
fig = plt.figure(figsize=(12, 8))
ax = fig.add_subplot(111, projection='3d')

# Plot the surface
surf = ax.plot_surface(X, Y, Z, cmap="viridis", edgecolor="none", alpha=0.8)

# Add shadow to represent the volume underneath
ax.contourf(X, Y, Z, zdir='z', offset=0, cmap="viridis", alpha=0.4)

# Set plot limits and labels
ax.set_xlim(0, 2)
ax.set_ylim(0, 2)
ax.set_zlim(0, np.nanmax(Z))
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_zlabel("f(x, y)")
ax.set_title("Volume under the Surface of f(x, y) = x * y with Variable Bounds")

# Show plot
plt.show()

### Статистический анализ

SciPy предоставляет множество вероятностных распределений, которые полезны для моделирования данных. Среди них такие распространенные распределения, как нормальное, биномиальное, Пуассона и другие. Каждое распределение предлагает методы для генерации случайных выборок, вычисления вероятностей и нахождения таких метрик, как среднее значение и дисперсия.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parameters for the normal distribution
mu, sigma = 0, 1  # mean and standard deviation

# Generate random samples
samples = norm.rvs(loc=mu, scale=sigma, size=1000)

# Create the PDF for the normal distribution
x = np.linspace(-4, 4, 100)
pdf = norm.pdf(x, loc=mu, scale=sigma)

# Plot histogram of samples and PDF
plt.figure(12)
plt.hist(samples, bins=30, density=True, alpha=0.6, color='skyblue', label="Sample Distribution")
plt.plot(x, pdf, color='darkblue', lw=2, label="PDF of Normal Distribution")
plt.xlabel("Value")
plt.ylabel("Probability Density")
plt.title("Normal Distribution (mu=0, sigma=1)")
plt.legend()
plt.show()

SciPy предоставляет функции для вычисления основных статистических показателей, таких как среднее значение, медиана, дисперсия, асимметрия и эксцесс. Они необходимы для понимания формы и разброса данных.

In [None]:
from scipy.stats import skew, kurtosis

# Calculate statistics
mean = np.mean(samples)
std_dev = np.std(samples)
data_skewness = skew(samples)
data_kurtosis = kurtosis(samples)

print(f"Mean: {mean}")
print(f"Standard Deviation: {std_dev}")
print(f"Skewness: {data_skewness}")
print(f"Kurtosis: {data_kurtosis}")

Проверка гипотез позволяет делать выводы о популяции на основе выборочных данных. SciPy предлагает ряд тестов гипотез, включая t-тесты, ANOVA, а также другие.

Предположим, у нас есть выборка данных, и мы хотим проверить, отличается ли ее среднее значение от нуля. Мы используем одновыборочный t-тест и визуализируем распределение среднего значения выборки относительно гипотетического среднего значения популяции (которое в данном случае равно нулю).

**Постановка гипотезы**:

  - Нулевая гипотеза ($H_0$): Среднее значение выборки равно нулю.
  - Альтернативная гипотеза ($H_1$): Среднее значение выборки не равно нулю.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t, ttest_1samp

# Generate sample data
np.random.seed(42)
sample_data = np.random.normal(0.5, 1, 30)  # Sample with a true mean of 0.5

# Perform a one-sample t-test
t_stat, p_value = ttest_1samp(sample_data, 0)

# Define the t-distribution
df = len(sample_data) - 1
x = np.linspace(-4, 4, 1000)
y = t.pdf(x, df)

# Plot the t-distribution
plt.figure(13)
plt.plot(x, y, label="t-Distribution (df=29)", color="skyblue")

# Add vertical lines for critical t-values at 0.05 significance level
critical_value = t.ppf(1 - 0.025, df)  # Two-tailed test, so 0.025 on each side
plt.axvline(-critical_value, color="red", linestyle="--", label="Critical Value")
plt.axvline(critical_value, color="red", linestyle="--")

# Plot the sample's t-statistic
plt.axvline(t_stat, color="green", linestyle="--", label=f"t-statistic = {t_stat:.2f}")

# Add text and labels
plt.fill_between(x, y, where=(x < -critical_value) | (x > critical_value), color='red', alpha=0.2)
plt.xlabel("t-value")
plt.ylabel("Probability Density")
plt.title("One-Sample t-Test Visualization")
plt.legend()
plt.show()

# Print t-statistic and p-value
print(f"t-statistic: {t_stat}")
print(f"p-value: {p_value}")


В этом сюжете:

- t-распределение представляет собой распределение нулевой гипотезы.
- Критические значения (красные пунктирные линии) при $𝛼 = 0.05$ показывают границы области отклонения.
- t-статистика для нашей выборки изображена зеленой пунктирной линией.
- Если t-статистика попадает в область отклонения (заштрихована красным), мы отвергаем нулевую гипотезу.

В двухвыборочном t-тесте мы сравниваем средние значения двух независимых выборок, чтобы проверить, существенно ли они отличаются. Вот визуализация, позволяющая проверить, есть ли разница в средних между двумя группами.

- Нулевая гипотеза ($H_0$): Средние значения двух выборок равны.
- Альтернативная гипотеза ($H_1$): Средние значения двух выборок не равны.

In [None]:
from scipy.stats import ttest_ind

# Generate two sample datasets
np.random.seed(42)
sample1 = np.random.normal(0.5, 1, 30)  # Mean = 0.5
sample2 = np.random.normal(1, 1, 30)    # Mean = 1

# Perform a two-sample t-test
t_stat, p_value = ttest_ind(sample1, sample2)

# Define the t-distribution
df = len(sample1) + len(sample2) - 2
x = np.linspace(-4, 4, 1000)
y = t.pdf(x, df)

# Plot the t-distribution
plt.figure(14)
plt.plot(x, y, label="t-Distribution (df=58)", color="skyblue")

# Add critical values for a two-tailed test at 0.05 significance level
critical_value = t.ppf(1 - 0.025, df)  # Two-tailed test
plt.axvline(-critical_value, color="red", linestyle="--", label="Critical Value")
plt.axvline(critical_value, color="red", linestyle="--")

# Plot the sample's t-statistic
plt.axvline(t_stat, color="green", linestyle="--", label=f"t-statistic = {t_stat:.2f}")

# Add text and labels
plt.fill_between(x, y, where=(x < -critical_value) | (x > critical_value), color='red', alpha=0.2)
plt.xlabel("t-value")
plt.ylabel("Probability Density")
plt.title("Two-Sample t-Test Visualization")
plt.legend()
plt.show()

# Print t-statistic and p-value
print(f"t-statistic: {t_stat}")
print(f"p-value: {p_value}")


SciPy включает функции для вычисления корреляций и выполнения линейной регрессии. Корреляция измеряет связь между двумя переменными, а регрессия пытается смоделировать эту связь.

In [None]:
from scipy.stats import pearsonr, linregress

# Generate correlated data
np.random.seed(0)
x = np.random.normal(5, 1, 100)
y = 2.5 * x + np.random.normal(0, 1, 100)

# Calculate correlation coefficient
corr_coef, _ = pearsonr(x, y)

# Perform linear regression
slope, intercept, r_value, p_value, std_err = linregress(x, y)
line = slope * x + intercept

# Plot data and regression line
plt.figure(15)
plt.scatter(x, y, label="Data Points")
plt.plot(x, line, color='red', label=f"Regression Line (r={corr_coef:.2f})")
plt.xlabel("x")
plt.ylabel("y")
plt.title("Correlation and Linear Regression")
plt.legend()
plt.show()

Выборочные распределения очень важны для статистических выводов. SciPy позволяет создавать бутстрап-выборки, которые можно использовать для оценки неопределенности статистических оценок.

In [None]:
from scipy.stats import bootstrap

# Generate bootstrap samples
bootstrap_result = bootstrap((samples,), np.mean, confidence_level=0.95, n_resamples=1000, random_state=0)

print(f"Mean Estimate: {bootstrap_result.standard_error}")
print(f"95% Confidence Interval: {bootstrap_result.confidence_interval}")

### Работа с пространственными данными

Инструменты SciPy для работы с пространственными данными позволяют анализировать многомерные данные и решать задачи, связанные с точками в пространстве, такие как кластеризация, поиск ближайших соседей и расстояний. Эти инструменты особенно полезны в таких приложениях, как машинное обучение, географические информационные системы (ГИС) и компьютерная графика.

KD-дерево (k-мерное дерево) - это структура данных, оптимизированная для эффективного поиска ближайших соседей. SciPy предоставляет реализацию `scipy.spatial.KDTree`, которая может искать ближайших соседей и выполнять поиск по радиусу.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.spatial import KDTree

# Generate random 2D points
np.random.seed(42)
points = np.random.rand(10, 2)  # 10 random points in 2D

# Create KD-tree
tree = KDTree(points)

# Find nearest neighbors
distances, indices = tree.query(points, k=2)  # k=2 to include each point and its closest neighbor

# Plot points and their nearest neighbors
plt.figure(16)
plt.scatter(points[:, 0], points[:, 1], color="blue", label="Points")
for i in range(len(points)):
    plt.plot([points[i, 0], points[indices[i, 1], 0]],
             [points[i, 1], points[indices[i, 1], 1]],
             'k--', alpha=0.6)  # Line to nearest neighbor
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Nearest Neighbor Connections using KD-Tree")
plt.legend()
plt.show()


Выпуклая оболочка - это наименьший выпуклый многоугольник, который содержит набор точек. Он полезен для решения таких задач, как поиск границы множества точек или создание ограничивающих многоугольников.

In [None]:
from scipy.spatial import ConvexHull

# Generate random 2D points
np.random.seed(0)
points = np.random.rand(30, 2)

# Calculate convex hull
hull = ConvexHull(points)

# Plot points and the convex hull
plt.figure(16)
plt.scatter(points[:, 0], points[:, 1], color="blue", label="Points")
for simplex in hull.simplices:
    plt.plot(points[simplex, 0], points[simplex, 1], "r-")  # Hull edges
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Convex Hull of Points")
plt.legend()
plt.show()


Триангуляция Делоне создает треугольники, соединяющие множество точек так, что ни одна точка не лежит внутри окружности любого треугольника. Эта триангуляция полезна для 3D-моделирования, создания сетки и пространственной интерполяции.

In [None]:
from scipy.spatial import Delaunay

# Generate random points
np.random.seed(0)
points = np.random.rand(30, 2)

# Compute Delaunay triangulation
tri = Delaunay(points)

# Plot points and the triangulation
plt.figure(17)
plt.triplot(points[:, 0], points[:, 1], tri.simplices, color="orange")
plt.scatter(points[:, 0], points[:, 1], color="blue", label="Points")
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Delaunay Triangulation of Points")
plt.legend()
plt.show()


Диаграмма Вороного делит пространство на области в зависимости от расстояния до определенного набора точек. Каждая область соответствует точкам, расположенным ближе к определенной "начальной" точке, чем к любой другой. Диаграммы Вороного используются в таких областях, как биология (например, распределение клеток) и география.

In [None]:
from scipy.spatial import Voronoi, voronoi_plot_2d

# Generate random points
np.random.seed(0)
points = np.random.rand(10, 2)

# Compute Voronoi diagram
vor = Voronoi(points)

# Plot Voronoi diagram
fig, ax = plt.subplots(figsize=(8, 6), num = 18)
voronoi_plot_2d(vor, ax=ax, show_vertices=False, line_colors="orange")
plt.scatter(points[:, 0], points[:, 1], color="blue", label="Points")
plt.xlabel("X")
plt.ylabel("Y")
plt.title("Voronoi Diagram of Points")
plt.legend()
plt.show()
