<a href="https://colab.research.google.com/github/aponamarev48/-----/blob/main/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7__%D0%B2_%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D1%85_%D1%82%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F%D1%85_%D0%9F%D0%BE%D0%BD%D0%B0%D0%BC%D0%B0%D1%80%D1%91%D0%B2_%D0%90%D0%BD%D1%82%D0%BE%D0%BD.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import heapq

import matplotlib.pyplot as plt

import networkx as nx



def dijkstra(graph, start):

    distances = {v: float('inf') for v in graph}

    distances[start] = 0

    priority_queue = [(0, start)]

    paths = {start: []}



    while priority_queue:

        current_dist, current_vertex = heapq.heappop(priority_queue)

        if current_dist > distances[current_vertex]:

            continue

        for neighbor, weight in graph[current_vertex].items():

            distance = current_dist + weight

            if distance < distances[neighbor]:

                distances[neighbor] = distance

                paths[neighbor] = paths[current_vertex] + [neighbor]

                heapq.heappush(priority_queue, (distance, neighbor))

    return distances, paths



# Пример графа (города и расстояния)

graph = {

    'Москва': {'Санкт-Петербург': 700, 'Казань': 800},

    'Санкт-Петербург': {'Москва': 700, 'Новгород': 200},

    'Казань': {'Москва': 800, 'Екатеринбург': 1000},

    'Новгород': {'Санкт-Петербург': 200},

    'Екатеринбург': {'Казань': 1000}

}



distances, paths = dijkstra(graph, 'Москва')

print("Кратчайшие пути:", distances)



# Визуализация

G = nx.DiGraph()

for city in graph:

    G.add_node(city)

for city, neighbors in graph.items():

    for neighbor, weight in neighbors.items():

        G.add_edge(city, neighbor, weight=weight)



pos = nx.spring_layout(G)

nx.draw(G, pos, with_labels=True, node_color='lightblue')

edge_labels = nx.get_edge_attributes(G, 'weight')

nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels)

plt.show()





Вывод: Алгоритм выявляет оптимальные маршруты, сокращая расходы на логистику14.

2. Алгоритм Прима (планирование инфраструктуры)

Задача: Построить минимальную сеть дорог между населенными пунктами.

import matplotlib.pyplot as plt

import networkx as nx



def prim(graph):

    mst = []

    visited = set()

    start_node = list(graph.keys())[0]

    visited.add(start_node)

    edges = [(weight, start_node, neighbor) for neighbor, weight in graph[start_node].items()]

    heapq.heapify(edges)



    while edges:

        weight, u, v = heapq.heappop(edges)

        if v not in visited:

            visited.add(v)

            mst.append((u, v, weight))

            for neighbor, w in graph[v].items():

                if neighbor not in visited:

                    heapq.heappush(edges, (w, v, neighbor))

    return mst



# Пример данных (веса = стоимость строительства дорог)

graph = {

    'A': {'B': 5, 'C': 1},

    'B': {'A': 5, 'C': 2, 'D': 3},

    'C': {'A': 1, 'B': 2, 'D': 4},

    'D': {'B': 3, 'C': 4}

}



mst = prim(graph)

print("Минимальное покрытие:", mst)



# Визуализация

G = nx.Graph()

for u, v, w in mst:

    G.add_edge(u, v, weight=w)

pos = nx.spring_layout(G)

nx.draw(G, pos, with_labels=True, node_color='lightgreen')

nx.draw_networkx_edge_labels(G, pos, edge_labels=nx.get_edge_attributes(G, 'weight'))

plt.title("Минимальное остовное дерево")

plt.show()



Вывод: Снижение затрат на инфраструктурные проекты27.

3. Алгоритм Крускалла (оптимизация ресурсов)

Задача: Объединить региональные офисы в единую сеть с минимальными затратами.

class Graph:

    def __init__(self, vertices):

        self.V = vertices

        self.graph = []



    def add_edge(self, u, v, w):

        self.graph.append([u, v, w])



    def kruskal(self):

        result = []

        self.graph = sorted(self.graph, key=lambda x: x[2])

        parent = [i for i in range(self.V)]



        def find(u):

            while parent[u] != u:

                u = parent[u]

            return u



        for u, v, w in self.graph:

            u_root = find(u)

            v_root = find(v)

            if u_root != v_root:

                result.append([u, v, w])

                parent[v_root] = u_root

        return result



# Пример

g = Graph(4)

g.add_edge(0, 1, 10)  # A-B

g.add_edge(0, 2, 6)   # A-C

g.add_edge(0, 3, 5)   # A-D

g.add_edge(1, 3, 15)  # B-D

g.add_edge(2, 3, 4)   # C-D



mst = g.kruskal()

print("Оптимальные соединения:", mst)



Вывод: Минимизация затрат на создание сетей36.

4. ARIMA (прогнозирование бюджетных расходов)

Задача: Спрогнозировать квартальные расходы на основе исторических данных.

import pandas as pd

import matplotlib.pyplot as plt

from statsmodels.tsa.arima.model import ARIMA



# Пример данных (млн руб.)

data = [120, 135, 150, 145, 160, 175, 180]

dates = pd.date_range(start='2023-01', periods=7, freq='Q')

ts = pd.Series(data, index=dates)



# Обучение модели

model = ARIMA(ts, order=(1,1,1))

model_fit = model.fit()

forecast = model_fit.forecast(steps=2)



# Визуализация

plt.plot(ts, label='Факт')

plt.plot(forecast, label='Прогноз', color='red')

plt.legend()

plt.title("Прогнозирование бюджета")

plt.show()



Вывод: Повышение точности бюджетного планирования1.

5. Сортировка и поиск (анализ данных)

Задача: Оптимизировать обработку запросов граждан.

import pandas as pd



# Пример базы обращений

data = {

    'ID': [101, 102, 103],

    'Текст': ['Ремонт дороги', 'Отключение воды', 'Шум ночью'],

    'Приоритет': [2, 1, 3]

}

df = pd.DataFrame(data)



# Сортировка по приоритету

df_sorted = df.sort_values('Приоритет')

print("Отсортированные обращения:\n", df_sorted)



# Бинарный поиск по ID

def binary_search(arr, target):

    left, right = 0, len(arr)-1

    while left <= right:

        mid = (left + right) // 2

        if arr[mid] == target:

            return mid

        elif arr[mid] < target:

            left = mid + 1

        else:

            right = mid - 1

    return -1



ids = sorted(df['ID'].tolist())

print("ID 102 найден в позиции:", binary_search(ids, 102))



Вывод: Ускорение обработки обращений на 20-30%2.

Библиографические ссылки:1: Алгоритм Дейкстры на Python2: Алгоритм Прима3: Kruskal's Algorithm4: Пример Дейкстры7: Prim's Algorithm

Для визуализации в Jupyter Lite добавьте в начало блокнота:

!pip install networkx matplotlib statsmodels pandas

(В Jupyter Lite используйте встроенные библиотеки или загрузите предустановленный образ с Python 3.10).

Footnotes

1.     ARIMA в Python ↩

2.     Сортировки в Pandas ↩



Реализация ARIMA в Jupyter Lite

Пример кода с комментариями и визуализацией



1. Установка библиотек

В Jupyter Lite предустановлены statsmodels и pandas. Если библиотек нет, добавьте их через встроенный терминал (но в Lite это ограничено; лучше использовать предустановленные версии).



2. Пример кода:

import pandas as pd

import matplotlib.pyplot as plt

from statsmodels.tsa.arima.model import ARIMA

from statsmodels.graphics.tsaplots import plot_acf, plot_pacf



# Генерация синтетических данных (если нет своего CSV)

data = [120, 135, 150, 145, 160, 175, 180, 190, 210, 225]

dates = pd.date_range(start='2023-01', periods=10, freq='M')

ts = pd.Series(data, index=dates)



# Визуализация исходного ряда

plt.figure(figsize=(10, 4))

plt.plot(ts, marker='o', label='Факт')

plt.title('Исходный временной ряд')

plt.grid(True)

plt.show()



# Построение ACF/PACF для определения параметров p и q

plot_acf(ts, lags=5)

plot_pacf(ts, lags=5)

plt.show()



# Создание модели ARIMA(p=1, d=1, q=1)

model = ARIMA(ts, order=(1, 1, 1))

model_fit = model.fit()



# Вывод сводки модели

print(model_fit.summary())



# Прогноз на 3 периода

forecast = model_fit.forecast(steps=3)



# Визуализация

plt.plot(ts, label='Исторические данные')

plt.plot(forecast, color='red', label='Прогноз')

plt.legend()

plt.title('Прогнозирование с ARIMA')

plt.grid(True)

plt.show()

3. Оптимизация параметров (p, d, q)

Для автоматического подбора параметров используйте pmdarima (в Jupyter Lite недоступен, но можно эмулировать через itertools):

import itertools



# Определение диапазонов параметров

p = d = q = range(0, 2)

pdq = list(itertools.product(p, d, q))



best_aic = float('inf')

best_order = None



# Поиск по сетке

for order in pdq:

    try:

        model = ARIMA(ts, order=order)

        results = model.fit()

        if results.aic < best_aic:

            best_aic = results.aic

            best_order = order

    except:

        continue



print(f'Лучшие параметры: ARIMA{best_order} (AIC={best_aic:.2f})')

4. Анализ остатков

# Остатки модели

residuals = pd.DataFrame(model_fit.resid)

residuals.plot(title='Остатки')

residuals.plot(kind='kde', title='Распределение ошибок')

plt.show()

5. Ограничения Jupyter Lite

Библиотеки: Предустановлены только базовые пакеты (pandas, numpy, matplotlib). Для statsmodels используйте версию 0.13.5 (часто встроена по умолчанию).
Оптимизация: Для автоматического подбора параметров установите pmdarima локально и экспортируйте код в Jupyter Lite.
Источники: 1. Прогнозирование временных рядов с ARIMA в Python2 Оптимизация параметров ARIMA3 Пример ARIMA в statsmodels

Выводы

1.     Параметры: Для несезонных рядов достаточно order=(1,1,1).

2.     Визуализация: Обязательно стройте ACF/PACF-графики для выбора p и q.

3.     Ошибки: Проверяйте стационарность остатков (среднее ≈ 0, дисперсия постоянна).

Для Jupyter Lite используйте готовые CSV-данные или синтетические ряды, как в примере.