Создание и заполнение базы данных PostgreSQL
Сначала создадим базу данных и таблицы, а затем заполним их данными.

In [None]:
-- Подключение к PostgreSQL
-- Создание базы данных
CREATE DATABASE metro_data;

-- Подключение к базе данных
\c metro_data;

-- Создание таблиц
CREATE TABLE поездки (
    станция VARCHAR(50),
    линия VARCHAR(50),
    номер_билета INT,
    время_входа TIMESTAMP,
    время_выхода TIMESTAMP
);

CREATE TABLE станция_инфо (
    станция VARCHAR(50),
    среднее_время_ожидания FLOAT,
    уровень_комфорта INT
);

-- Заполнение таблицы поездки
INSERT INTO поездки (станция, линия, номер_билета, время_входа, время_выхода) VALUES
('Станция А', 'Линия 1', 12345, '2024-06-07 08:30:00', '2024-06-07 08:50:00'),
('Станция B', 'Линия 2', 12346, '2024-06-07 08:35:00', '2024-06-07 08:55:00'),
('Станция А', 'Линия 1', 12347, '2024-06-07 09:00:00', '2024-06-07 09:20:00'),
('Станция C', 'Линия 3', 12348, '2024-06-07 09:10:00', '2024-06-07 09:30:00'),
('Станция B', 'Линия 2', 12349, '2024-06-07 09:15:00', '2024-06-07 09:35:00'),
('Станция А', 'Линия 1', 12350, '2024-06-07 09:30:00', '2024-06-07 09:50:00'),
('Станция C', 'Линия 3', 12351, '2024-06-07 09:45:00', '2024-06-07 10:05:00');

-- Заполнение таблицы станция_инфо
INSERT INTO станция_инфо (станция, среднее_время_ожидания, уровень_комфорта) VALUES
('Станция А', 2.0, 4),
('Станция B', 3.0, 3),
('Станция C', 1.5, 5);


Подключение к базе данных из Streamlit

In [None]:
!pip install streamlit psycopg2 pandas sqlalchemy


Создание интерактивного дашборда
Создайте файл app.py и напишите следующий код:

In [None]:
import streamlit as st
import pandas as pd
import psycopg2
from sqlalchemy import create_engine
import plotly.express as px

# Настройка подключения к базе данных PostgreSQL
DATABASE_URL = "postgresql://username:password@localhost:5432/metro_data"

# Подключение к базе данных
engine = create_engine(DATABASE_URL)
conn = engine.connect()

# Загрузка данных
query = '''
SELECT
    t1.станция AS Станция,
    t1.линия AS Линия,
    t1.номер_билета AS Номер_билета,
    t1.время_входа AS Время_входа,
    t1.время_выхода AS Время_выхода,
    EXTRACT(EPOCH FROM (t1.время_выхода - t1.время_входа)) / 60 AS Продолжительность_поездки,
    t2.среднее_время_ожидания AS Среднее_время_ожидания,
    t2.уровень_комфорта AS Уровень_комфорта
FROM поездки AS t1
JOIN станция_инфо AS t2 ON t1.станция = t2.станция
'''

df = pd.read_sql(query, conn)

# Закрытие соединения с базой данных
conn.close()

# Основные метрики
total_load = df['Станция'].value_counts().reset_index()
total_load.columns = ['Станция', 'Количество пассажиров']
average_load = df['Станция'].value_counts().mean()
df['Пропускная способность, %'] = df['Станция'].map(df['Станция'].value_counts() / average_load * 100)

# Визуализации
fig_load = px.bar(total_load, x='Станция', y='Количество пассажиров', title='Общая загруженность станций')
fig_duration = px.histogram(df, x='Продолжительность_поездки', title='Распределение продолжительности поездок')

# Интерфейс Streamlit
st.title("Аналитический дашборд метрополитена")

st.header("Общая загруженность станций")
st.plotly_chart(fig_load)

st.header("Распределение продолжительности поездок")
st.plotly_chart(fig_duration)

st.header("Детали поездок")
st.dataframe(df)


Запуск Streamlit приложения
Запустите приложение Streamlit, используя команду

In [None]:
streamlit run app.py


Теперь у вас будет интерактивный дашборд, который подключается к базе данных PostgreSQL, отображает основные метрики и визуализации, и позволяет пользователю анализировать данные в реальном времени.