In [4]:
import pandas as pd
import numpy as np
import random

# Задаем случайное зерно для воспроизводимости
np.random.seed(42)

# Списки возможных значений для категориальных данных
genders = ['Male', 'Female']
experience_levels = ['Beginner', 'Intermediate', 'Advanced']
routes = ['Букреев', 'Фурманов', 'Панорама', 'Кок-Жайляу', 'Чимбулак']
route_difficulties = ['Easy', 'Medium', 'Hard']
weather_conditions = ['Sunny', 'Cloudy', 'Rainy', 'Snowy']
seasons = ['Spring', 'Summer', 'Autumn', 'Winter']

# Генерация данных для 25 пользователей
data = []
for user_id in range(1, 26):
    p_lvl = np.random.randint(1, 6)  # уровень пользователя от 1 до 5
    m_lvl = np.random.randint(1, 6)  # сложность пройденных маршрутов от 1 до 5
    age = np.random.randint(18, 61)  # возраст от 18 до 60 лет
    gender = random.choice(genders)
    experience = random.choice(experience_levels)
    route_name = random.choice(routes)
    t_r = np.random.randint(60, 201)  # время прохождения маршрута (от 60 до 200 минут)
    avg_t_r = np.random.randint(60, 200)  # среднее время прохождения
    distance = np.random.uniform(5, 20)  # расстояние (от 5 до 20 км)
    elevation_gain = np.random.randint(200, 1501)  # набор высоты (от 200 до 1500 м)
    route_difficulty = random.choice(route_difficulties)
    weather = random.choice(weather_conditions)
    preferred_season = random.choice(seasons)
    group_size = np.random.randint(1, 6)  # размер группы (от 1 до 5 человек)

    data.append([
        user_id, p_lvl, m_lvl, age, gender, experience, route_name,
        t_r, avg_t_r, round(distance, 2), elevation_gain,
        route_difficulty, weather, preferred_season, group_size
    ])

# Создаем DataFrame и сохраняем в CSV
columns = [
    'User_ID', 'P-LVL', 'M-LVL', 'Age', 'Gender', 'Experience_Level',
    'Route_Name', 'T-R (мин)', 'AVG-T-R (мин)', 'Distance (км)', 
    'Elevation_Gain (м)', 'Route_Difficulty', 'Weather_Conditions',
    'Preferred_Season', 'Group_Size'
]

df = pd.DataFrame(data, columns=columns)
df.to_csv('Mountains.csv', index=False)

# Выводим первые 5 строк для проверки
print(df.head())


   User_ID  P-LVL  M-LVL  Age  Gender Experience_Level  Route_Name  T-R (мин)  \
0        1      4      5   32    Male         Beginner    Чимбулак        166   
1        2      3      3   41    Male         Advanced    Чимбулак        176   
2        3      2      4   47    Male         Beginner  Кок-Жайляу         97   
3        4      4      2   39  Female         Beginner    Фурманов        148   
4        5      4      4   33  Female     Intermediate     Букреев         74   

   AVG-T-R (мин)  Distance (км)  Elevation_Gain (м) Route_Difficulty  \
0            131          13.98                 321           Medium   
1            159           7.14                 330             Hard   
2            189           7.73                 476           Medium   
3            108          12.87                 710             Hard   
4            110          10.74                1467             Hard   

  Weather_Conditions Preferred_Season  Group_Size  
0              Sunny        

In [5]:


# 1. Загрузка данных
df = pd.read_csv('Mountains.csv')

# 2. Преобразование категориальных данных
label_encoders = {}
categorical_columns = ['Gender', 'Experience_Level', 'Route_Difficulty', 'Weather_Conditions', 'Preferred_Season']

for col in categorical_columns:
    le = LabelEncoder()
    df[col] = le.fit_transform(df[col])
    label_encoders[col] = le

# 3. Подготовка признаков и меток
features = ['P-LVL', 'M-LVL', 'Age', 'Gender', 'Experience_Level',
            'Distance (км)', 'Elevation_Gain (м)', 'Route_Difficulty', 
            'Weather_Conditions', 'Group_Size']
X = df[features]
y = df['Route_Name']

# 4. Настройка и обучение модели KNN
model = NearestNeighbors(n_neighbors=3, algorithm='auto')
model.fit(X)

# 5. Функция для рекомендации маршрутов
def recommend_route(user_data):
    distances, indices = model.kneighbors([user_data])
    recommended_routes = df.iloc[indices[0]]['Route_Name'].unique()
    return recommended_routes

# 6. Пример использования системы рекомендаций
# Данные нового пользователя: 
# [P-LVL, M-LVL, Age, Gender, Experience_Level, Distance, Elevation Gain, Route Difficulty, Weather, Group Size]
new_user = [3, 2, 30, 0, 1, 12, 500, 1, 0, 3]  # пример: мужчина (Male), Intermediate, 30 лет и т.д.

# Получение рекомендаций
recommendations = recommend_route(new_user)
print(f"Рекомендуемые маршруты: {', '.join(recommendations)}")

Рекомендуемые маршруты: Чимбулак, Кок-Жайляу, Букреев


