Формулировка задачи:  
Задача заключается в создании графа, где узлами являются сотрудники, а ребрами — отношения взаимодействия между ними (например, частота общения, уровень сотрудничества и т.д.). Оптимизация взаимодействия будет заключаться в нахождении наиболее эффективных маршрутов или узловых точек, способствующих повышению продуктивности работы команды.

Признаки для решения задачи:
1. Частота взаимодействия - сколько раз сотрудник взаимодействует с другими.
2. Уровень сотрудничества - оценка на основе совместных проектов или задач.
3. Удаленные/Офисные сотрудники - статус сотрудников; важно для понимания формата взаимодействия.
4. Эффективность общения - основанная на отзывах о совместной работе или результатах.
5. Позиция в организации - роль и уровень в иерархии, что может влиять на взаимодействие.

Набор данных:
- Список сотрудников с уникальными идентификаторами.
- Матрица взаимодействий, в которой строки и столбцы соответствуют сотрудникам, а значения показывают уровень взаимодействия (например, от 0 до 10).
- Дополнительные колонки с признаками: удаленный статус, позиция в компании и оценка сотрудничества.

In [1]:
import random
import pandas as pd

# Параметры
num_employees = 10
employee_ids = [f'E{i}' for i in range(num_employees)]

# Генерация данных о взаимодействии
interaction_matrix = pd.DataFrame(
    index=employee_ids, 
    columns=employee_ids, 
    data=[[random.randint(0, 10) for _ in range(num_employees)] for _ in range(num_employees)]
)

# Генерация дополнительных признаков
remote_status = [random.choice(['Remote', 'On-site']) for _ in range(num_employees)]
positions = [random.choice(['Manager', 'Developer', 'Designer', 'Analyst']) for _ in range(num_employees)]
collaboration_scores = [random.uniform(0, 1) for _ in range(num_employees)]

# Создание итогового DataFrame
data = pd.DataFrame({
    'Employee ID': employee_ids,
    'Remote Status': remote_status,
    'Position': positions,
    'Collaboration Score': collaboration_scores
})

# Сохранение данных
interaction_matrix.to_csv('interaction_matrix.csv')
data.to_csv('employee_data.csv')

print("Синтетические данные успешно сгенерированы и сохранены в файлы 'interaction_matrix.csv' и 'employee_data.csv'.")


Синтетические данные успешно сгенерированы и сохранены в файлы 'interaction_matrix.csv' и 'employee_data.csv'.
