# Задание 1. Анализ портфеля проектов с использованием графов знаний

**Цель.** Продемонстрировать умение моделировать сложные управленческие взаимосвязи (проекты, менеджеры, инвестиции, результаты) в виде графа знаний и извлекать аналитические инсайты с помощью SPARQL-запросов.

## Исходные данные

Ниже представлены данные о портфеле IT-проектов в компании.

In [None]:
import pandas as pd
from rdflib import Graph, Literal, RDF, RDFS, Namespace, URIRef
from rdflib.namespace import XSD
from pyvis.network import Network

# Исходные данные в виде DataFrame
data = {
    'ProjectID': ['P01', 'P02', 'P03', 'P04', 'P05'],
    'ProjectName': ['CRM Revamp', 'Cloud Migration', 'AI Analytics', 'Mobile App', 'Security Audit'],
    'Manager': ['Anna', 'Boris', 'Anna', 'Ivan', 'Boris'],
    'Investment': [150000, 250000, 300000, 120000, 80000],
    'ROI': [0.15, 0.25, 0.30, 0.12, 0.05], # Return on Investment
    'Status': ['Completed', 'InProgress', 'InProgress', 'Completed', 'Completed']
}
df = pd.DataFrame(data)

print("Исходные данные:")
display(df)

### Задача 1. Определение онтологии

Определите простую онтологию для описания данных. Вам понадобятся:
1.  **Пространства имен (Namespaces):** для данных (`ex`) и для схемы/онтологии (`schema`).
2.  **Классы (Classes):** `Project`, `Manager`.
3.  **Свойства (Properties):** `projectName`, `hasManager`, `investment`, `roi`, `status`.

In [None]:
# Ваш код для определения пространств имен и инициализации графа
g = Graph()

EX = Namespace("http://example.org/data/")
SCHEMA = Namespace("http://example.org/schema#")

g.bind("ex", EX)
g.bind("schema", SCHEMA)
g.bind("rdfs", RDFS)

# Ваш код для добавления классов и свойств в граф



### Задача 2. Преобразование данных в RDF-граф

Используя цикл, пройдитесь по DataFrame `df` и наполните ваш граф `g` RDF-триплетами.

In [None]:
# Ваш код для наполнения графа данными из DataFrame
for index, row in df.iterrows():
    # Создание URIs для проекта и менеджера
    project_uri = EX[row['ProjectID']]
    manager_uri = EX[row['Manager'].replace(' ', '_')]

    # Добавление триплетов


print(f"Граф успешно создан. Количество триплетов: {len(g)}")

### Задача 3: SPARQL-запросы

Напишите и выполните SPARQL-запросы, чтобы ответить на следующие вопросы:

1.  **Найти все проекты, которыми управляет 'Anna'**. Вывести их названия и объем инвестиций.
2.  **Найти проекты со статусом 'InProgress' и ROI (возвратом на инвестиции) выше 0.20**. Отсортировать по убыванию ROI.
3.  **Рассчитать общий объем инвестиций для каждого менеджера**. Вывести имя менеджера и суммарный объем инвестиций.

In [None]:
# Запрос 1: Проекты Анны
q1 = """
PREFIX schema: <http://example.org/schema#>
PREFIX ex: <http://example.org/data/>

SELECT ?projectName ?investment
WHERE {
    # Ваш код запроса
}
"""

print("--- Проекты под управлением Анны ---")
for row in g.query(q1):
    print(f"Проект: {row.projectName}, Инвестиции: {row.investment}")

In [None]:
# Запрос 2: Проекты в работе с высоким ROI
q2 = """
PREFIX schema: <http://example.org/schema#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>

SELECT ?projectName ?roi
WHERE {
    # Ваш код запроса
}
ORDER BY DESC(?roi)
"""

print("\n--- Проекты в работе с ROI > 0.20 ---")
for row in g.query(q2):
    print(f"Проект: {row.projectName}, ROI: {row.roi}")

In [None]:
# Запрос 3: Суммарные инвестиции по менеджерам
q3 = """
PREFIX schema: <http://example.org/schema#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>

SELECT ?managerName (SUM(?investment) AS ?totalInvestment)
WHERE {
    # Ваш код запроса
}
GROUP BY ?managerName
"""

print("\n--- Суммарные инвестиции по менеджерам ---")
for row in g.query(q3):
    print(f"Менеджер: {row.managerName}, Сумма инвестиций: {row.totalInvestment}")

### Задача 4. Визуализация

Визуализируйте фрагмент графа, показывающий проекты, которыми управляет **'Boris'**, и их характеристики. Используйте библиотеку `pyvis`.

In [None]:
net = Network(notebook=True, directed=True)

# SPARQL-запрос для получения данных для визуализации (проекты Бориса)
q_vis = """
PREFIX schema: <http://example.org/schema#>
PREFIX ex: <http://example.org/data/>

SELECT ?project ?projectName ?manager
WHERE {
    ?project schema:hasManager ex:Boris .
    ?project schema:projectName ?projectName .
    ?project schema:hasManager ?manager .
}
"""

for row in g.query(q_vis):
    net.add_node(str(row.project), label=str(row.projectName), color='skyblue')
    net.add_node(str(row.manager), label='Boris', color='orange')
    net.add_edge(str(row.project), str(row.manager), label='managed_by')

net.show("boris_projects.html")

### Выводы

Напишите краткий вывод о том, какие преимущества дал графовый подход для решения поставленных аналитических задач по сравнению с использованием только табличных данных.

**Ваш вывод:**

*