# Задание 3: AI-ассистент в тематическом анализе и проектирование дашборда

**Цель:** Продемонстрировать понимание методологии использования AI-ассистентов для анализа научной литературы и навыки проектирования аналитических дашбордов.

## Контекст

Представьте, что вы проводите исследование на тему **"Влияние ESG-факторов (Environmental, Social, Governance) на инвестиционную привлекательность компаний"**. Вы использовали два источника:

1.  **Библиометрические базы данных (e.g., eLibrary, Scopus)** для получения списка релевантных публикаций (`publications.csv`).
2.  **AI-ассистент (e.g., Elicit)** для извлечения из этих статей ключевых метрик и моделей, которые авторы используют для оценки влияния ESG (`metrics.csv`).

In [None]:
import pandas as pd
from io import StringIO

# --- Исходные данные ---
# publications.csv
publications_data = """
ID,Title,Authors,Year,Citations_RSCI,Industry,Source
1,ESG Impact on Financials,Smith J.,2021,25,Finance,eLibrary
2,Social Responsibility and Stock Prices,Chen L.,2022,40,IT,eLibrary
3,Governance Models in Tech,Ivanov P.,2020,15,IT,eLibrary
4,Environmental Factors in Energy Sector,Davis M.,2022,35,Energy,arXiv
5,Corporate Governance and Profitability,Lee S.,2021,50,Finance,arXiv
"""

# metrics.csv (результат работы AI-ассистента)
metrics_data = """
Metric,Industry,Source_Paper_Title,Frequency
Carbon Emissions,Energy,Environmental Factors in Energy Sector,High
Board Diversity,Finance,Corporate Governance and Profitability,High
Employee Turnover,IT,Social Responsibility and Stock Prices,Medium
ROA (Return on Assets),Finance,ESG Impact on Financials,High
CEO Compensation Ratio,Finance,Corporate Governance and Profitability,Medium
"""

df_pubs = pd.read_csv(StringIO(publications_data))
df_metrics = pd.read_csv(StringIO(metrics_data))

print("Данные о публикациях:")
display(df_pubs)
print("\nИзвлеченные метрики:")
display(df_metrics)

### Задача 1: Формулировка промптов

Чтобы получить данные из `metrics.csv`, необходимо было задать AI-ассистенту правильные вопросы. Сформулируйте **три аналитических вопроса (промпта)**, которые могли бы быть использованы для извлечения данных по трем отраслям (Finance, IT, Energy) на основе темы исследования.

**Ваши промпты:**

1.  **Для отрасли Finance:** *Ваш вопрос...*
2.  **Для отрасли IT:** *Ваш вопрос...*
3.  **Для отрасли Energy:** *Ваш вопрос...*

### Задача 2: Объединение и подготовка данных

Хотя в данном задании файлы уже разделены, для дашборда было бы полезно иметь единый источник по публикациям. Объедините `df_pubs` и `df_metrics` в один DataFrame, используя название статьи (`Title` и `Source_Paper_Title`) в качестве ключа. Назовите новый DataFrame `df_combined`.

In [None]:
# Ваш код для объединения DataFrame
df_combined = pd.merge(
    df_pubs,
    df_metrics,
    left_on='Title',
    right_on='Source_Paper_Title',
    how='left'
)

display(df_combined)

### Задача 3: Проектирование дашборда

Опишите структуру интерактивного дашборда (например, в Yandex Datalens или Power BI), который можно было бы создать на основе полученных данных (`df_pubs` и `df_metrics`).

**Укажите как минимум 5 виджетов и опишите их назначение:**

1.  **Виджет 1 (Фильтр/Селектор):**
    -   **Тип:** Селектор по полю `Industry`.
    -   **Назначение:** Позволит пользователю фильтровать все остальные виджеты на дашборде для анализа конкретной отрасли.

2.  **Виджет 2:**
    -   **Тип:** *... (например, Индикатор, Круговая диаграмма)*
    -   **Назначение:** *...*

3.  **Виджет 3:**
    -   **Тип:** *... (например, Линейный график)*
    -   **Назначение:** *...*

4.  **Виджет 4:**
    -   **Тип:** *... (например, Таблица или Облако слов)*
    -   **Назначение:** *...*

5.  **Виджет 5:**
    -   **Тип:** *... (например, Столбчатая диаграмма)*
    -   **Назначение:** *...*

### Задача 4: Аналитический вывод

На основе предоставленных данных, сделайте краткий вывод. Какие метрики являются наиболее популярными для оценки ESG в финансовой отрасли? Какая статья из представленных является наиболее цитируемой?

**Ваш вывод:**

*