# 🧬 Проект NAPI2B ST-GNN • Инициализация окружения

---

## 🎯 Описание проекта

Добро пожаловать в научный анализ белка **NAPI2B** с использованием пространственно-временных графовых нейронных сетей (ST-GNN). Данный фреймворк предназначен для исследования структурных особенностей белка в нормальной и опухолевой ткани яичников.

### 🔬 Биологические детали

**NAPI2B** — мембранный белок:
- **Функция:** Перенос ионов фосфата через мембрану
- **Клиническое значение:** Сверхэкспрессия у 90% пациенток с опухолями яичников
- **Возможная терапия:** Мишень для лекарств и иммунной терапии
- **UniProt ID:** O95436
- **Молекулярная масса:** ~75 кДа

### 🧠 Компьютерный подход

В проекте используются:
1. Молекулярная динамика (15 нс для каждого объекта)
2. ST-GNN
3. Классические ML: XGBoost, Random Forest, SVM
4. Графовый анализ: центральности, сообщества

### 📋 Назначение данного ноутбука

- ✅ Анализ ресурсов системы
- ✅ Создание структуры директорий
- ✅ Формирование конфигураций
- ✅ Генерация документации
- ✅ Валидация готовности

---

**Ожидаемое время выполнения:** 15-20 минут  
**Необходимое место:** ~50 МБ  
**Зависимости:** отсутствуют (чистое создание струтуры)

## 1️⃣ Анализ вычислительных ресурсов

Перед переходом к биоинформатике важно оценить доступность ресурсов — памяти, GPU, диска, среды.

In [None]:
# Анализ Python и аппаратных ресурсов
import sys, os, platform, subprocess, psutil, shutil
from datetime import datetime
import json
print("🔍 Проект NAPI2B ST-GNN — анализ вычислительного окружения")

# Информация о среде Python
print(f"🐍 Версия Python: {sys.version.split()[0]}")
print(f"💻 Платформа: {platform.platform()}")
print(f"🏗️ Архитектура: {platform.machine()}")
print(f"📁 Рабочий каталог: {os.getcwd()}")
# Память
mem = psutil.virtual_memory()
print(f"💾 Оперативная память: {round(mem.total/(1024**3),1)} ГБ; доступно: {round(mem.available/(1024**3),1)} ГБ")
# GPU
try:
    out = subprocess.check_output(['nvidia-smi','-L']).decode()
    print('🎮 GPU обнаружена:', out.splitlines()[0])
except:
    print('❌ GPU не обнаружена')
# Свободное место
disk = shutil.disk_usage('/')
print(f"💽 Доступно на диске: {round(disk.free/(1024**3),1)} ГБ")

🔍 Проект NAPI2B ST-GNN — анализ вычислительного окружения
🐍 Версия Python: 3.12.12
💻 Платформа: Linux-6.6.105+-x86_64-with-glibc2.35
🏗️ Архитектура: x86_64
📁 Рабочий каталог: /content
💾 Оперативная память: 12.7 ГБ; доступно: 11.7 ГБ
❌ GPU не обнаружена
💽 Доступно на диске: 186.4 ГБ


## 2️⃣ Монтирование Google Диска и настройка структуры проекта

In [None]:
# Монтируем Google Диск
from google.colab import drive
drive.mount('/content/drive')
root = '/content/drive/MyDrive/NAPI2B-ST-GNN'
# Проверка свободного места на Google Диске
drive_space = shutil.disk_usage('/content/drive/MyDrive')
print(f'Свободно на Google Диске: {round(drive_space.free/(1024**3),1)} ГБ')

Mounted at /content/drive
Свободно на Google Диске: 10.6 ГБ


## 3️⃣ Формирование структуры директорий

In [None]:
# Список необходимых директорий
dirs = [
 'data/napi2b',
 'data/charmm-gui_output/normal',
 'data/charmm-gui_output/cancer',
 'results/md_trajectories/normal',
 'results/md_trajectories/cancer',
 'notebooks','configs','logs','reports',
 'results/processed_data/graphs',
 'results/models/st_gnn','results/models/classical_ml']
for d in dirs:
 os.makedirs(os.path.join(root,d),exist_ok=True)
 print(f'Создана папка: {d}')

Создана папка: data/napi2b
Создана папка: data/charmm-gui_output/normal
Создана папка: data/charmm-gui_output/cancer
Создана папка: results/md_trajectories/normal
Создана папка: results/md_trajectories/cancer
Создана папка: notebooks
Создана папка: configs
Создана папка: logs
Создана папка: reports
Создана папка: results/processed_data/graphs
Создана папка: results/models/st_gnn
Создана папка: results/models/classical_ml


## 4️⃣ Создание и описание конфигурационных файлов

In [None]:
# Основная конфигурация проекта
config = {
 'project_name': 'NAPI2B ST-GNN',
 'md_time_ns': 15,
 'save_ps': 10,
 'gpu': True,
 'data_folder': 'data/napi2b',
 'description': 'Проект для пространственно-временного анализа белка NAPI2B в норма/опухоль тканях',
 'created': datetime.now().isoformat()
}
with open(os.path.join(root,'configs','project_config.json'),'w') as f:
 json.dump(config,f,indent=2,ensure_ascii=False)
print('Конфигурация сохранена: project_config.json')

Конфигурация сохранена: project_config.json


---
## 🎉 Окружение и структура проекта успешно сформированы!

Дальнейшие шаги:
1. Заполнить папку data/napi2b необходимыми структурами белка и метаданными
2. Добавить CHARMM-GUI файлы в соответствующие папки
3. Запустить следующий ноутбук для MD-симуляции нормы

*Все действия и этапы документированы для воспроизводимости и научной прозрачности.*