# 🤖 ТАРС v3 — Обучение на Colab

**512d × 8 слоёв (~103M params)** | Авто-оптимизация под GPU

⚡ **Runtime → Change runtime type → L4** (рекомендуется)

In [None]:
#@title 1. GPU Check
!nvidia-smi --query-gpu=name,memory.total --format=csv,noheader

In [None]:
#@title 2. Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')
print('✅ Drive подключён')

In [None]:
#@title 3. Clone / Update Project
!git clone https://github.com/Vazilll/TarsSSM-Py.git /content/TarsSSM-Py 2>/dev/null || echo '✅ Already cloned'
%cd /content/TarsSSM-Py
!git pull

In [None]:
#@title 4. 🗑️ Удалить ВСЕ старые данные (запусти при переобучении)
import shutil, os, glob
root = '/content/TarsSSM-Py'

# Датасеты
hf = glob.glob(f'{root}/data/hf_*.txt')
for f in hf: os.remove(f)
print(f'✗ Удалено {len(hf)} датасетов (hf_*.txt)')

# Wiki
w = glob.glob(f'{root}/data/wiki_*.txt')
for f in w: os.remove(f)
print(f'✗ Удалено {len(w)} wiki файлов')

# Модели
for d in ['models/tars_v3', 'models/mamba2', 'models/embeddings']:
    p = os.path.join(root, d)
    if os.path.exists(p):
        shutil.rmtree(p)
        print(f'✗ Удалена папка {d}/')

# Логи
for f in glob.glob(f'{root}/*.log'):
    os.remove(f)

# Кеш HuggingFace (освободить место)
hf_cache = os.path.expanduser('~/.cache/huggingface')
if os.path.exists(hf_cache):
    cache_gb = sum(f.stat().st_size for f in __import__('pathlib').Path(hf_cache).rglob('*') if f.is_file()) / 1e9
    shutil.rmtree(hf_cache)
    print(f'✗ Очищен кеш HuggingFace ({cache_gb:.1f} GB)')

print('\n✅ Всё удалено. Запусти ячейку 5 для обучения.')

In [None]:
#@title 5. 🚀 Train
!python colab_train.py

In [None]:
#@title 6. 📊 Results
!ls -lh models/tars_v3/ 2>/dev/null || echo 'No models yet'
print()
!tail -20 mega_train.log 2>/dev/null

### 📁 Где данные на Drive
| Что | Путь |
|-----|------|
| Датасеты | `/MyDrive/TarsData/` |
| Модели | `/MyDrive/TarsModels/` |

### 🔄 Продолжить: `!python colab_train.py --resume`