# Тестирование локальных инструментов

Локальные инструменты работают без внешних API:
- Zero-Shot Classifier
- Text Vectorizer  
- Audio Recognizer
- Video Describer
- VQA (Visual Question Answering)

Требуется: PyTorch, transformers, модели Hugging Face

In [4]:
#Если у Вас установлен PyTorch НЕ ЗАПУСКАТЬ
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu -q


[notice] A new release of pip is available: 23.2.1 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [3]:
!pip install transformers -q


[notice] A new release of pip is available: 23.2.1 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [2]:
!pip install --upgrade transformers>=4.26.0 huggingface_hub>=0.16.0 -q 
# Обновление библиотек


[notice] A new release of pip is available: 23.2.1 -> 26.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
# Только в случае НЕ СОВМЕСТИМОСТИ библиотек
!pip uninstall -y torch torchvision torchaudio
!pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cpu
!pip install "numpy<2"

In [4]:
import torch
from transformers import pipeline

print("PyTorch:", torch.__version__)
print("CUDA:", torch.cuda.is_available())

import torch
import numpy as np
print(np.__version__)
print(torch.__version__)


PyTorch: 2.3.0+cpu
CUDA: False
1.23.5
2.3.0+cpu


In [1]:
# Настройка
import sys
from pathlib import Path

grapharchitect_path = Path.cwd().parent.parent / "src" / "GraphArchitectLib"
sys.path.insert(0, str(grapharchitect_path))

print("GraphArchitect добавлен в путь")

GraphArchitect добавлен в путь


## Zero-Shot Text Classifier

Классификация текста без обучения, используя MNLI модель.

In [3]:
try:
    from grapharchitect.tools.LocalTools.Classifiers.ZeroShotTextClassifier import ZeroShotClassifier
    
    # Создание классификатора
    classifier = ZeroShotClassifier(
        model_or_path="facebook/bart-large-mnli"
    )
    
    print("Zero-Shot Classifier создан")
    print(f"  Модель: {classifier.model}")
    
    # Тестовая классификация
    text = "Отличный продукт, очень доволен!"
    labels = ["positive", "negative", "neutral"]
    
    print(f"\nТекст: {text}")
    print(f"Категории: {labels}")
    
    # Раскомментируйте для реального вызова:
    result = classifier.classify(text, labels)
    print(f"\nРезультат: {result}")
    
    print("\nТребуется PyTorch и transformers")
    print("  pip install torch transformers")

except Exception as e:
    print(f"Ошибка: {e}")

INFO:faiss.loader:Loading faiss with AVX2 support.
INFO:faiss.loader:Could not load library with AVX2 support due to:
ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")
INFO:faiss.loader:Loading faiss.
INFO:faiss.loader:Successfully loaded faiss.


Downloading config.json: 0.00B [00:00, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to see activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


Downloading model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

Downloading tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

Downloading vocab.json: 0.00B [00:00, ?B/s]

Downloading merges.txt: 0.00B [00:00, ?B/s]

Downloading tokenizer.json: 0.00B [00:00, ?B/s]

Zero-Shot Classifier создан
  Модель: BartForSequenceClassification(
  (model): BartModel(
    (shared): Embedding(50265, 1024, padding_idx=1)
    (encoder): BartEncoder(
      (embed_tokens): Embedding(50265, 1024, padding_idx=1)
      (embed_positions): BartLearnedPositionalEmbedding(1026, 1024)
      (layers): ModuleList(
        (0-11): 12 x BartEncoderLayer(
          (self_attn): BartAttention(
            (k_proj): Linear(in_features=1024, out_features=1024, bias=True)
            (v_proj): Linear(in_features=1024, out_features=1024, bias=True)
            (q_proj): Linear(in_features=1024, out_features=1024, bias=True)
            (out_proj): Linear(in_features=1024, out_features=1024, bias=True)
          )
          (self_attn_layer_norm): LayerNorm((1024,), eps=1e-05, elementwise_affine=True)
          (activation_fn): GELUActivation()
          (fc1): Linear(in_features=1024, out_features=4096, bias=True)
          (fc2): Linear(in_features=4096, out_features=1024, bias=Tru

## Text Vectorizer

Векторизация текста используя E5 модель.

In [7]:
try:
    from grapharchitect.tools.LocalTools.TextVectorize import TextVectorizer
    
    # Создание векторайзера
    vectorizer = TextVectorizer(
        model_or_path="intfloat/e5-base-v2"
    )
    
    print("Text Vectorizer создан")
    print(f"  Модель: {vectorizer.model}")
    
    # Тестовая векторизация
    texts = [
        "Машинное обучение",
        "Искусственный интеллект",
        "Погода сегодня"
    ]
    
    print(f"\nТексты для векторизации: {len(texts)}")
    
    # Раскомментируйте для реального вызова:
    embeddings = vectorizer.vectorize(texts)
    print(f"Эмбеддинги: {embeddings.shape}")
    
    # Косинусное сходство первых двух
    from numpy import dot
    from numpy.linalg import norm
    similarity = dot(embeddings[0], embeddings[1]) / (norm(embeddings[0]) * norm(embeddings[1]))
    print(f"Сходство 'ML' и 'AI': {similarity:.3f}")
    
    print("\nТребуется PyTorch и transformers")

except Exception as e:
    print(f"Ошибка: {e}")

Downloading config.json:   0%|          | 0.00/650 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/438M [00:00<?, ?B/s]

Downloading tokenizer_config.json:   0%|          | 0.00/314 [00:00<?, ?B/s]

Downloading vocab.txt: 0.00B [00:00, ?B/s]

Downloading tokenizer.json: 0.00B [00:00, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/125 [00:00<?, ?B/s]

Text Vectorizer создан
  Модель: BertModel(
  (embeddings): BertEmbeddings(
    (word_embeddings): Embedding(30522, 768, padding_idx=0)
    (position_embeddings): Embedding(512, 768)
    (token_type_embeddings): Embedding(2, 768)
    (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
    (dropout): Dropout(p=0.1, inplace=False)
  )
  (encoder): BertEncoder(
    (layer): ModuleList(
      (0-11): 12 x BertLayer(
        (attention): BertAttention(
          (self): BertSelfAttention(
            (query): Linear(in_features=768, out_features=768, bias=True)
            (key): Linear(in_features=768, out_features=768, bias=True)
            (value): Linear(in_features=768, out_features=768, bias=True)
            (dropout): Dropout(p=0.1, inplace=False)
          )
          (output): BertSelfOutput(
            (dense): Linear(in_features=768, out_features=768, bias=True)
            (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
            (dropout):

## Тестирование в GraphArchitect

Использование локальных инструментов в полном workflow.

In [9]:
from grapharchitect.services.execution.execution_orchestrator import ExecutionOrchestrator
from grapharchitect.services.selection.instrument_selector import InstrumentSelector
from grapharchitect.services.graph_strategy_finder import GraphStrategyFinder
from grapharchitect.services.embedding.simple_embedding_service import SimpleEmbeddingService
from grapharchitect.entities.task_definition import TaskDefinition
from grapharchitect.entities.connectors.connector import Connector

# Инициализация
embedding = SimpleEmbeddingService(dimension=384)
selector = InstrumentSelector(temperature_constant=1.0)
finder = GraphStrategyFinder()
orchestrator = ExecutionOrchestrator(embedding, selector, finder)

print("GraphArchitect orchestrator инициализирован")
print("\nМожно использовать любые локальные инструменты в workflow")
print("Они будут автоматически интегрированы в граф и выбраны через softmax")

GraphArchitect orchestrator инициализирован

Можно использовать любые локальные инструменты в workflow
Они будут автоматически интегрированы в граф и выбраны через softmax


## Итоги

**Локальные инструменты**:
- Работают офлайн (без API)
- Бесплатные (только GPU/CPU)
- Privacy (данные не уходят)

**Требования**:
- PyTorch
- Transformers
- Модели Hugging Face
- GPU рекомендуется

**Применение**:
- Когда нужна приватность
- Когда нет интернета
- Когда нужно сэкономить на API

**См. также**: `03_integration_example.ipynb` для полных примеров интеграции