luaMTS LocalScript Agent

luaMTS - локальный агент для генерации LowCode/LocalScript-совместимого Lua-кода.

Проект не является универсальным coding assistant. Он решает узкую задачу: по пользовательскому описанию и JSON-контексту сгенерировать Lua-скрипт для LowCode, проверить результат детерминированными валидаторами и при необходимости сделать ограниченный repair.

Что делает проект

принимает задачу на русском или английском языке;
понимает LowCode-контекст wf.vars и wf.initVariables;
генерирует Lua в контракте lua{...}lua внутри JSON object;
запрещает JsonPath, markdown, пояснения вокруг JSON, print/debug output и error();
проверяет результат через validation pipeline;
делает bounded repair без бесконечного цикла;
после исчерпания repair budget может запросить user-assisted repair;
поддерживает one-shot planning через /plan;
показывает debug trace по слоям pipeline;
запускается локально через Docker Compose и Ollama.

Текущий pipeline

Основной API path: POST /generate.

Фактический happy path:

request_received
-> planner
-> prompter
-> generation
-> deterministic_validation
-> semantic_validation
-> response_ready

Если deterministic validation нашла repairable ошибку, включается ограниченный repair loop:

deterministic_validation
-> repair_generation
-> deterministic_validation
-> semantic_validation
-> response_ready

По умолчанию repair budget равен 2: первая генерация плюс один repair-generation проход. Значение можно менять в CLI/debug-запросах.

Если repair budget исчерпан и задача всё ещё не прошла validation, interactive CLI может показать краткое assisted-repair summary и предложить следующую широкую итерацию по выбору пользователя.

Роли слоёв

planner строит компактный TaskSpec: операция, output mode, input roots, expected shape, риски и edge cases. Planner не генерирует Lua.

prompter не переписывает основной generator prompt. Он добавляет короткие русские подсказки к уже готовому LowCode-контракту. Добавки фильтруются: подсказки вида "бросай ошибку", error() и похожие конфликтующие инструкции не попадают в prompt генератора.

semantic_critic вызывается только после успешного deterministic validation. Он проверяет, действительно ли candidate делает то, что просил пользователь, и не перепутаны ли поле, операция или итоговая форма ответа.

generator получает полный LowCode prompt и возвращает только JSON object. Каждое Lua-значение должно быть строкой вида:

{
  "result": "lua{return wf.vars.emails[#wf.vars.emails]}lua"
}

truncation guard защищает generator от обрезки на num_predict=256. Если модель вернула ровно лимит токенов, частичный ответ временно сохраняется, а генератор получает continuation prompt с уже выведенным фрагментом. Так продолжается до ответа короче лимита или до внутреннего лимита продолжений. Временные файлы удаляются после финального статуса задачи.

deterministic_validation включает форматные, синтаксические, статические, principle/domain и rule checks. Для LowCode JSON сначала проверяется валидность JSON и wrapper lua{...}lua, затем извлекаются Lua-сегменты и проверяются Lua-правила.

critic_report в текущем контуре остаётся структурированным решением orchestrator-а: finalize или repair. Он опирается на deterministic reports и результат semantic_critic.

LowCode Lua contract

Generator обязан соблюдать эти правила:

ответ только JSON object;
Lua внутри JSON-строк: lua{<Lua код>}lua;
Lua-код возвращает значение через return, если задача просит получить значение;
доступ к данным только напрямую через Lua;
LowCode-переменные лежат в wf.vars;
входные variables лежат в wf.initVariables;
JsonPath запрещён;
print, debug output, markdown и пояснения запрещены;
error() запрещён: для некорректного входа надо вернуть nil, false или пустую строку по смыслу задачи;
новый массив создаётся через _utils.array.new();
существующий массив при необходимости помечается через _utils.array.markAsArray(arr).

Разрешённое базовое подмножество Lua ориентировано на:

nil, boolean, number, string, array, table, function;
if...then...else;
while...do...end;
for...do...end;
repeat...until.

Быстрый запуск через Docker

Это рекомендуемый путь для жюри и проверки на любой ОС.

Требования

Docker Desktop или Docker Engine с Docker Compose v2;
доступ в интернет на первом запуске, если модель скачивается через ollama pull;
свободные порты 8011 для API и 11434 для Ollama, либо переопределённые порты.

Windows PowerShell

git clone <repo-url>
cd luaMTS
docker compose up --build

Проверка API во втором терминале:

Invoke-RestMethod http://127.0.0.1:8011/health
docker compose exec api luamts doctor

Интерактивный CLI:

docker compose exec api luamts

Одноразовая генерация:

docker compose exec api luamts generate --mode release --task "Из массива emails верни последний email." --context '{"wf":{"vars":{"emails":["a@example.com","b@example.com"]}}}'

Остановка:

docker compose down

macOS / Linux

git clone <repo-url>
cd luaMTS
docker compose up --build

Проверка API во втором терминале:

curl http://127.0.0.1:8011/health
docker compose exec api luamts doctor

Интерактивный CLI:

docker compose exec api luamts

Одноразовая генерация:

docker compose exec api luamts generate --mode release --task "Из массива emails верни последний email." --context '{"wf":{"vars":{"emails":["a@example.com","b@example.com"]}}}'

Остановка:

docker compose down

Если порты заняты

Windows PowerShell:

$env:API_PUBLISHED_PORT='18011'
$env:OLLAMA_PUBLISHED_PORT='21434'
docker compose up --build

macOS / Linux:

API_PUBLISHED_PORT=18011 OLLAMA_PUBLISHED_PORT=21434 docker compose up --build

После этого API будет доступен на http://127.0.0.1:18011.

Выбор модели

По умолчанию compose использует локальную модель:

qwen3.5:9b

Это официальный Ollama tag с quantization Q4_K_M; compose тянет его в Docker volume ollama-data через ollama-model-init. API отправляет think: false в Ollama /api/generate и /api/chat, поэтому Qwen3.5 используется в non-thinking режиме.

Переопределение:

Windows PowerShell:

$env:OLLAMA_MODEL='qwen3.5:9b'
docker compose up --build

macOS / Linux:

OLLAMA_MODEL=qwen3.5:9b docker compose up --build

Cloud-tags вида *-cloud запрещены в release и releaseSlim. Они допустимы только для debug-разработки с явным --allow-cloud-model и не являются конкурсным runtime.

Локальный запуск без Docker

Этот путь удобен для разработки.

Установить Python 3.12.
Установить и запустить Ollama.
Установить зависимости API.

PowerShell:

cd apps/api
python -m pip install -e .
$env:PYTHONPATH='.;..\..'
$env:OLLAMA_BASE_URL='http://127.0.0.1:11434'
python -m uvicorn main:app --host 127.0.0.1 --port 8011

macOS / Linux:

cd apps/api
python -m pip install -e .
export PYTHONPATH=".:../.."
export OLLAMA_BASE_URL="http://127.0.0.1:11434"
python -m uvicorn main:app --host 127.0.0.1 --port 8011

CLI

Команды:

luamts doctor
luamts generate
luamts bench
luamts vram-check
luamts

Интерактивный режим поддерживает slash-команды:

/debug
/release
/release-slim
/model qwen3.5:9b
/model n
/allow-cloud on
/repair-budget 2
/with-api
/without-api
/plan
/feedback <text>
/status
/exit

/model n возвращает стандартную модель.

/plan включает planning preflight только для следующего запроса. После выполнения задачи флаг автоматически сбрасывается. В status-строке CLI это видно как Plan: on или Plan: off.

В debug mode CLI показывает прогресс по слоям во время работы API. В release mode отображается минимальный progress/spinner и итоговый статус. В releaseSlim status-строка компактнее: без Params.

CLI умеет принимать многострочную вставку JSON-контекста в интерактивном вводе. Человекочитаемый вывод результата разворачивает \n в реальные строки, но debug JSON печатается без изменения JSON-экранирования.

API пример

PowerShell:

$body = @{
  task_text = 'Из полученного списка email получи последний.'
  provided_context = '{"wf":{"vars":{"emails":["user1@example.com","user2@example.com"]}}}'
  debug = $true
  mode = 'debug'
  language = 'ru'
  repair_budget = 2
} | ConvertTo-Json -Depth 20 -Compress

Invoke-RestMethod -Method Post -Uri 'http://127.0.0.1:8011/generate' -ContentType 'application/json; charset=utf-8' -Body $body | ConvertTo-Json -Depth 40

curl:

curl -s http://127.0.0.1:8011/generate \
  -H 'Content-Type: application/json' \
  -d '{"task_text":"Из полученного списка email получи последний.","provided_context":"{\"wf\":{\"vars\":{\"emails\":[\"user1@example.com\",\"user2@example.com\"]}}}","debug":true,"mode":"debug","language":"ru","repair_budget":2}' \
  | python -m json.tool

Для live progress можно использовать:

POST /generate/progress

Endpoint отдаёт NDJSON events: progress, затем final или error.

Benchmark

В проекте есть benchmark-артефакты и runner-скрипты.

Последний прогон:

artifacts/benchmark_runs/7_progon/

Итог 7_progon на 50 выбранных задач из файла с 300 задачами:

total: 50
status_counts: {'passed': 50}
passed_without_hint: 47
passed_with_hint: 3
passed_on_generation_counts: {'1': 48, '2': 2}

Runner:

python scripts\run_lua_7_progon_benchmark.py

Сначала каждая задача запускается без сильной подсказки. Если validation не прошла, скрипт делает вторую benchmark-попытку с сильной подсказкой. Эталонное решение сохраняется в отчёт только для анализа и не отправляется в API.

Проверка разработки

Релевантные тесты:

python -m pytest apps\api\tests packages\benchmark\tests -q

Проверка compose-файла без запуска:

docker compose config

Документы

docs/how_validation_work.md - фактическое состояние validation pipeline.
docs/AGENT_PIPELINE_SEQUENCE.md - sequence diagram текущего pipeline.
docker/README.md - Docker-поставка и варианты запуска.
docs/CLI_CLIENT.md - CLI режимы и UX.
docs/CONSTRAINTS.md - ограничения проекта.
docs/OUTPUT_MODES.md - режимы вывода.
docs/TASK_ARCHETYPES.md - архетипы задач.

Ограничения

Конкурсный/release runtime должен быть локальным.
Внешние AI API запрещены.
Ollama cloud-tags допустимы только в debug-разработке и только явно.
Release mode фиксирует компактные параметры: num_ctx=4096, num_predict=256, batch=1, parallel=1, num_gpu=-1.
releaseSlim использует те же компактные параметры, но без num_gpu=-1, поэтому CPU offload не блокируется.
Для Qwen3.5 defaults: temperature=0.7, top_p=0.8, top_k=20, min_p=0.0, presence_penalty=1.5, repeat_penalty=1.0.
Debug mode может менять модель, runtime options и cloud guard.

Структура

apps/api/                  FastAPI backend and CLI
packages/orchestrator/     planner/prompter/generator prompt assembly
packages/validators/       deterministic validation pipeline
packages/benchmark/        benchmark helpers and tests
benchmark/                 benchmark datasets
scripts/                   benchmark/import/report scripts
docker/                    Docker image helpers
docs/                      architecture and operation docs
artifacts/benchmark_runs/  generated benchmark reports

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
apps		apps
benchmark		benchmark
docker		docker
docs		docs
knowledge		knowledge
packages		packages
scripts		scripts
slides		slides
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
.luacheckrc		.luacheckrc
.stylua.toml		.stylua.toml
AGENTS.md		AGENTS.md
C4.md		C4.md
OSP.md		OSP.md
PROJECT_STATUS_full.md		PROJECT_STATUS_full.md
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

luaMTS LocalScript Agent

Что делает проект

Текущий pipeline

Роли слоёв

LowCode Lua contract

Быстрый запуск через Docker

Требования

Windows PowerShell

macOS / Linux

Если порты заняты

Выбор модели

Локальный запуск без Docker

CLI

API пример

Benchmark

Проверка разработки

Документы

Ограничения

Структура

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

luaMTS LocalScript Agent

Что делает проект

Текущий pipeline

Роли слоёв

LowCode Lua contract

Быстрый запуск через Docker

Требования

Windows PowerShell

macOS / Linux

Если порты заняты

Выбор модели

Локальный запуск без Docker

CLI

API пример

Benchmark

Проверка разработки

Документы

Ограничения

Структура

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages