18 Jun 03:15

Liangchenxu

93ed130

Omni-VRAM v2.5.0 Latest

Latest

Omni-VRAM v2.5.0

📦 更新内容

新增模块

音频增强器（7级管线）
语音质量评估（SNR/PESQ）
LLM会议助手（多供应商）
边缘部署后端（ONNX/TensorRT/Lite）

代码质量

异常处理细化（具体异常类型）
日志格式统一（%s占位符）
内存泄漏修复
线程安全保护

API增强

API Key认证
速率限制（60次/分钟）
输入验证（文件大小、格式）

中文优化

标点恢复
数字/日期规范化
方言转换

📊 数据

28个核心模块
22个测试文件
MIT许可证

📦 安装

pip install omni-vram

🙏 致谢

感谢所有贡献者！

Assets 2

16 Jun 14:36

Liangchenxu

v2.2.1

bfcfedd

Omni-VRAM v2.2.1 - 中文会议转写优化

Omni-VRAM v2.2.1

📝 中文会议转写功能

自动语音转文字
说话人分离
中文标点恢复
话题分段
会议摘要生成

📊 输出格式

SRT字幕
文字稿（带说话人+时间戳）
会议纪要
说话人统计

🇨🇳 中文优化

数字/日期/金额规范化
专业领域词典（医疗/法律/金融）
专有名词识别

🔧 Bug修复

vram_hacker.cu完整实现
AsyncTaskQueue容量限制
WebSocket线程安全
临时文件泄漏修复

🐳 Docker

GPU/CPU双版本
docker-compose一键部署

📦 安装

pip install omni-vram

🙏 致谢

感谢所有贡献者！

Assets 2

16 Jun 08:43

Liangchenxu

v2.1.1

e1e0798

Omni-VRAM v2.1.1 - Docker部署 + 性能对比 + 代码质量

Omni-VRAM v2.1.1

🐳 Docker 支持

GPU版本 Dockerfile（nvidia/cuda）
CPU版本 Dockerfile
docker-compose.yml 一键启动

📊 性能对比

新增 benchmark_comparison.py
Omni-VRAM vs faster-whisper 官方对比
生成 Markdown 对比报告

🔧 代码质量

全部测试统一为 pytest 风格
日志系统统一为 logging
修复5个测试失败
180个测试全部通过

📦 安装

pip install omni-vram

🐳 Docker 快速启动

docker-compose up -d

🙏 致谢

感谢所有贡献者！

Assets 2

16 Jun 03:21

Liangchenxu

v2.1.0

f57a038

Omni-VRAM v2.1.0 - 中文优化 + 实时加速

Omni-VRAM v2.1.0

🎉 重大更新

🇨🇳 中文处理优化

中文标点恢复（自动加逗号、句号）
数字/日期规范化（"二零二四" → "2024"）
方言检测（粤语、四川话、上海话、闽南语）
专业领域词典（医疗、法律、金融）
中文分词优化

⚡ 实时性能优化

Silero VAD 集成（更准的语音检测）
RingBuffer 环形缓冲区（<1ms写入）
延迟追踪系统（p50/p95/p99统计）
Pipeline平均延迟 8.54ms

🔧 Bug修复

修复6个测试失败
修复模型大小估算偏差
修复浮点精度断言
清理冗余文件

📦 安装

pip install omni-vram

📊 数据

22个核心模块
437个测试用例
98.6%测试通过率

🙏 致谢

感谢所有贡献者！

Assets 2

15 Jun 14:32

Liangchenxu

v2.0.0

1e3f6a0

Omni-VRAM v2.0.0 - 完整 LLM 语音交互框架

Omni-VRAM v2.0.0

🎉 重大更新：完整 LLM 语音交互框架

让大模型长出耳朵和嘴巴！22个模块、375个测试、生产级架构。

✨ v2.0.0 新功能

🎙️ 语音识别

多后端 Whisper（faster-whisper / whisper.cpp / OpenAI API）
实时流式 ASR
自动语言检测

🗣️ 说话人分析

说话人分离（谁在什么时候说话）
声纹验证（1:1 和 1:N）
声纹注册和管理

😊 情绪识别

7种情绪（开心、悲伤、生气、中性、惊讶、恐惧、厌恶）
wav2vec2 深度学习后端

🔇 音频处理

多后端噪声消除
音频事件检测
唤醒词检测

🗣️ 语音合成与翻译

TTS（edge-tts / pyttsx3）
语音翻译管道（ASR → 翻译 → TTS）

🏗️ 基础设施

多 GPU 负载均衡
分布式转录
插件系统（热插拔）
Prometheus 监控
REST + gRPC API
Gradio Web UI

📦 安装

pip install omni-vram

🚀 快速开始

from vram_core import WhisperBridge

whisper = WhisperBridge()
result = whisper.transcribe("audio.wav")
print(result.text)

📊 数据

22 个核心模块
375 个测试用例
支持 50+ 种语言

📖 文档

安装指南：docs/installation.md
快速入门：docs/quickstart.md
API 参考：docs/api_reference.md

🙏 致谢

感谢所有贡献者和开源社区！

完整变更日志：https://github.com/Liangchenxu/Omni-VRAM/commits/v2.0.0

Assets 2

14 Jun 14:22

Liangchenxu

v1.0.0

8329be3

v1.0.0 - Production Ready

Omni-VRAM v1.0.0 - Production Ready

完整语音AI平台，20个模块，支持实时转写、降噪、情绪识别、说话人分离、TTS、翻译等。

✨ New Features (v1.0.0)

核心升级

Whisper全系列支持 — tiny/base/small/medium/large-v3/Distil-Whisper
GPU加速 — faster-whisper比原生快5倍
实时流式ASR — 边说边出字，延迟<500ms
Web API — REST + WebSocket接口
gRPC服务 — 高性能RPC接口

AI功能

情绪识别 — wav2vec2深度学习模型，7种情绪
说话人分离 — pyannote-audio，自动识别谁在说话
声纹验证 — 1:1声纹认证，支持声纹库管理
音频事件检测 — 检测笑声、掌声、警报等

语音处理

噪声抑制 — WebRTC/RNNoise三后端
语音合成TTS — edge-tts微软语音
语音翻译 — 实时语音到语音翻译
音频增强 — 归一化、均衡器、修复

生产级架构

多GPU支持 — 管线/数据/张量并行
分布式转录 — 多机多卡并行处理
KV-Cache优化 — NF4/FP4量化，显存减半
监控系统 — Prometheus指标、Grafana仪表盘
插件系统 — 可扩展音频处理管道
唤醒词检测 — 自定义唤醒词

📦 Installation

pip install omni-vram

Assets 2

14 Jun 07:59

Liangchenxu

v0.4.0

903fcd0

Omni-VRAM v0.4.0 - Complete Release

New Features

Whisper Integration — 本地 whisper.cpp 后端，支持多语言转写
Config Module — .env 配置管理，敏感信息自动脱敏
4 Example Apps — 实时语音助手、会议转写、对话机器人、性能测试
Full Documentation — API参考、安装指南、FAQ

Performance

KV-Cache 零拷贝注入：11x faster than torch.cat
音频前端融合：28x faster than PyTorch

Installation

pip install omni-vram

git clone https://github.com/Liangchenxu/Omni-VRAM.git
cd Omni-VRAM && python setup.py install

Documentation

Installation Guide
Quick Start
API Reference
Technical Blog

Thanks

Thanks to all contributors and early testers!

Assets 2

Releases: Liangchenxu/Omni-VRAM

Omni-VRAM v2.5.0

Omni-VRAM v2.5.0

📦 更新内容

新增模块

代码质量

API增强

中文优化

📊 数据

📦 安装

🙏 致谢

Uh oh!

Omni-VRAM v2.2.1 - 中文会议转写优化

Omni-VRAM v2.2.1

📝 中文会议转写功能

📊 输出格式

🇨🇳 中文优化

🔧 Bug修复

🐳 Docker

📦 安装

🙏 致谢

Uh oh!

Omni-VRAM v2.1.1 - Docker部署 + 性能对比 + 代码质量

Omni-VRAM v2.1.1

🐳 Docker 支持

📊 性能对比

🔧 代码质量

📦 安装

🐳 Docker 快速启动

🙏 致谢

Uh oh!

Omni-VRAM v2.1.0 - 中文优化 + 实时加速

Omni-VRAM v2.1.0

🎉 重大更新

🇨🇳 中文处理优化

⚡ 实时性能优化

🔧 Bug修复

📦 安装

📊 数据

🙏 致谢

Uh oh!

Omni-VRAM v2.0.0 - 完整 LLM 语音交互框架

Omni-VRAM v2.0.0

🎉 重大更新：完整 LLM 语音交互框架

✨ v2.0.0 新功能

🎙️ 语音识别

🗣️ 说话人分析

😊 情绪识别

🔇 音频处理

🗣️ 语音合成与翻译

🏗️ 基础设施

📦 安装

🚀 快速开始

📊 数据

📖 文档

🙏 致谢

Uh oh!

v1.0.0 - Production Ready

Omni-VRAM v1.0.0 - Production Ready

✨ New Features (v1.0.0)

核心升级

AI功能

语音处理

生产级架构

📦 Installation

Uh oh!

Omni-VRAM v0.4.0 - Complete Release

Omni-VRAM v0.4.0 - Complete Release

New Features

Performance

Installation

Documentation

Thanks

Uh oh!