Releases: Liangchenxu/Omni-VRAM
Releases · Liangchenxu/Omni-VRAM
Omni-VRAM v2.5.0
Omni-VRAM v2.5.0
📦 更新内容
新增模块
- 音频增强器(7级管线)
- 语音质量评估(SNR/PESQ)
- LLM会议助手(多供应商)
- 边缘部署后端(ONNX/TensorRT/Lite)
代码质量
- 异常处理细化(具体异常类型)
- 日志格式统一(%s占位符)
- 内存泄漏修复
- 线程安全保护
API增强
- API Key认证
- 速率限制(60次/分钟)
- 输入验证(文件大小、格式)
中文优化
- 标点恢复
- 数字/日期规范化
- 方言转换
📊 数据
- 28个核心模块
- 22个测试文件
- MIT许可证
📦 安装
pip install omni-vram
🙏 致谢
感谢所有贡献者!
Omni-VRAM v2.2.1 - 中文会议转写优化
Omni-VRAM v2.2.1
📝 中文会议转写功能
- 自动语音转文字
- 说话人分离
- 中文标点恢复
- 话题分段
- 会议摘要生成
📊 输出格式
- SRT字幕
- 文字稿(带说话人+时间戳)
- 会议纪要
- 说话人统计
🇨🇳 中文优化
- 数字/日期/金额规范化
- 专业领域词典(医疗/法律/金融)
- 专有名词识别
🔧 Bug修复
- vram_hacker.cu完整实现
- AsyncTaskQueue容量限制
- WebSocket线程安全
- 临时文件泄漏修复
🐳 Docker
- GPU/CPU双版本
- docker-compose一键部署
📦 安装
pip install omni-vram
🙏 致谢
感谢所有贡献者!
Omni-VRAM v2.1.1 - Docker部署 + 性能对比 + 代码质量
Omni-VRAM v2.1.1
🐳 Docker 支持
- GPU版本 Dockerfile(nvidia/cuda)
- CPU版本 Dockerfile
- docker-compose.yml 一键启动
📊 性能对比
- 新增 benchmark_comparison.py
- Omni-VRAM vs faster-whisper 官方对比
- 生成 Markdown 对比报告
🔧 代码质量
- 全部测试统一为 pytest 风格
- 日志系统统一为 logging
- 修复5个测试失败
- 180个测试全部通过
📦 安装
pip install omni-vram
🐳 Docker 快速启动
docker-compose up -d
🙏 致谢
感谢所有贡献者!
Omni-VRAM v2.1.0 - 中文优化 + 实时加速
Omni-VRAM v2.1.0
🎉 重大更新
🇨🇳 中文处理优化
- 中文标点恢复(自动加逗号、句号)
- 数字/日期规范化("二零二四" → "2024")
- 方言检测(粤语、四川话、上海话、闽南语)
- 专业领域词典(医疗、法律、金融)
- 中文分词优化
⚡ 实时性能优化
- Silero VAD 集成(更准的语音检测)
- RingBuffer 环形缓冲区(<1ms写入)
- 延迟追踪系统(p50/p95/p99统计)
- Pipeline平均延迟 8.54ms
🔧 Bug修复
- 修复6个测试失败
- 修复模型大小估算偏差
- 修复浮点精度断言
- 清理冗余文件
📦 安装
pip install omni-vram
📊 数据
- 22个核心模块
- 437个测试用例
- 98.6%测试通过率
🙏 致谢
感谢所有贡献者!
Omni-VRAM v2.0.0 - 完整 LLM 语音交互框架
Omni-VRAM v2.0.0
🎉 重大更新:完整 LLM 语音交互框架
让大模型长出耳朵和嘴巴!22个模块、375个测试、生产级架构。
✨ v2.0.0 新功能
🎙️ 语音识别
- 多后端 Whisper(faster-whisper / whisper.cpp / OpenAI API)
- 实时流式 ASR
- 自动语言检测
🗣️ 说话人分析
- 说话人分离(谁在什么时候说话)
- 声纹验证(1:1 和 1:N)
- 声纹注册和管理
😊 情绪识别
- 7种情绪(开心、悲伤、生气、中性、惊讶、恐惧、厌恶)
- wav2vec2 深度学习后端
🔇 音频处理
- 多后端噪声消除
- 音频事件检测
- 唤醒词检测
🗣️ 语音合成与翻译
- TTS(edge-tts / pyttsx3)
- 语音翻译管道(ASR → 翻译 → TTS)
🏗️ 基础设施
- 多 GPU 负载均衡
- 分布式转录
- 插件系统(热插拔)
- Prometheus 监控
- REST + gRPC API
- Gradio Web UI
📦 安装
pip install omni-vram
🚀 快速开始
from vram_core import WhisperBridge
whisper = WhisperBridge()
result = whisper.transcribe("audio.wav")
print(result.text)
📊 数据
- 22 个核心模块
- 375 个测试用例
- 支持 50+ 种语言
📖 文档
- 安装指南:docs/installation.md
- 快速入门:docs/quickstart.md
- API 参考:docs/api_reference.md
🙏 致谢
感谢所有贡献者和开源社区!
完整变更日志:https://github.com/Liangchenxu/Omni-VRAM/commits/v2.0.0
v1.0.0 - Production Ready
Omni-VRAM v1.0.0 - Production Ready
完整语音AI平台,20个模块,支持实时转写、降噪、情绪识别、说话人分离、TTS、翻译等。
✨ New Features (v1.0.0)
核心升级
- Whisper全系列支持 — tiny/base/small/medium/large-v3/Distil-Whisper
- GPU加速 — faster-whisper比原生快5倍
- 实时流式ASR — 边说边出字,延迟<500ms
- Web API — REST + WebSocket接口
- gRPC服务 — 高性能RPC接口
AI功能
- 情绪识别 — wav2vec2深度学习模型,7种情绪
- 说话人分离 — pyannote-audio,自动识别谁在说话
- 声纹验证 — 1:1声纹认证,支持声纹库管理
- 音频事件检测 — 检测笑声、掌声、警报等
语音处理
- 噪声抑制 — WebRTC/RNNoise三后端
- 语音合成TTS — edge-tts微软语音
- 语音翻译 — 实时语音到语音翻译
- 音频增强 — 归一化、均衡器、修复
生产级架构
- 多GPU支持 — 管线/数据/张量并行
- 分布式转录 — 多机多卡并行处理
- KV-Cache优化 — NF4/FP4量化,显存减半
- 监控系统 — Prometheus指标、Grafana仪表盘
- 插件系统 — 可扩展音频处理管道
- 唤醒词检测 — 自定义唤醒词
📦 Installation
pip install omni-vramOmni-VRAM v0.4.0 - Complete Release
Omni-VRAM v0.4.0 - Complete Release
New Features
- Whisper Integration — 本地 whisper.cpp 后端,支持多语言转写
- Config Module — .env 配置管理,敏感信息自动脱敏
- 4 Example Apps — 实时语音助手、会议转写、对话机器人、性能测试
- Full Documentation — API参考、安装指南、FAQ
Performance
- KV-Cache 零拷贝注入:11x faster than torch.cat
- 音频前端融合:28x faster than PyTorch
Installation
pip install omni-vram
or
git clone https://github.com/Liangchenxu/Omni-VRAM.git
cd Omni-VRAM && python setup.py install
Documentation
- Installation Guide
- Quick Start
- API Reference
- Technical Blog
Thanks
Thanks to all contributors and early testers!