Skip to content

GetUpEarlier/minit

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Project MiniT

一个轻量的推理框架

Examples

目前验证过Mistral-7B,Qwen-1.5及llama3-70B等类llama模型,examples里有完整代码

Features

  • Tensor定义及相关接口
  • 基础CUDA算子
  • GPTQ推理支持
  • 基于nccl的分布式支持
  • function trace及graph pattern match功能
  • DTensor接口

Dev Plan

持续开发中

计划支持大部分常见特性,包括分布式,量化,LoDTensor,trace等

随缘更新

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages