transformer

Here are 31 public repositories matching this topic...

vectorch-ai / ScaleLLM

A high-performance inference system for large language models, designed for production environments.

performance gpu model production cuda efficiency inference transformer llama speculative serving llm llm-inference llama3

Updated Jun 29, 2024
C++

ggerganov / whisper.cpp

Sponsor

Star

Port of OpenAI's Whisper model in C/C++

inference transformer speech-recognition openai speech-to-text whisper

Updated Jun 28, 2024
C++

intel / xFasterTransformer

Star

intel inference transformer xeon llama model-serving llm chatglm qwen

Updated Jun 28, 2024
C++

ppogg / YOLOv5-Lite

Star

🍅🍅🍅YOLOv5-Lite: Evolved from yolov5 and the size of model is only 900+kb (int8) and 1.7M (fp16). Reach 15 FPS on the Raspberry Pi 4B~

pytorch transformer android-app tensorrt mnn mobilenet ncnn tflite shufflenetv2 onnxruntime yolov5 repvgg pplcnet openvivo picodet

Updated Jun 22, 2024
C++

AXERA-TECH / ax-llm

Star

Explore LLM model deployment based on AXera's AI chips

transformer edge-computing huggingface llm llama2 qwen tinyllama axear

Updated Jun 7, 2024
C++

azkadev / whisper

Sponsor

Star

Whisper Dart is a cross platform library for dart and flutter that allows converting audio to text / speech to text / inference from Open AI models

Updated May 2, 2024
C++

NVIDIA / FasterTransformer

Star

Transformer related optimization, including BERT, GPT

pytorch transformer gpt bert

Updated Mar 27, 2024
C++

bytedance / ByteTransformer

Star

optimized BERT transformer inference on NVIDIA GPU. https://arxiv.org/abs/2210.03052

gpu inference transformer bert

Updated Mar 15, 2024
C++

NiuTrans / NiuTrans.NMT

Star

A Fast Neural Machine Translation System developed in C++.

machine-translation transformer neural-machine-translation fast-decoding

Updated Mar 7, 2024
C++

duyvuleo / Transformer-DyNet

Star

An Implementation of Transformer (Attention Is All You Need) in DyNet

cpp transformer neural-machine-translation dynet sequence-to-sequence-models

Updated Nov 30, 2023
C++

Lennon-cheng / ft-repo

Star

fastertransfomer 实现了 baichuan2 llama vicuna

transformer fastertramsformer

Updated Sep 20, 2023
C++

ashvardanian / TenPack

Star

Fast Tensors Packaging library for text, image, video, and audio data compatible with PyTorch, TensorFlow, & NumPy 🖼️🎵🎥 ➡️ 🧠

parser tensorflow numpy pytorch simd transformer tensor multi-modal clip laion

Updated May 6, 2024
C++

jackvial / tuatara

Star

Tuatara: Deep Learning OCR Engine

nlp machine-learning ocr computer-vision deep-learning transformer text-recognition neural-networks text-detection

Updated Sep 4, 2023
C++

Tencent / TurboTransformers

Star

a fast and user-friendly runtime for transformer inference (Bert, Albert, GPT2, Decoders, etc) on CPU and GPU.

nlp gpu decoder machine-translation inference pytorch transformer albert bert roberta gpt2 huggingface-transformers

Updated Jun 12, 2023
C++

bytedance / lightseq

Star

LightSeq: A High Performance Library for Sequence Processing and Generation

training cuda inference transformer accelerate bart beam-search sampling gpt bert multilingual-nmt diverse-decoding

Updated May 16, 2023
C++

hpc203 / LSTR-lane-detect-onnxrun-cpp-py

Star

使用ONNXRuntime部署LSTR基于Transformer的端到端实时车道线检测，包含C++和Python两个版本的程序

python cpp transformer lane-detection realtime-detection

Updated Jan 27, 2023
C++

neelabalan / final-semester-project-archive

Star

Final semester project in electrical engineering

python iot esp8266 raspberrypi transformer motor circuit voltage mqtt-protocol raspberrypizerow

Updated Dec 13, 2022
C++

athena-team / athena

Star

an open-source implementation of sequence-to-sequence based speech processing engine

deployment tensorflow tts speech-synthesis transformer speech-recognition sequence-to-sequence unsupervised-learning speaker-recognition asr ctc wfst

Updated Dec 2, 2022
C++

bytedance / effective_transformer

Star

Running BERT without Padding

machine-learning tensorflow inference transformer bert

Updated Mar 18, 2022
C++

andrevdl / SmartIO

Star

Transforms common data formats from one type to another, such as JSON, XML and datasets

language json compiler xml dataset transformer data-format

Updated Jan 8, 2022
C++

Improve this page

Add a description, image, and links to the transformer topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the transformer topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

transformer

Here are 31 public repositories matching this topic...

vectorch-ai / ScaleLLM

ggerganov / whisper.cpp

intel / xFasterTransformer

ppogg / YOLOv5-Lite

AXERA-TECH / ax-llm

azkadev / whisper

NVIDIA / FasterTransformer

bytedance / ByteTransformer

NiuTrans / NiuTrans.NMT

duyvuleo / Transformer-DyNet

Lennon-cheng / ft-repo

ashvardanian / TenPack

jackvial / tuatara

Tencent / TurboTransformers

bytedance / lightseq

hpc203 / LSTR-lane-detect-onnxrun-cpp-py

neelabalan / final-semester-project-archive

athena-team / athena

bytedance / effective_transformer

andrevdl / SmartIO

Improve this page

Add this topic to your repo