optmize baichuan in pytorch engine #1223

grimoire · 2024-03-01T04:27:45Z

Tested on 1000 prompts

main

7B batch-size 256

concurrency: 256
elapsed_time: 136.351s

first token latency(s)(min, max, ave): 0.268, 14.395, 4.825
per-token latency(s) percentile(50, 75, 95, 99): [0.082, 0.092, 0.186, 0.52]

number of prompt tokens: 251952
number of completion tokens: 227002
token throughput (completion token): 1664.835 token/s
token throughput (prompt + completion token): 3512.653 token/s
RPS (request per second): 7.334 req/s
RPM (request per minute): 440.041 req/min

13B batch-size 128

concurrency: 128
elapsed_time: 185.828s

first token latency(s)(min, max, ave): 0.231, 11.174, 2.385
per-token latency(s) percentile(50, 75, 95, 99): [0.062, 0.064, 0.191, 0.52]

number of prompt tokens: 251952
number of completion tokens: 227002
token throughput (completion token): 1221.571 token/s
token throughput (prompt + completion token): 2577.406 token/s
RPS (request per second): 5.381 req/s
RPM (request per minute): 322.879 req/min

this repo

7B batch-size 256

concurrency: 256
elapsed_time: 131.733s

first token latency(s)(min, max, ave): 0.267, 15.520, 5.049
per-token latency(s) percentile(50, 75, 95, 99): [0.081, 0.092, 0.17, 0.469]

number of prompt tokens: 251952
number of completion tokens: 227002
token throughput (completion token): 1723.197 token/s
token throughput (prompt + completion token): 3635.793 token/s
RPS (request per second): 7.591 req/s
RPM (request per minute): 455.467 req/min

13B batch-size 128

concurrency: 128
elapsed_time: 171.667s

first token latency(s)(min, max, ave): 0.218, 8.568, 1.984
per-token latency(s) percentile(50, 75, 95, 99): [0.058, 0.061, 0.177, 0.475]

number of prompt tokens: 251952
number of completion tokens: 227002
token throughput (completion token): 1322.339 token/s
token throughput (prompt + completion token): 2790.017 token/s
RPS (request per second): 5.825 req/s
RPM (request per minute): 349.514 req/min

RunningLeon

LGTM

optmize baichuan

2169a6f

lvhan028 added the improvement label Mar 1, 2024

lvhan028 requested review from RunningLeon and lvhan028 March 1, 2024 07:20

lvhan028 approved these changes Mar 1, 2024

View reviewed changes

RunningLeon approved these changes Mar 1, 2024

View reviewed changes

lvhan028 changed the title ~~optmize baichuan~~ optmize baichuan in pytorch engine Mar 1, 2024

lvhan028 merged commit e549424 into InternLM:main Mar 1, 2024
4 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

optmize baichuan in pytorch engine #1223

optmize baichuan in pytorch engine #1223

grimoire commented Mar 1, 2024

RunningLeon left a comment

optmize baichuan in pytorch engine #1223

optmize baichuan in pytorch engine #1223

Conversation

grimoire commented Mar 1, 2024

RunningLeon left a comment

Choose a reason for hiding this comment