fix: release Python GIL during CPU intensive operations by Gnoale · Pull Request #111 · openai/harmony

Gnoale · 2026-03-31T09:43:11Z

Hi 👋

Fixes #110 to release the Python GIL and avoid deadlocks in servers using asyncio like vLLM

I validated the fix on a base v0.17.0 vLLM docker image, using the make_async helper to make render_for_completion async _make_request_with_harmony

fix: release Python GIL during CPU intensive operations

ead8948

Gnoale mentioned this pull request Mar 31, 2026

[Bug]: tokenizing long redundant sequences causes API server deadlock (harmony and others) vllm-project/vllm#38266

Open

1 task

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix: release Python GIL during CPU intensive operations#111

fix: release Python GIL during CPU intensive operations#111
Gnoale wants to merge 1 commit intoopenai:mainfrom
Gnoale:fix/releaseGil

Gnoale commented Mar 31, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

Gnoale commented Mar 31, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant