[release/2.8][ROCm][inductor] Improved fast_tanh code generation #2803

naromero77amd · 2025-11-13T01:44:45Z

In the ROCm fork of PyTorch 2.8, Inductor currently has codegen support for fast_tanhf. However, there were some NaN issues in the original Triton implementation of fast_tanhf .

Upstream Triton has an improved fast_tanhf where the NaN issues are now fixed. This upstream commit has been backported to ROCm fork of Triton (see code comments).

A bump in the Triton commit is also needed.

Other notes:

In support of SWDEV-560271
Triton 3.4 backport of upstream Triton commit [AMD] reimplement fast_tanhf() to avoid overflow (#8551) triton#900
Similar to [release/2.7][ROCm][inductor] Improved fast_tanh code generation #2802, [release/2.9][ROCm][inductor] Improved fast_tanh code generation #2804
Related to [ROCm][inductor] Codegen support for fast_tanhf pytorch/pytorch#162052

(cherry picked from commit 7c5277f)

naromero77amd · 2025-11-13T01:45:13Z

I have confirmed that it resolves the reproducer in the Jira.

rocm-repo-management-api · 2025-11-13T01:49:27Z

Jenkins build for 084d7b39ee03b12ab04873ab83bd5d270e241f5a commit finished as FAILURE
Links: Blue Ocean view / Build artifacts

naromero77amd added 2 commits November 13, 2025 00:44

On ROCm, always use fast_tanhf for triton codegen.

78f604a

(cherry picked from commit 7c5277f)

Bump up Triton commit to support fast_tanhf.

084d7b3

naromero77amd requested review from jataylo, jeffdaily, jithunnair-amd and pruthvistony as code owners November 13, 2025 01:44

This was referenced Nov 13, 2025

[release/2.7][ROCm][inductor] Improved fast_tanh code generation #2802

Open

[release/2.9][ROCm][inductor] Improved fast_tanh code generation #2804

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[release/2.8][ROCm][inductor] Improved fast_tanh code generation #2803

[release/2.8][ROCm][inductor] Improved fast_tanh code generation #2803

naromero77amd commented Nov 13, 2025 •

edited

Loading

Uh oh!

naromero77amd commented Nov 13, 2025

Uh oh!

rocm-repo-management-api bot commented Nov 13, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

[release/2.8][ROCm][inductor] Improved fast_tanh code generation #2803

Are you sure you want to change the base?

[release/2.8][ROCm][inductor] Improved fast_tanh code generation #2803

Conversation

naromero77amd commented Nov 13, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

naromero77amd commented Nov 13, 2025

Uh oh!

rocm-repo-management-api bot commented Nov 13, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

naromero77amd commented Nov 13, 2025 •

edited

Loading

rocm-repo-management-api bot commented Nov 13, 2025 •

edited

Loading