[5.3.0] T5 model under FP16 is generating garbage #554

lanking520 · 2023-04-12T23:30:37Z

Branch/Tag/Commit

5.3.0

Docker Image Version

pytorch 22.09

GPU name

A10G

CUDA Driver

Any

Reproduced Steps

Similar to https://github.com/NVIDIA/FasterTransformer/issues/470. You can just change all weights into fp16 and inference using fp16.

Both Summarization and Translation task give very poor result.

Tested on:
- FlanT5 XXL, FlanT5-XL, FlanT5-UL2.

Tested using TP2 with 2 GPUs under fp16.

lanking520 · 2023-04-12T23:30:59Z

related to #470

byshiue · 2023-04-13T00:35:02Z

Thank you for the feedback. We find such behavior on large model and investigate the reason.

lanking520 added the bug Something isn't working label Apr 12, 2023

byshiue mentioned this issue Apr 27, 2023

Converting Flan-UL2 does not produce encoder files #565

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[5.3.0] T5 model under FP16 is generating garbage #554

[5.3.0] T5 model under FP16 is generating garbage #554

lanking520 commented Apr 12, 2023

lanking520 commented Apr 12, 2023

byshiue commented Apr 13, 2023

[5.3.0] T5 model under FP16 is generating garbage #554

[5.3.0] T5 model under FP16 is generating garbage #554

Comments

lanking520 commented Apr 12, 2023

Branch/Tag/Commit

Docker Image Version

GPU name

CUDA Driver

Reproduced Steps

lanking520 commented Apr 12, 2023

byshiue commented Apr 13, 2023