Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

是否能支持4.37.2 的transformers #16

Open
awzhgw opened this issue Apr 11, 2024 · 3 comments
Open

是否能支持4.37.2 的transformers #16

awzhgw opened this issue Apr 11, 2024 · 3 comments

Comments

@awzhgw
Copy link

awzhgw commented Apr 11, 2024

是否能支持4.37.2 的transformers

@shikiw
Copy link
Owner

shikiw commented Apr 15, 2024

你好,

我在README里添加了如何在其他版本transformers中使用OPERA的步骤here,你可以参考一下。

@starlxx
Copy link

starlxx commented Jun 27, 2024

你好,

我在README里添加了如何在其他版本transformers中使用OPERA的步骤here,你可以参考一下。

在4.40版本的transformers中尝试了,调不通,版本相差较大的,感觉有些函数新版本里也没有用了,很难调通

@Lumos0917
Copy link

你好,
我在README里添加了如何在其他版本transformers中使用OPERA的步骤here,你可以参考一下。

在4.40版本的transformers中尝试了,调不通,版本相差较大的,感觉有些函数新版本里也没有用了,很难调通

你好,请问调通了吗,我debug发现主要的问题是不同版本的transformers库里面对于past_key_value等参数的更新步骤不一致,在4.37.2 以上的transformers执行forward函数时会立即更新所有model_kwarg参数,并且原代码中的model_kwargs_tmp = model_kwargs.copy()似乎是一个浅拷贝,model_kwarg和model_kwargs_tmp两者的更新情况是一致的

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants