New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
checkpoint的结果和论文不一致 #14
Comments
83.8%是30crops的结果,但是作者似乎没有给30crops的测试脚本 |
您好,我检查了一下github上的结果和论文中single view是一致的,但是在用这个checkpoint测试出来的结果差距比较大。 pretrain: checkpoint/vit-16-32f_8232.pt # 81.31584 |
谢谢回复,83.8果然是30 crops的结果,82.32是single view的 |
我的single crop测试结果vit16的8f,16f和32f都会比report的低1个点,不知是不是数据的问题。 |
代码里test阶段drop last我试过去设置成Flase了,如果不设置的话,不同batch size下的测试跑出来的结果有可能会不一样。但是就算设置了还是低,讲道理应该不是数据的问题,因为我这里的数据去跑其它的github都是要略高一点点的
|
您好,我也是这种情况,然后我仔细检查了一下repo里的val list,发现其中有一些和我的不一样(大约180个),不知道是不是这份val set的数据有点偏差:
如果方便您可以check一下这些 |
ps.我的val set包含19887条数据,比这个repo的19357多一点 |
我自己训练了两次v32的最小的模型,效果远远不如论文里面说的好,而且两次结果也差了0.5%以上,感觉这个波动有点大---- 回复的原邮件 ***@***.***>发送日期2022年01月05日 12:57 ***@***.***> 抄送人Zhaoqilin ***@***.******@***.***>主题Re: [sallymmx/ActionCLIP] checkpoint的结果和论文不一致 (Issue #14)
您好,我也是这种情况,然后我仔细检查了一下repo里的val list,发现其中有一些和我的不一样(大约180个),不知道是不是这份val set的数据有点偏差
—Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
You are receiving this because you authored the thread.Message ID: ***@***.***>
[
{
***@***.***": "http://schema.org",
***@***.***": "EmailMessage",
"potentialAction": {
***@***.***": "ViewAction",
"target": "#14 (comment)",
"url": "#14 (comment)",
"name": "View Issue"
},
"description": "View this Issue on GitHub",
"publisher": {
***@***.***": "Organization",
"name": "GitHub",
"url": "https://github.com"
}
}
]
|
font{
line-height: 1.6;
}
ul,ol{
padding-left: 20px;
list-style-position: inside;
}
我测试的这个作者说的结果是82.32%,但是差了1%checkpoint/vit-16-32f_8232.pt batch:1 Top1: 81.31295237131143, Top5: 95.91537176696868batch:2 Top1: 81.30694472565297, Top5: 95.91010325976919batch:4 Top1: 81.31706823243572, Top5: 95.91010325976919batch:8 Top1: 81.31328473066019, Top5: 95.90927501012555batch:16 Top1: 81.31584278768233, Top5: 95.91268233387358batch:32 Top1: 81.31584278768233, Top5: 95.91268233387358batch:64 Top1: 81.32102272727273, Top5: 95.90604707792207drop_last=Falsebatch:1 Top1: 81.31295237131143, Top5: 95.91537176696868batch:2 Top1: 81.3028293769297, Top5: 95.9103102697778batch:4 Top1: 81.31295237131143, Top5: 95.9103102697778batch:8 Top1: 81.31295237131143, Top5: 95.9103102697778batch:16 Top1: 81.31295237131143, Top5: 95.9103102697778batch:32 Top1: 81.31295237131143, Top5: 95.9103102697778batch:64 Top1: 81.31295237131143, Top5: 95.9103102697778
497569188
***@***.***
签名由
网易邮箱大师
定制
在2022年01月5日 ***@***.***> 写道:
代码里test阶段drop last我试过去设置成Flase了,如果不设置的话,不同batch size下的测试跑出来的结果有可能会不一样。但是就算设置了还是低,讲道理应该不是数据的问题,因为我这里的数据去跑其它的github都是要略高一点点的
中single view是一致的,但是在用这个checkpoint测试出来的结果差距比较大。
下面是我的test的yaml文件。在单张3090上跑的
我的single crop测试结果vit16的8f,16f和32f都会比report的低1个点,不知是不是数据的问题。 ps.代码里test阶段drop last了可能会带来一些不一样
ps.我的val set包含19887条数据,比这个repo的19357多一点
—Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
感谢回复,我这边vit-b-16 32frame的结果是:top1=81.05846 top5=95.65524,和你一样差不多低了1个点 |
font{
line-height: 1.6;
}
ul,ol{
padding-left: 20px;
list-style-position: inside;
}
我猜想作者的测试集是不是删除了一些困难的样本
497569188
***@***.***
签名由
网易邮箱大师
定制
在2022年01月5日 ***@***.***> 写道:
font{
line-height: 1.6;
}
ul,ol{
padding-left: 20px;
list-style-position: inside;
}
我测试的这个作者说的结果是82.32%,但是差了1%checkpoint/vit-16-32f_8232.pt batch:1 Top1: 81.31295237131143, Top5: 95.91537176696868batch:2 Top1: 81.30694472565297, Top5: 95.91010325976919batch:4 Top1: 81.31706823243572, Top5: 95.91010325976919batch:8 Top1: 81.31328473066019, Top5: 95.90927501012555batch:16 Top1: 81.31584278768233, Top5: 95.91268233387358batch:32 Top1: 81.31584278768233, Top5: 95.91268233387358batch:64 Top1: 81.32102272727273, Top5: 95.90604707792207drop_last=Falsebatch:1 Top1: 81.31295237131143, Top5: 95.91537176696868batch:2 Top1: 81.3028293769297, Top5: 95.9103102697778batch:4 Top1: 81.31295237131143, Top5: 95.9103102697778batch:8 Top1: 81.31295237131143, Top5: 95.9103102697778batch:16 Top1: 81.31295237131143, Top5: 95.9103102697778batch:32 Top1: 81.31295237131143, Top5: 95.9103102697778batch:64 Top1: 81.31295237131143, Top5: 95.9103102697778
497569188
***@***.***
签名由
网易邮箱大师
定制
在2022年01月5日 ***@***.***> 写道:
代码里test阶段drop last我试过去设置成Flase了,如果不设置的话,不同batch size下的测试跑出来的结果有可能会不一样。但是就算设置了还是低,讲道理应该不是数据的问题,因为我这里的数据去跑其它的github都是要略高一点点的
中single view是一致的,但是在用这个checkpoint测试出来的结果差距比较大。
下面是我的test的yaml文件。在单张3090上跑的
我的single crop测试结果vit16的8f,16f和32f都会比report的低1个点,不知是不是数据的问题。 ps.代码里test阶段drop last了可能会带来一些不一样
ps.我的val set包含19887条数据,比这个repo的19357多一点
—Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
您好,我检查了下这个repo的val数据发现两个问题:
|
font{
line-height: 1.6;
}
ul,ol{
padding-left: 20px;
list-style-position: inside;
}
按我的理解,原始视频就算是重命名也不会去更改英文字母,所以很有可能是混入了其他数据
497569188
***@***.***
签名由
网易邮箱大师
定制
在2022年01月5日 ***@***.***> 写道:
想作者的测试集是不是删除了一些困难的样本
您好,我检查了下这个repo的val数据发现两个问题:
有一些样本无法从官方的val list找到,不确定是不是作者把原始视频重命名了还是混入了其他数据;
有一些官方的val list的数据在这个repo的val list里没有。
—Reply to this email directly, view it on GitHub, or unsubscribe.Triage notifications on the go with GitHub Mobile for iOS or Android.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
我也测试了一下,发现作者的val list非常奇怪。他好像把开头为'-' 或者 “ _ ” 的 vid 都删去了'-' 和 " _ " 的字符。但即使复原后也会少差不多80+的数据,如下。
作者大大能不能把这部分给一下啊 |
您好,
ViT-B/16 | frame 32 在论文里面是83.8%,但是github里面写的是82.32%,我用这个checkpoint跑出来的结果是81.3%。
ViT-B/32 | frame 8的结果貌似上传错了,这个文件名和测试结果和ViT-B/16 | frame 32 的一样。
The text was updated successfully, but these errors were encountered: