<fix> integrate subset of retriever code & fill missing top-k parameter #26

SeongIkKim · 2021-05-04T22:30:17Z

지영님 branch에서 추가된 retrieval argument
run.py에서 누락된 top-k 관련 파라미터 추가
- config의 ST.json에서 retriever 추가 필요

종헌님이 이미 고치시고 commit만 남겨두고 있으신것 같지만 저도 돌려보느라 고쳐놓은 부분들 올렸습니다. 아직 지영님 브랜치 파일 정리가 다 안된것같아 merge해도 무리 없어 보이는 부분들만 제 브랜치에 적용시키고 종헌님 브랜치로 pull request 보냅니다!

BM 25 이슈는 아직 top-k개를 뽑아오지 못해서 정확도가 많이 낮은 문제도 있던것 같습니다.

위의 그래프는 기존 run 코드에서 건모님과 지영님이 구현해두신 top-k 샘플링 적용하여 query당 5개 지문 뽑아왔을 때의 EM입니다.
top-1 sampling에서는 BM25가 EM 6% 가량으로 더 낮게 나왔지만, 샘플링 수를 늘리자 13%가량으로 비슷해졌습니다. F-1은 오히려 근소하게 역전했습니다.

- 지영님 branch에서 추가된 retrieval argument - run.py에서 누락된 top-k 관련 파라미터 추가 - config의 ST.json에서 retriever 추가 필요

ebbunnim · 2021-05-04T23:03:14Z

성익님, 혹시 bm25 돌리면 시간 어느정도 소요되셨나요??

SeongIkKim · 2021-05-05T00:51:57Z

@ebbunnim koelectra 모델 기준으로 top-1 sampling사용할 때 ODQA 전체 14분 걸렸습니다! retriever 파트가 TF-IDF보다 더 오래걸리긴 합니다. TF-IDF는 전체 11분 30초 걸렸네요.

olenmg · 2021-05-05T01:54:55Z

확인했습니다!

ggm1207 · 2021-05-05T08:28:52Z

확인했습니다!

ebbunnim · 2021-05-05T08:31:34Z

확인했습니다!

<fix> integrate subset of retriever code & fill missing top-k parameter

7a5d846

- 지영님 branch에서 추가된 retrieval argument - run.py에서 누락된 top-k 관련 파라미터 추가 - config의 ST.json에서 retriever 추가 필요

SeongIkKim requested review from sooyounlee, ggm1207, ebbunnim and olenmg May 4, 2021 22:30

olenmg merged commit 70c20a4 into jongheon May 5, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

<fix> integrate subset of retriever code & fill missing top-k parameter #26

<fix> integrate subset of retriever code & fill missing top-k parameter #26

SeongIkKim commented May 4, 2021

ebbunnim commented May 4, 2021

SeongIkKim commented May 5, 2021

olenmg commented May 5, 2021

ggm1207 commented May 5, 2021

ebbunnim commented May 5, 2021

<fix> integrate subset of retriever code & fill missing top-k parameter #26

<fix> integrate subset of retriever code & fill missing top-k parameter #26

Conversation

SeongIkKim commented May 4, 2021

ebbunnim commented May 4, 2021

SeongIkKim commented May 5, 2021

olenmg commented May 5, 2021

ggm1207 commented May 5, 2021

ebbunnim commented May 5, 2021