Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset #143

chullhwan-song · 2019-06-17T10:25:20Z

chullhwan-song · 2019-06-24T02:15:10Z

Abstract

Google-Landmarks-v2 - 2019
- 5M images of more than 200k different landmarks
- 3개의 형태로 : train, test, index
  - retrieval task에서 test를 쿼리로 하여 index set으로부터 instance(landmark)를 찾는것. mission!!
- The v1 dataset was released after an automated data cleaning step, while the v2 dataset
  is the raw data.
  - 실제적으로 대부분 v1/v2모두 noise한 데이터..
Automated Data Cleaning
- train set을 위해...(보통은)
- KNN 후보를 내고 최종적으로 delf+RANSAC(spatial verification)를 걷쳐 cleaning
- 개인적으로 cleaning했는데도 불구하고 많이 나옴..v2에서 많이 나오는듯으로 예상.
  - 2018년 1위 팀에서 v1의 경우 650개 카테고리 25,000 개 cleaning 데이터를 획득..라고 언급..*

backbone : FishNet-150, ResNet-101 & SE-ResNeXt-101
loss
- cosine-softmax based losses
- ArcFace & CosFace [21] > margin of 0.3.
generalized mean-pooling (GeM)
- p=3, 1이면 global mean pooling과 동일.
- pytorch 소스가 공개되어서 그런지..이번 대회에서 많은 곳이 사용.. 성능이 뛰어나다고 밝힘.

Tesla-V100 GPUs
2개의 aug 전략
- 5 epoch : “soft” data augmentation > random cropping & scaling.
- 7 epoch : “hard” data augmentation. > random brightness shift, random sheer translation, random cropping, scaling.
min-batch 구성할 때의 이미지 사이즈
- 기존에는 GPU Batch 효율성으로 같은 사이즈로 resize해서 구성 이점은 좀 문제라고 봄 > 왜곡?
- 그래서, 비슷한 aspect ratio를 끼리 구성해서 batch 구성
- [352, 384, 448, 512] depending on their aspect ratio. > final epoch에선 [544, 608, 704, 800]
concatenated descriptor becomes a dimension of 3072
inference : multi-scale > scale factors of [0.75, 1.0, 1.25]

chullhwan-song · 2019-06-24T02:15:29Z

Google-Landmarks-v2 - 2019
- 5M images of more than 200k different landmarks
- 3개의 형태로 : train, test, index
  - retrieval task에서 test를 쿼리로 하여 index set으로부터 instance(landmark)를 찾는것. mission!!
- The v1 dataset was released after an automated data cleaning step, while the v2 dataset
  is the raw data.
  - 실제적으로 대부분 v1/v2모두 noise한 데이터..
Automated Data Cleaning
- train set을 위해...(보통은)
- KNN 후보를 내고 최종적으로 delf+RANSAC(spatial verification)를 걷쳐 cleaning
- 개인적으로 cleaning했는데도 불구하고 많이 나옴..v2에서 많이 나온는듯으로 예상.

chullhwan-song added Noise Data Image Retrieval re-ranking labels Jun 17, 2019

chullhwan-song closed this as completed Jun 17, 2019

chullhwan-song reopened this Jun 24, 2019