Open source machine learning (ML) work based on the Python programming language and the Torch library with PyTorch.
عادة الإعمار المتزامن متعدد العناصر ثلاثي الأبعاد ، ووضع 6D وتقدير الحجم من خلال ملاحظة RGB-D أحادية العرض. على عكس تقدير الوضع على المستوى غير المباشر ، فإننا نركز على مشكلة أكثر صعوبة حيث لا تتوفر نماذج CAD في وقت الاستدلال. تتبع الأساليب الحالية بشكل أساسي خط أنابيب معقد متعدد المراحل يقوم أولاً بترجمة وكشف كل مثيل كائن في الصورة ثم يتراجع إلى شبكاتهم ثلاثية الأبعاد أو أوضاعهم 6D.
data
├── CAMERA
│ ├── train
│ └── val_subset
├── Real
│ ├── train
└── └── test
3D maps of a ground reality object are computed using a Gaussian kernel based on the Yxyg scale for each object.
Bevel distance evaluation on a multiobject ShapeNet dataset.
- C. R. Qi, H. Su, K. Mo, and L. J. Guibas, “PointNet: Deep learning on point sets for 3d classification and segmentation,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2017, pp. 652–660.
- A. X. Chang, T. Funkhouser, L. Guibas, P. Hanrahan,Q. Huang, Z. Li, S. Savarese, M. Savva, S. Song, H. Su et al., “ShapeNet: An information-rich 3d model repository,” arXiv preprint arXiv:1512.03012, 2015.
- L. Van der Maaten and G. Hinton, “Visualizing data using t-SNE,” Journal of machine learning research, vol. 9, no. 11, 2008.
- Y. Zhou, C. Barnes, J. Lu, J. Yang, and H. Li, “On the continuity of rotation representations in neural networks,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2019, pp.
- G. Pitteri, M. Ramamonjisoa, S. Ilic, and V. Lepetit, “On object symmetries and 6d pose estimation from images,” in 2019 International Conference on 3D Vision (3DV). IEEE, 2019, pp. 614–622.
- X. Chen, Z. Dong, J. Song, A. Geiger, and O. Hilliges,“Category level object pose estimation via neural analysis-by-synthesis,” in European Conference on Computer Vision. Springer, 2020, pp. 139–156.