Schonberger, Johannes L., Marc Pollefeys, Andreas Geiger, and Torsten Sattler. “Semantic Visual Localization.” In 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 6896–6906. Salt Lake City, UT: IEEE, 2018. https://doi.org/10.1109/CVPR.2018.00721.
1 Introduction
本文遵循基于结构的视觉定位方法,并使用一个三维语义图作为数据库场景database scene 的表示;给定一个带有语义分割和深度图的查询图片,作者建立一个三维的语义查询图,并从中提取到的局部描述子,然后在查询描述子和数据库描述子之间使用3D-3D 匹配,来对齐图并获取所要查询的位姿估计。
所有的视觉定位方法(包括本文提出的方法)都直接或间接地测量一个查询图片与数据库场景表示之间的相似度(视觉或结构),因此,这些方法都默认一个先验假设:查询图与数据库图是在充分相似的条件(视角、光照以及场景外观等)下描述一个场景的。如Fig. 1所示,这种先验假设在实际应用场景中会被轻易地打破。