0%

Li, Boying, Danping Zou, Yuan Huang, Xinghan Niu, Ling Pei, and Wenxian Yu. “TextSLAM: Visual SLAM with Semantic Planar Text Features.” arXiv, July 3, 2023. http://arxiv.org/abs/2305.10029.

1 Introduction

本文的贡献:

  1. 提出一个新颖的SLAM 架构,将文本特征集成至前端位姿跟踪、后端优化、回环检测和制图中,本工作开创性地将场景中的文本信息紧耦合至视觉SLAM 中,作者同时提供了一个包含丰富文本信息环境的数据集来进行测试;
  2. 作者从几何语义表示两种层面实现对文本特征的提取、数据关联,并将其集成进SLAM 中;
  3. 提出一种使用文本特征语义信息进行回环检测的方法,可实现在挑战性环境中(如剧烈光照变化、遮挡、视角变化等)的可靠回环检测
阅读全文 »

Zheng, Zengrui, Shifeng Lin, and Chenguang Yang. “RLD-SLAM: A Robust Lightweight VI-SLAM for Dynamic Environments Leveraging Semantics and Motion Information.” IEEE Transactions on Industrial Electronics, 2024, 1–11. https://doi.org/10.1109/TIE.2024.3363744.

Abstract

现存的主流动态SLAM 可分为两个方向:基于语义分割和基于物体检测,两者均存在明显的优劣势,为此,作者提出了一种robust lightweight dynamic SLAM (RLD-SLAM),利用语义、运动信息在动态环境中实现鲁棒、轻量的视觉-惯性SLAM系统。

1 Introduction

本算法结合物体检测贝叶斯滤波器来准确识别出环境中的动态特征点,不依赖于深度信息,因此可适用于各种输入设备。此外,RLD-SLAM 可使用IMU观测预积分来辅助高动态场景中动态物体的跟踪,如Fig.1所示。

阅读全文 »

本文参考文章1文章2

对于C++程序,主程序int main(int argc, char *argv[])中,参数含义如下所示:

  • argc代表向main函数传入参数的数量;
  • argv[]代表传入的字符串构成的数组,默认argv[0]表示程序的名称,后续的argv[1]argv[2]…表示传入的字符串数量。

由于argv[]是字符串数组,若想传入整型参数则需要进行额外操作:

  • 包含头文件 #include <stdlib.h>;
  • int i = atoi(argv[1]);:将字符型argv[1]转换为整型并赋值给 i
1
2
3
4
5
6
7
8
9
10
11
12
#include <iostream>
#include <opencv2/opencv.hpp>
#include <stdlib.h>

int main(int argc, char *argv[])
{
int rows = atoi(argv[1]);
int cols = atoi(argv[2]);
...

return 0;
}

Wu, Yanmin, Yunzhou Zhang, Delong Zhu, Yonghui Feng, Sonya Coleman, and Dermot Kerr. “EAO-SLAM: Monocular Semi-Dense Object SLAM Based on Ensemble Data Association.” In 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 4966–73. Las Vegas, NV, USA: IEEE, 2020. https://doi.org/10.1109/IROS45743.2020.9341757.

1 Introduction

作者认为object SLAM 当前面对两种问题:

  1. 在面对包含多个物体实例的复杂场景中,现有的DA 方法不够鲁棒或准确。
  2. 物体位姿估计不够准确,特别是对于单目object SLAM。

为此,作者提出了一个单目object SLAM 算法——EAO-SLAM,来解决DA 和位姿估计问题。

阅读全文 »

Liu, Chuhao, and Shaojie Shen. “Towards View-Invariant and Accurate Loop Detection Based on Scene Graph.” arXiv, May 24, 2023. http://arxiv.org/abs/2305.14885.

1 Introduction

Lin 等人(Lin 等, 2021)提出了使用随机游走描述子建立物体实例的拓扑结构,进而实现语义图匹配,该方法可实现系数环境中大视角变化下的回环检测;但是,该方法难以处理距离较近的、具有相同语义标签的模糊实例,然而,室内场景中这种情况有很常见,如Fig. 1 所示,这些具有相同语义标签的临近物体实例(如图中的沙发)共享近邻neighbors,如果简单地使用随机游走描述子进行表示,它们会拥有相同的随机游走路线以及同样的拓扑结构描述子,进而会导致回环检测失败。

阅读全文 »

Ji, Xingwu, Peilin Liu, Haochen Niu, Xiang Chen, Rendong Ying, and Fei Wen. “Loop Closure Detection Based on Object-Level Spatial Layout and Semantic Consistency.” arXiv, April 14, 2023. http://arxiv.org/abs/2304.05146.

1 Introduction

本文做出的贡献:

  1. 在3D 场景图中基于拓扑结构与几何匹配的回环检测方法,利用物体的信息和它们的邻域来建立3D 拓扑结构,保证几何布局以及语义属性的一致;
  2. 包含语义标签、bounding box IoU、物体颜色编码、物体级embedding 信息的物体级数据关联方法,基于该方法构建了3D 语义地图
  3. 一个完整的视觉SLAM 系统,实验结果表证明了本算法的优越性。
阅读全文 »

Lin, Shiqi, Jikai Wang, Meng Xu, Hao Zhao, and Zonghai Chen. “Topology Aware Object-Level Semantic Mapping Towards More Robust Loop Closure.” IEEE Robotics and Automation Letters 6, no. 4 (October 2021): 7041–48. https://doi.org/10.1109/LRA.2021.3097242.

Abstract

SLAM 回环检测可有效消除累计误差,但是在大视角变化与环境外观变化时难以实现有效的检测,本文提出了基于物体建模object modeling与语义图匹配semantic graph matching的回环检测技术。作者使用体素与立方体cuboids对环境中的物体进行物体级别特征建模,将环境进一步表示为带有拓扑信息的语义图,在此基础上提出了一种基于edit distance的高效图匹配方法,最终通过语义地图的对齐来实现回环检测。

阅读全文 »

Zhang, Zhihuang, Meng Xu, Wenqiang Zhou, Tao Peng, Liang Li, and Stefan Poslad. “BEV-Locator: An End-to-End Visual Semantic Localization Network Using Multi-View Images.” arXiv, November 27, 2022. http://arxiv.org/abs/2211.14927.

1 Introduction

作者认为,本文提出的BEV-Locator 是第一个利用端到端学习框架解决视觉语义定位问题的工作,主要贡献如下:

  • 提出一个新颖的端到端视觉语义定位架构,利用多视角图片和语义环境实现自身位姿的精确估计,数据驱动的方法避免了几何优化策略设计及参数细调;
  • 利用transformer 架构解决语义地图元素与相机图片之间的跨模态匹配问题
  • 通过一个统一的BEV 特征空间,利用环视图片来增强感知能力;同时,作者验证了视觉语义定位问题可作为基于BEV 特征大模型的子任务进行解决的可行性;
  • 通过大范围数据及验证,作者证明了本方法的优越性。
阅读全文 »

Zhou, Yuxuan, Xingxing Li, Shengyu Li, and Xuanbin Wang. “Visual Mapping and Localization System Based on Compact Instance-Level Road Markings With Spatial Uncertainty.” IEEE Robotics and Automation Letters 7, no. 4 (October 2022): 10802–9. https://doi.org/10.1109/LRA.2022.3196470.

3 System Overview

Fig .1是本系统的基本框架,在本系统中汽车被假设为拥有基本的基于GNSS 的全局定位能力,以及基于轮式里程计或视觉-惯性里程计(VIO)的局部导航能力。对于基于视觉的环境感知,制图与定位阶段共享产生语义道路标志的pipeline。对于位姿估计,一个统一的位姿图优化框架被用于制图和定位阶段,将全局定位、局部导航以及地图匹配(限于终端用户)信息结合在一起实现鲁棒准确的定位。

阅读全文 »

Liao, Ziwei, Wei Wang, Xianyu Qi, and Xiaoyu Zhang. “RGB-D Object SLAM Using Quadrics for Indoor Environments.” Sensors 20, no. 18 (January 2020): 5150. https://doi.org/10.3390/s20185150.

1 Introduction

本文的贡献:

  • 提出了一种使用二次曲面作为物体模型的物体级SLAM 算法,并使用了两种RGB-D 二次曲面观测模型;
  • 提出了一种从单张RGB-D 图片中提取出表示物体的完整椭球体的方法,该方法基于物体和其支撑平面之间的关系;
  • 为二次曲面模型引进了一种非参数位姿图 nonparametric pose graph,来解决后端的语义数据关联问题;
  • 在两个公开数据集和自采数据集上,与两个SOTA 物体级SLAM 算法进行比较,评估了本算法的有效性。
阅读全文 »