SLAM论文从零到一
对2023年3月26日微信公众号《计算机视觉life》直播的一个总结
主讲人的经历:
主讲人情况:
博⼀开始入门,经历了⼀年多发了第⼀篇论文(顶会);
实验室没有足够的积淀,缺乏指导;目前发表了RAL、ICRA等。
开始的问题:
没有正面反馈;不知道怎么选题;不知道怎么看论文和代码;一直在入门,从来没进门。
转变的契机:
加入了星球,然后开始和别人交流,交流是非常重要的。
我觉得最重要的契机还是第一篇论文想法的提出,有想法了工作才有明确的方向,各种正面的反馈才会到来。
开始做研究:
行动写代码,做实验,思考结论,反复做实验;投稿;修稿,回复审稿人。
ORB-SLAM3有个突出的贡献,即多地图,而主讲人学习ORB-SLAM3的同时在做无共同视野的多相机之间的标定项目,这两个东西突然产生了共鸣;
之后提出了“尝试多相机分别运行ORB-SLAM3建图, 然后建图之后利用每个相机的地图来计算标定参数”的想法;
开始在ORB-SLAM3的基础上改代码,集中看某些部分的代码,写了两个月的代码,做了实验,然后这个相机标定的精度是OK的;
在前一步的基础上开始思考为什么有的场景效果不太好,如何改进,如何选择特征点,如何消除ORB-SLAM3的累积误差等;
最终做完实验,第⼀次正式写小论文,投了RAL,过了两个月收到 review,然后给了⼀个月改稿时间,根据审稿人意见补充实验,改进方案,和审稿人解释自己的工作,最后成功被接收。
在发了第⼀篇论文之后就不焦虑了,生活状态也好起来了,发论文基本的流程都熟悉过⼀遍,可以更快地发出新的论文了。
论文从一到多:
没有山顶上的指导,就站在山腰上指路。所以作为站在山腰上的人,开始帮助四个师弟学习,帮助他们入门,以输出的方式进行思考。
学习建议:
- 单打独斗不可取,一定要找组织,多交流,保持输出;
- 保证一定量的输入,有输入才能有产出;
- 比如直接看代码,ORB-SLAM、VINS的代码,但是一定要明白自己看代码的目的是什么,要带着问题去看;
- 工作的创新点一定会在论文里面体现出来,而代码是具体的实现细节,对不感兴趣的点,可以把这些代码当作工具来使用。
- 可以组建一个学习小组,两三个人,每天看点论文,然后看到感兴趣的论文,可以对这篇论文进行一个复现。
- 抓住一个模块做,站在巨人的肩膀上(比如前面,把开源代码当作工具来使用);
- 有目的性的学习,一定要知道自己学习是为了什么;
- 定一个能有反馈的目标很重要,包括长远规划和短期目标。