论文介绍
SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud
论文地址:https://arxiv.org/abs/1710.07368
这篇论文介绍了一种名为SqueezeSeg的系统,它是一个基于卷积神经网络(CNN)和条件随机场(CRF)的端到端管道,用于从3D激光雷达(LiDAR)点云中实时分割道路对象。SqueezeSeg的目标是检测和分类兴趣实例,例如汽车、行人和骑自行车的人。以下是对论文的主要内容进行的总结:
1. 问题定义:SqueezeSeg解决的是道路对象的语义分割问题,即将3D LiDAR点云中的各个点分类到不同的对象类别。
2. 方法:作者提出了一个端到端的管道,该管道首先使用CNN处理转换后的LiDAR点云,直接输出逐点的标签图,然后通过一个作为递归层实现的条件随机场(CRF)进行细化。
3. 数据增强:为了获取额外的训练数据,作者构建了一个基于流行视频游戏《侠盗猎车手V》(GTA-V)的LiDAR模拟器,以合成大量逼真的训练数据。
4. 网络结构:SqueezeSeg的CNN模型受到SqueezeNet的启发,设计时考虑了减少参数大小和计算复杂性,以减少内存需求并实现实时推理速度。CRF模型被重新构想为一个递归神经网络(RNN)模块,并可以与CNN模型一起端到端训练。
5. 实验结果:实验表明,SqueezeSeg在保持高准确性的同时,运行速度极快且稳定(每帧8.7 ± 0.5毫秒),非常适合自动驾驶应用。此外,使用合成数据进行额外训练可以在真实世界数据上提高验证精度。
6. 评估指标:作者使用精度、召回率和交并比(IoU)作为评估模型性能的指标,分别对类别级别和实例级别的分割任务进行了评估。
7. 实验设置:主要数据集是转换后的KITTI数据集,作者还使用了NVIDIA TITAN X GPU和其他车载嵌入式处理器进行实验。
8. 结论:SqueezeSeg是一个准确、快速且稳定的从LiDAR点云中分割道路对象的方法。与传统方法相比,它不依赖手工设计的特征,不使用迭代算法如RANSAC,并且通过减少传播误差和充分利用对象上下文,将流程简化为单阶段。
代码运行
运行系统:Ubuntu 18.04
使用语言:Python 2.7
硬件支持:CUDA10.0
新建conda环境:
conda create -n seg python=2.7
conda activate seg
安装依赖:
pip install -r requirements.txt
运行:
python ./src/demo.py
运行效果:



被折叠的 条评论
为什么被折叠?



