2022/3/30 9:39:13 阅读:515 发布者:chichi77
这周为大家介绍两篇高光谱图像分类论文和一篇车道线检测论文,其中分别使用了两种不同的思路来解决高光谱图像分类,车道线检测论文综合使用了高层次和低层次特征。
1
将基于进化算法的神经网络架构搜索应用到高光谱图像分类
Evolving Block-Based Convolutional Neural Network for Hyperspectral Image Classification
作者单位:南京信息工程大学,武汉大学
期刊:IEEE Transactions on Geoscience and Remote Sensing ( Early Access )
日期:2022-3-17
地址:https://ieeexplore.ieee.org/document/9737511
目前,基于CNN的高光谱图像分类网络结构严重依赖于人类专家知识和经验,比如设置不同的超参数,卷积核大小,池化类型等,这些都需要基于特定领域的先验知识来精心设计,受此限制,大多数基于CNN的分类方法性能较低。
为解决上述问题,研究人员提出了神经网络架构搜索(neural architecture search, NAS),先定义搜索空间,然后通过搜索策略找出候选网络结构,对它们进行评估,根据反馈进行下一轮的搜索,直到获得最优网络结构,如下图所示。
在众多的网络架构搜索方法中,发现使用进化算法作为优化算法,能够有效地搜索出高性能的网络结构。基于进化算法的NAS在普通图像分类中取得了优越的性能,但还没有用于高光谱图像分类。由于高光谱图像分类是一种像素级别的分类,不同于普通图像分类,现有的NAS方法不能直接移植到高光谱图像分类,需要加以改进。
受此启发,这篇论文提出了一种基于进化分块的CNN方法(EB-CNN)进行高光谱图像分类,采用同时从微观和宏观两个视角优化网络结构的方式,也就是同时寻找每个网络层最优分量和网络结构最优宽度和深度。
除了基于进化算法的NAS方法,还有基于强化学习和基于梯度下降的NAS方法,感兴趣的朋友可以进一步的学习。
这篇论文给我的启发是,除了关注自己的研究问题外,还要了解其他领域的方法,特别是研究对象相似的方法,比如你研究高光谱图像分类,那么对普通图像分类或者视频分类也要有所了解,这能够拓展你的研究思路。
2
无监督光谱-空间语义特征学习的高光谱图像分类
Unsupervised Spectral-Spatial SemanticFeature Learning for Hyperspectral Image Classification
作者单位:武汉大学
期刊:IEEETransactions on Geoscience and Remote Sensing ( Early Access )
日期:2022-03-16
地址:https://ieeexplore.ieee.org/document/9737023
在高光谱图像分类中,特征提取是一个重要的预处理步骤,这篇论文首先介绍了使用标签训练浅层模型的代表方法及其不足,由此引出深度学习模型。接下来从难以获取大量有精确标签数据的角度,引出无监督特征提取方法,先是介绍了浅层无监督特征提取方法,比如主成分分析,局部近邻结构保持嵌入等,但这类方法依赖专家的领域知识,于是引出了论文的落脚点,基于深度学习的无监督特征提取模型,并介绍了相关方法。
通过对相关论文的分析,作者发现绝大多数基于深度学习的无监督特征提取方法,都是采取编码-解码的形式,从原始图像里生成中间的特征表示,见下图(a),这类方法更倾向于提取到低层次的特征,比如颜色、纹理等,而这对高层次的语义分类远远不够。
为解决上述问题,这篇论文聚焦于高层次语义信息,首先通过两个不同视角的特征变换,生成两类特征,再使用可学习的光谱-特征学习网络将两类特征投影到深度嵌入空间里,接下来采用一个对比损失函数对投影后的特征进行对齐,这样构造学习损失时就不需要标签信息,见下图(b)。此外,还设计了一个特征学习网络分别学习光谱和空间特征,从而提升特征提取性能。将训练好的特征学习网络看作是一个特征提取器,接下来就可以使用一个分类器来验证所学习到的光谱-空间特征。
这篇论文给我的启发是,每个方法基本上都是多个部分组成,我们可以重点关注某个部分,搞清楚这个部分的来龙去脉,然后加以改进后,就能提出一种新的方法了,比如这篇论文的关注点就在高光谱图像分类中的特征提取方法上。
3
基于跨层优化的车道线检测方法
CLRNet: Cross Layer Refinement Network forLane Detection
作者单位:飞步科技,浙江大学
会议:IEEE Conference on Computer Visionand Pattern Recognition (CVPR) 2022
地址:https://arxiv.org/abs/2203.10350
在自动驾驶视觉感知中,车道线检测是一项重要的功能,检测结果可以用来辅助定位,为车道保持、换道等任务提供重要的安全保障。作者首先分析了只使用低层次的特征,对检测结果的影响,发现容易将具有相似特征的长白线路面标志检测为车道线,见下图(a),如果只使用高层次特征,能够大概检测到车道线,但是定位精度较低,见下图(b),因此在车道线检测任务中,需要同时使用高层次的语义信息和低层次的特征来精确定位。
此外,在复杂的城市道路或者特殊作业的真实场景中,车道线经常存在被遮挡、破损或者强光照射下无法看清等情况,见上图(c)和(d),这给车道线检测带来了极大地挑战。
为了解决上述问题,这篇论文提出了一种结合高层次和低层次特征的网络结构,首先使用高层次语义特征进行粗略定位车道线,然后基于低层次特征进行微调获得更加精确的定位,渐进式地修复车道线位置和特征提取,使得车道线检测结果精度更高。
为解决车道线不在视觉范围内的问题,通过建立ROI车道线特征和整个特征图之间的关系,使用ROIGather捕获全局上下文信息。此外,论文还提出了一种新的线段交并比损失函数,进一步提升了车道线的定位精度。
这篇论文给我的启发是,通过实验分析和验证不同分量对结果的影响,由此提出新的解决方案,并结合具体的真实场景,做出针对性的改进,比如这篇论文分析了低层次特征和高层次特征对车道线检测结果的影响,并考虑到真实场景中车道线有可能遮挡的情况。
如有侵权,请联系本站删除!