当前位置:网站首页>End-to-End Lane Marker Detection via Row-wise Classification
End-to-End Lane Marker Detection via Row-wise Classification
2022-08-03 22:51:00 【Recursi】
目录
Lane Marker Vertex Location Loss:
Abstract
在本文中,我们提出了一种以端到端方式进行直接车道标记顶点预测的方法,该方法将车道标记检测问题转化为行分类任务,并且不需要任何后处理步骤。
为提取图像中车道信息,受[8]启发,我们设计了一个新的层
1. Introduction
我们的网络称为E2E-LMD
contribution
1)我们提出了一个新的和直观的框架来检测车道。
2)所提出的方法在两个基准数据集的方法相当或优于最近最先进的方法
3)通过大量的实验和可视化,表明该方法能够有效地捕获车道标记表示。
2. Related Work
除了基于分割的方法外,车道线还可以通过基于gan的方法进行检测。
3. Proposed Method
受最近[8,18]的启发,我们将车道线检测问题视为在图像中寻找每个车道的水平位置的集合。
给定一个输入图像X∈R3×h×w,其中h和w分别为图像的高度和宽度。
表示每条车道线
目标是找到一个点集
N是X中的车道标记的数量,K是每条车道线点的总数。
3.1. Network Architecture
第一阶段是一个通用的编解码器分割网络,经过编码器和解码器后得到一个输出
但是与标准的语义分割方法相比,我们只恢复分辨率作为输入大小的一半,以降低计算复杂度。
在第二阶段,高不改变,使用hHRM模块压缩。
在最后的第三阶段,我们有两个车道标记li的分支:一个行顶点位置分支和一个顶点置信分支。这些分支对最后一个HRMs特征进行分类化和置信回归,其中空间分辨率只有垂直维度,而通道大小满足目标水平分辨率h0,即h0=h/2。
行顶点位置,分支预测水平位置
顶点方向的置信度分支预测存在置信度vcij(xij,yij)是否有效。
Horizontal Reduction Module:
我们向下采样的水平组件添加了一个具有1×1卷积的水平平均池化层,步距为r,宽度减为W/r。
受[24,32]的像素洗牌层的启发,我们建议重新排列C×H×W输入张量的元素,在残差分支中形成一个形状为
rC×H×W/r的张量,这是对[32]中原始像素洗牌块的反向操作,即所谓的水平像素反洗牌层。
作者说这样可以通过重新排列表示方式,我们可以有效地将空间信息移动到通道中。
然后应用卷积操作将增加的信道rC减少到C,这不仅降低了计算复杂度,而且有助于有效地压缩像素解洗牌
操作中的车道标记空间信息。
最后为了进一步提高不同车道线的区分,作者加了SE模块
图三:可视化:所提出的体系结构还是成功地压缩了空间车道标记信息。
图四:我们观察到,在SE块后,车道表示变得更明显,很容易彼此分离。
3.2. Training
Lane Marker Vertex Location Loss:
由于我们将车道标记检测定义为对车道标记水平位置的行级分类,因此可以使用任何用于分类的损失函数
KL散度用来衡量两个概率分布之间的差异
4. Experiments
4.1. Results
4.2. Ablation Experiments
在表中评估了SE块的位置和存在性对HRM层的影响
(1)Pre-SE块,其中SE块在水平像素展开层之前移动
(2)标准-SE块,其中SE块是在剩余操作之后
(3)后SE块,其中在标识连接相加之后移动SE块
后SE比其他配置要好得多。似乎残余分支末端的SE块有助于恢复车道标记的独特性,在压缩残余ConvBN层中
的通道时可能会丢失这些信息
The number of shared HRM:
Loss function:
边栏推荐
- RPA助力商超订单自动化!
- Storage engine written by golang, based on b+ tree, mmap
- 剑指offer第22题-链表中倒数第K个节点
- Teach a Man How to Fish - How to Query the Properties of Any SAP UI5 Control by Yourself Documentation and Technical Implementation Details Demo
- Nine ways to teach you to read the file path in the resources directory
- Boss: There are too many systems in the company, can you realize account interoperability?
- 嵌入式系统:时钟
- RPA power business automation super order!
- 2022的七夕,奉上7个精美的表白代码,同时教大家快速改源码自用
- Diazo Biotin-PEG3-DBCO | Diazo Compound Modified Biotin-Tripolyethylene Glycol-Dibenzocyclooctyne
猜你喜欢
Quickly build a website with static files
Cisco ike2 IPSec configuration
藏宝计划TreasureProject(TPC)系统模式开发技术原理
Boss: There are too many systems in the company, can you realize account interoperability?
V8中的快慢数组(附源码、图文更易理解)
The principle and use of AOSP CameraLatencyHistogram
《数字经济全景白皮书》金融数字用户篇 重磅发布!
Network basic learning series four (network layer, data link layer and some other important protocols or technologies)
.NET6之MiniAPI(十四):跨域CORS(上)
override学习(父类和子类)
随机推荐
Embedded Systems: Clocks
Websocket multi-threaded sending message error TEXT_PARTIAL_WRITING--Use case of spin lock replacing synchronized exclusive lock
Cisco ike2 IPSec配置
Create function report error, prompting DECLARE definition syntax problem
BMN: Boundary-Matching Network for Temporal Action Proposal Generation阅读笔记
工作小计 QT打包
Basic Concepts of Graphs
Boss: There are too many systems in the company, can you realize account interoperability?
What is Adobe?
golang写的存储引擎,基于b+树,mmap
V8中的快慢数组(附源码、图文更易理解)
websocket多线程发送消息报错TEXT_PARTIAL_WRITING--自旋锁替换synchronized独占锁的使用案例
Pytest learn-setup/teardown
为什么我们需要回调
ML之interpret:基于titanic泰坦尼克是否获救二分类预测数据集利用interpret实现EBC模型可解释性之全局解释/局部解释案例
On the Qixi Festival of 2022, I will offer 7 exquisite confession codes, and at the same time teach you to quickly change the source code for your own use
【开源框架】国内首个通用云计算框架,任意程序都可做成云计算。
113. 授人以渔 - 如何自行查询任意 SAP UI5 控件属性的文档和技术实现细节
BMN: Boundary-Matching Network for Temporal Action Proposal Generation Reading Notes
嵌入式系统:概述