当前位置:网站首页>论文阅读 (62):Pointer Networks
论文阅读 (62):Pointer Networks
2022-07-29 06:39:00 【因吉】
1 引入
1.1 题目
1.2 代码
Github:https://github.com/shirgur/PointerNet
1.3 摘要
引入了一种新的神经架构来学习输出序列的条件概率,其元素是与输入序列中的位置相对应的离散标记。已有的一些方法,例如序列到序列和神经图灵机并不能处理这个问题,因为它们输出的每一步中,目标类的数量与输入的长度有关,但输入序列的长度却是可变的。可变大小序列的排序,以及各种组合优化问题都属于此类问题。
具体地,可变大小输出字典的问题通过引入注意力机制来解决。它与之前的注意力不同之处在于,它不是在每个解码器步骤中使用注意力将编码器的隐藏单元融合为上下文向量,而是使用注意力作为指针来选择输入序列的成员作为输出。这样的架构被我们称为指针网络 (Ptr-Net)。
为了证明Ptr-Net的有效性,三个著名的几何问题被使用,分别为寻找平面凸包、计算Delaunay三角剖分和平面旅行商问题。Ptr-Net不仅通过输入注意力改进了序列到序列,而且还可以被推广到可变大小的输出字典。最终结果显示学习模型的泛化能力超出了它们所训练的最大长度。这些结果将鼓励探索更广泛的离散问题的神经学习。
1. Bib
@article{
Vinyals:2015:pointer,
author = {
Oriol Vinyals and Meire Fortunato and Navdeep Jaitly},
title = {
Pointer networks},
journal = {
Advances in neural information processing systems},
volume = {
28},
year = {
2015}
}
2 模型
首先介绍两个背景工作,即序列到序列和输入注意力模型。随后引出本文提出的Ptr-Net架构。
2.1 序列到序列模型
给定一个训练对 ( P , C P ) (\mathcal{P},\mathcal{C^P}) (P,CP),序列到序列模型使用带有参数 θ \theta θ的RNN在概率链式规则的基础上计算条件概率:
p ( C P ∣ P ; θ ) = ∏ i = 1 m ( P ) p ( C i ∣ C 1 , … , C i − 1 , P ; θ ) (1) \tag{1} p(\mathcal{C^P}|\mathcal{P};\theta)=\prod_{i=1}^{m(\mathcal{P})}p(C_i|C_1,\dots,C_{i-1},\mathcal{P};\theta) p(CP∣P;θ)=i=1∏m(P)p(Ci∣C1,…,Ci−1,P;θ)(1)一个示意如图1。
边栏推荐
- npm install报错npm ERR Could not resolve dependency npm ERR peer
- buck电路boot和ph引脚实测
- HJ37 统计每个月兔子的总数 斐波那契数列
- Win11 system error: code execution cannot continue because ierutil.dll cannot be found. Reinstalling the program may fix this problem
- 城市花样精~侬好!DESIGN#可视化电台即将开播
- Flink实时仓库-DWD层(处理复杂数据-流和表的装换处理)模板代码
- SQL优化
- Improved pillar with fine grained feature for 3D object detection paper notes
- Cvpr2021 | multi view stereo matching based on self supervised learning (cvpr2021)
- Excerpts from good essays
猜你喜欢

Is online legend software testing training really so black hearted? Are they all scams?

spark学习笔记(七)——sparkcore核心编程-RDD序列化/依赖关系/持久化/分区器/累加器/广播变量

图像加噪声与矩阵求逆

【charles日常问题】开启charles,使用不了钉钉

Excel文件读写(创建与解析)

数组的子集能否累加出K

Thread - thread safety - thread optimization

Vite3.0 has been released, can you still roll it (list of new features)

Flink实时仓库-DWD层(交易域-加购维度退化处理)模板代码

Unity free element special effect recommendation
随机推荐
Flink real-time warehouse DWD layer (Kafka associated with MySQL lookup join) template code
谷歌零碎笔记之JWT(草稿)
以太网接口介绍
Unity sends a post request to the golang server for parsing and returning
NPM install reports an error NPM err could not resolve dependency NPM err peer
route的meta配置项
SSH password free login - two virtual machines establish password free channel two-way trust
基于C语言实现图书借阅管理系统
1172. 餐盘栈 有序列表+栈
Kubernetes (五) ---------部署 Kubernetes Dashboard
When NPM is installed, it is stuck. There are five solutions
Implementation of DDP cluster distributed training under pytoch multi GPU conditions (brief introduction - from scratch)
Leetcode 879. profit plan
vue-router路由缓存
Decompilation of wechat applet
网上传说软件测试培训真的那么黑心吗?都是骗局?
tp6 使用 ProtoBuf
Operator3-设计一个operator
JS 鸡生蛋与蛋生鸡问题,Object与Function究竟谁出现的更早?Function算不算Function的实例?
数组的子集能否累加出K