当前位置:网站首页>论文阅读 (62):Pointer Networks
论文阅读 (62):Pointer Networks
2022-07-29 06:39:00 【因吉】
1 引入
1.1 题目
1.2 代码
Github:https://github.com/shirgur/PointerNet
1.3 摘要
引入了一种新的神经架构来学习输出序列的条件概率,其元素是与输入序列中的位置相对应的离散标记。已有的一些方法,例如序列到序列和神经图灵机并不能处理这个问题,因为它们输出的每一步中,目标类的数量与输入的长度有关,但输入序列的长度却是可变的。可变大小序列的排序,以及各种组合优化问题都属于此类问题。
具体地,可变大小输出字典的问题通过引入注意力机制来解决。它与之前的注意力不同之处在于,它不是在每个解码器步骤中使用注意力将编码器的隐藏单元融合为上下文向量,而是使用注意力作为指针来选择输入序列的成员作为输出。这样的架构被我们称为指针网络 (Ptr-Net)。
为了证明Ptr-Net的有效性,三个著名的几何问题被使用,分别为寻找平面凸包、计算Delaunay三角剖分和平面旅行商问题。Ptr-Net不仅通过输入注意力改进了序列到序列,而且还可以被推广到可变大小的输出字典。最终结果显示学习模型的泛化能力超出了它们所训练的最大长度。这些结果将鼓励探索更广泛的离散问题的神经学习。
1. Bib
@article{
Vinyals:2015:pointer,
author = {
Oriol Vinyals and Meire Fortunato and Navdeep Jaitly},
title = {
Pointer networks},
journal = {
Advances in neural information processing systems},
volume = {
28},
year = {
2015}
}
2 模型
首先介绍两个背景工作,即序列到序列和输入注意力模型。随后引出本文提出的Ptr-Net架构。
2.1 序列到序列模型
给定一个训练对 ( P , C P ) (\mathcal{P},\mathcal{C^P}) (P,CP),序列到序列模型使用带有参数 θ \theta θ的RNN在概率链式规则的基础上计算条件概率:
p ( C P ∣ P ; θ ) = ∏ i = 1 m ( P ) p ( C i ∣ C 1 , … , C i − 1 , P ; θ ) (1) \tag{1} p(\mathcal{C^P}|\mathcal{P};\theta)=\prod_{i=1}^{m(\mathcal{P})}p(C_i|C_1,\dots,C_{i-1},\mathcal{P};\theta) p(CP∣P;θ)=i=1∏m(P)p(Ci∣C1,…,Ci−1,P;θ)(1)一个示意如图1。
边栏推荐
- Vscode remote debugging PHP solution through remotessh and Xdebug
- Image noise and matrix inversion
- [cf1054h] epic Revolution -- number theory, convolution, arbitrary modulus NTT
- Hj37 statistics of the total number of rabbits per month Fibonacci series
- Flink实时仓库-DWD层(流量域)模板代码
- Vmware16 create virtual machine: win11 cannot be installed
- Decompilation of wechat applet
- Google fragmented notes JWT (Draft)
- MySQL----多表查询
- Kubernetes (V) -- deploy kubernetes dashboard
猜你喜欢

Flink real-time warehouse DWD layer (transaction domain - additional purchase dimension degradation processing) template code

Revolution of game assets

Win11 system error: code execution cannot continue because ierutil.dll cannot be found. Reinstalling the program may fix this problem

MySQL - multi table query

Kubernetes (V) -- deploy kubernetes dashboard

我的个人网站不让接入微信登录,于是我做了这个

ETL为什么经常变成ELT甚至LET?

聊天机器人有何用处?有何类型?看完这些就明白了!

Image noise and matrix inversion

基于C语言设计的学生成绩排名系统
随机推荐
ETL为什么经常变成ELT甚至LET?
建木持续集成平台v2.5.2发布
[redis] redis development specifications and precautions
记 - 踩坑-实时数仓开发 - doris/pg/flink
Improved Pillar with Fine-grained Feature for 3D Object Detection论文笔记
Win11vmware turns on the virtual machine and restarts on the blue screen and the solution that cannot be started
gin 路由,参数,输出
Summary of OCR optical character recognition methods
Relative date used by filter in salesforce
VMware16创建虚拟机:无法创建新虚拟机,不具备执行此操作的权限
基于C语言设计的学生成绩排名系统
Use vscode to configure Mysql to realize connection, query, and other functions
SSH password free login - two virtual machines establish password free channel two-way trust
pytest合集(7)— 参数化
H3C_利用设置缺省静态路由优先级实现出口双线路的主备功能
Kubernetes (五) ---------部署 Kubernetes Dashboard
NPM install reports an error NPM err could not resolve dependency NPM err peer
Thread synchronization - producers and consumers, tortoise and rabbit race, dual thread printing
MVFuseNet:Improving End-to-End Object Detection and Motion Forecasting through Multi-View Fusion of
Redis基础篇