当前位置:网站首页>KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架
KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架
2022-06-27 18:40:00 【智源社区】

研究背景
最近在迁移学习领域中通过让 GNN 捕获可迁移的图模式以推广到不同的下游任务中。具体来说,大多数遵循“预先训练、微调”学习策略:使用容易获取的信息作为 Pretext 任务(如边缘预测)对 GNN 进行预训练,以预先训练的模型作为初始化对下游任务进行微调。
问题和挑战
论文注意到传统 GNN 预训练中 Pretext 任务与下游任务之间内在训练目标差距,不仅可能无法引出预训练的图知识,甚至会导致负迁移现象。此外,Pretext 任务既需要专业知识,也需要繁琐的手工试验。因此,论文首次提出“Pre-training、Prompt、Fine-tuning”的概念将下游任务进行重构,使其成为与 Pretext 任务相似的目标任务,以弥补预训练目标与微调目标之间的任务差距。
为了克服传统“Pre-training、Fine-tuning”的局限性,借鉴了自然语言处理中的“Prompt”技术。由于提示调优是NLP领域中特有的技术,因此很难设计适合 GNN 的 Prompt 模板。论文克服了两个主要的挑战:1)如何应用语义提示函数重构图数据中各种图机器学习任务;2)如何设计 Prompt 模板以更好地重新制定下游应用程序,提出图预训练和提示调优 (GPPT) 框架。
方法

实验

总结
我们创新性地提出了 GPPT,首个针对 GNN 进行“预训练、提示、微调”的迁移学习范式。首次设计了适用于图数据的图提示函数,以重新制定与 Pretext 任务相似的下游任务,从而减少二者训练目标差距。与此同时,我们还设计了任务和结构令牌生成方法,用于生成节点分类任务中的节点提示。此外,我们提出了平均提示初始化和正交正则化方法来提高提示调优性能。大量的实验表明,GPPT 在基准图数据集上优于传统的训练范式,同时提高了调优效率和对下游任务的更好的适应性。在未来的工作中,我们将在更具挑战性的知识图中探索图的提示功能,并尝试通过元学习来改进提示调优。
边栏推荐
- Is it safe to open an account and buy stocks on the Internet? New to stocks, no guidance
- 云原生存储解决方案Rook-Ceph与Rainbond结合的实践
- SQL reported an unusual error, which confused the new interns
- SQL audit platform permission module introduction and account creation tutorial
- 一场分销裂变活动,不止是发发朋友圈这么简单
- No wonder people chose apifox instead of postman
- 谈谈我写作生涯的画图技巧
- 主键选择选择自增还是序列?
- Implementation string mystring
- Paste source layer and history layer of data warehouse system
猜你喜欢
随机推荐
Oracle architecture summary
Batch insert data using MySQL bulkloader
【STL编程】【竞赛常用】【part 1】
MongoDB简介及典型应用场景
database engine
SQL审核平台权限模块介绍和账号创建教程
BTC和ETH重新夺回失地!引领市场复苏?加密将步入“冰河时代”!
Backtracking related issues
I haven't thought about the source for some time. After upgrading to the latest version 24, the data encryption problem is repeatedly displayed
Logcli Loki command line tool
At 19:00 on Tuesday evening, the 8th live broadcast of battle code Pioneer - how to participate in openharmony's open source contribution in multiple directions
Oracle 架构汇总
Database transactions
Redis persistence
在开发数字藏品时,文博机构该如何把握公益和商业的尺度?如何确保文物数据的安全?
Model reasoning acceleration based on tensorrt
Summary of redis big key problem handling
主键选择选择自增还是序列?
QT Chinese garbled code
When developing digital collections, how should cultural and Museum institutions grasp the scale of public welfare and Commerce? How to ensure the security of cultural relics data?









