当前位置:网站首页>扩散模型又杀疯了!这一次被攻占的领域是...
扩散模型又杀疯了!这一次被攻占的领域是...
2022-06-22 13:18:00 【智源社区】
扩散模型最早在图像生成领域大火,随后扩展到了其他连续域,例如语音、视频、点云数据,最近Google发布的用于文本到图像生成的GLIDE模型,更是让扩散模型从AI圈内火到了圈外。
不过,虽然扩散模型的热度极高,但是面向离散变量的扩散模型的性能一直欠佳,特别是在语言,图等结构当中。
最近,斯坦福大学自然语言处理研究组在利用扩散模型解决自然语言处理问题中取得了新的进展。
具体说来,在可控自然语言生成任务上,研究者们利用连续扩散模型,对预训练的语言生成模型进行可插拔的操控,就能够在许多任务上达到甚至超过Fine-Tuning的效果,大幅度超越了之前的工作。
这篇工作从方法和实验上都非常的新颖和扎实,短短一周就已经在Twitter上收获了千赞,在Github上收获了140个stars。
下面,就让我们一起来了解这篇扩散模型在语言领域的应用工作吧,说不定也能给你的领域带来启发呢~
论文标题:
Diffusion-LM Improves Controllable Text Generation
论文链接:
https://arxiv.org/pdf/2205.14217.pdf

边栏推荐
- Screenshot of the uniapp app and save it locally
- 怎样在手机上开户?网上开户安全么?
- How many days are there between the two timestamps of PHP
- 《Kubernetes监控篇:Grafana通过自动化方式添加datasource和dashboard》
- How location coding (PE) works in transformers
- Are you familiar with redis cache of highly paid programmers & interview questions series 114? How are redis keys designed? Are you familiar with the memory obsolescence mechanism?
- 成都测试设备开发_单片机C语言之数组介绍
- 线下实体店结合VR全景,让虚拟购物更加真实
- 一文搞懂开放源码软件(OSS)质量保证
- Chengdu test equipment development_ Array introduction of C language for single chip microcomputer
猜你喜欢

作为程序员,职业规划需要注意的四个阶段

Transformers vit image model vector acquisition

天润云上市在即:VC大佬田溯宁大幅减持,预计将套现2.6亿港元

如何保护WordPress网站免受网络攻击?采取安全措施至关重要

In 5g era, how to create an amazing live VR activity?

client-go gin的简单整合九-Create

Offline physical stores combined with VR panorama make virtual shopping more realistic

Tasks and responsibilities of the test team and basic concepts of testing

一文搞懂开放源码软件(OSS)质量保证

JS advanced programming version 4: learning iterators
随机推荐
数据采集之:巧用布隆过滤器提取数据摘要
unity的富文本Text的Color设置颜色全透明
transformers VIT图像模型向量获取
快速了解常用的对称加密算法,再也不用担心面试官的刨根问底
数据库中如何使用SQL进行修改&删除
基于SSM框架实现的甜品饮品店前后台管理系统甜品商城蛋糕店【源码+数据库】
Tasks and responsibilities of the test team and basic concepts of testing
A simple scientific research secret
如何实现接口异常场景测试?测试方法探索与测试工具实现
JS advanced programming version 4: learning iterators
Seven cattle cloud upload picture
加密市场进入寒冬,是“天灾”还是“人祸”?
d的破坏与安全
Unity 子线程调用主线程的UI
How to compare the size of two dates in unity and C #
ThoughtWorks. QRcode and zxing Net QR code, URL can be directly jumped
unity和C#中怎么去比较2个日期大小
How to understand fold change? Multiple analysis?
Screenshot of the uniapp app and save it locally
Analysis on data skew of redis slice cluster