当前位置:网站首页>智源社区周刊#86:Gary Marcus谈大模型研究可借鉴的三个语言学因素;谷歌提出媲美Imgen的文生图模型Parti;OpenAI提出视频预训练模型VPT,可玩MC游戏
智源社区周刊#86:Gary Marcus谈大模型研究可借鉴的三个语言学因素;谷歌提出媲美Imgen的文生图模型Parti;OpenAI提出视频预训练模型VPT,可玩MC游戏
2022-06-24 12:59:00 【智源社区】
汇聚每周必看AI观点、研究和各类资源,不错过一条重要资讯!欢迎点击这里,订阅智源社区AI周刊。
观点
“如果我们要关注到预训练大模型缺失的要素,应该关注以下三个关键因素:
1.参考(Reference):词语和句子并不是孤立存在的。语言是词语/句子与外部世界之间的联系,而大型语言模型中的单词序列及其缺乏与外部世界的联系。
2.认知模型(Cognitive models):语言系统的最终目标是更新对于世界的,持续但动态的感知。大模型并不产生这样的认知模型,至少没有产生人们能够可靠地加以使用的这种认知。
3.组成(Compositionality):复杂的整体,在大多数情况下,能够系统地解释其所在的部分,以及这些部分如何组织在一起的方式。像DALL-E这样的系统在涉及组成的问题时,面临显著的挑战。例如,GPT......不能产生反映句子之间结构关系的、可解释的表示。”
——近日,在谈到预训练大模型的缺陷时,纽约大学教授Gary Marcus认为可以从语言学中学到三个重要因素。(延伸阅读)
“(在本文中)我提出了名为智能体的通用模型(Common Model of the Intelligent Agent)这一概念,这种决策者(Decision Maker)可以实质性且广泛地应用于心理学、人工智能、经济学、控制理论和神经科学等多个学科......这种通用模型包括多个方面:决策者与其直接的交互,需要有输入、输出和目标,以及决策者内部的系统构成,用于感知、决策、内部评估,以及一个世界模型。我注意到它们在不同的学科中有着不同的名字,但是本质上是同样的概念......现在是时候认可并构建一个实质性的通用智能体模型,能够横跨并融合多个领域了。”
——在今年的一篇新论文中,强化学习之父Richard Sutton提出了智能决策者的通用模型思路,认为能够统一多个学科领域的研究。(延伸阅读)
科学家动态
6月20日,德克萨斯州大学奥斯汀分校教授Scott Aaronson宣布将在OpenAI工作一年,其主要职责是思考人工智能安全和对齐(AI Safety and Alignment)的理论基础。Scott Araonson是德克萨斯大学奥斯汀分校计算机科学教授,担任量子信息中心主任,他的研究领域包括量子计算机的性能与局限,更广义的计算复杂度理论等。2020年他因在量子计算领域的贡献获得ACM计算奖。
Oren Etzioni是华盛顿大学的荣誉教授,曾任计算机科学与工程系的教授。目前他将继续担任首席执行官至今年9月30日,之后担任董事会成员和顾问。AI2是由已故微软联合创始人Paul Allen于2014年在美国创建的一家人工智能研究机构,开展包括NLP等在内的人工智能研究和工程项目, 知名项目包括学术搜索引擎Semantic Scholar等。
近两年,从国内外科技大公司离职的科学家们,主要有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业。本文盘点了AI科学家加入的国内创业公司,如小冰、创新奇智、循环智能等,以及这些科学家的发展情况。
研究前沿
- 谷歌提出基于Pathways的自回归文生图模型Parti,效果媲美Imgen
- 强化学习之父Richard Sutton撰文:追寻智能决策者的通用模型
- 清华天机芯X芯片登上Science Robotics
- OpenAI提出视频预训练模型VPT,可以玩Minecraft游戏
机构动态
- OpenAI三大产品(GPT-3、Copilot、DALL-E)注册用户均破百万,DALL-E实现这一目标不到三个月
- CIFAR公布第二阶段泛加拿大AI战略,将在十年内提供超过4.43亿美元的资金支持
- Cohere、OpenAI、AI21联合发布部署模型的三大最佳实践准则
活动
- 视频回放 | 2022智源大会开幕式及分论坛视频上线
- 活动报名 | 中国人工智能学会:2022中国国际智能驾驶论坛-科技变革的智能驾驶(6月25日)
- 活动报名 | MIT、威斯康星、UMass、犹他大学等研究者:MLNLP第八期学术研讨会(6月26日)
- 活动报名 | 伊利诺伊大学厄巴纳-香槟分校(UIUC)李博:可信机器学习之机器学习与知识推理相结合(6月30日)
资源
- FlagAI飞智:AI基础模型开源项目,支持一键调用OPT等模型
- 北约集团研究报告:知识表示与推理-技术现状和未来机遇综述
- 2021年中国深度学习软件框架市场研究报告
- CVPR2022微软《视觉语言预训练进展》教程
查看预训练、强化学习等领域周刊内容,欢迎点击这里。
周刊线索征集和合作,请联系:[email protected]
边栏推荐
- The first open source MySQL HTAP database in China will be released soon, and the three highlights will be notified in advance
- 真正的项目经理强者,都是闭环高手!
- In the era of knowledge economy, it will teach you to do well in knowledge management
- npm包【详解】(内含npm包的开发、发布、安装、更新、搜索、卸载、查看、版本号更新规则、package.json详解等)
- 2022煤矿瓦斯抽采操作证考试题及模拟考试
- HarmonyOS.2
- 2022质量员-设备方向-通用基础(质量员)考试题及答案
- Hands on data analysis unit 3 model building and evaluation
- kotlin 关键字 扩展函数
- Tupu software is the digital twin of offshore wind power, striving to be the first
猜你喜欢

AutoRF:从单视角观察中学习3D物体辐射场(CVPR 2022)

OpenHarmony 1

Rasa 3.x 学习系列-非常荣幸成为 Rasa contributors 源码贡献者,和全世界的Rasa源码贡献者共建共享Rasa社区!

Dragon lizard developer said: first time you got an electric shock, so you are such a dragon lizard community| Issue 8

吉时利静电计宽测量范围

2022 Quality Officer - Equipment direction - post skills (Quality Officer) recurrent training question bank and online simulation examination

Activity lifecycle

快手实时数仓保障体系研发实践

杰理之TIMER0 用默认的 PA13 来检测脉宽【篇】

知识经济时代,教会你做好知识管理
随机推荐
项目经理搭建团队,需要看6个特征
记录一次Mongotemplate的And和Or的各种套
【sdx62】WCN685X IPA注册失败问题分析及解决方案
数据科学家面临的七大挑战及解决方法
每日一题day8-515. 在每个树行中找最大值
美国会参议院推进两党枪支安全法案
Jerry's seamless looping [chapter]
HarmonyOS. two
Jerry has opened a variety of decoding formats, and the waiting time from card insertion to playback is long [chapter]
Jericho may have some chips with fast music playing speed [chapter]
Promotion of Project Manager
Operation of simulated test question bank and simulated test platform for safety production management personnel of fireworks and firecrackers production units in 2022
kotlin 协程通道
Talk about GC of JVM
Kotlin asynchronous flow
群晖向阿里云OSS同步
MySQL interview questions
Kotlin language features
初识云原生安全:云时代的最佳保障
Developer survey: rust/postgresql is the most popular, and PHP salary is low