当前位置:网站首页>10万美元AI竞赛:寻找大模型做得“更烂”的任务
10万美元AI竞赛:寻找大模型做得“更烂”的任务
2022-06-28 12:33:00 【智源社区】

本次竞赛旨在寻找逆缩放任务,尤其是那些对安全和负责任地使用语言模型很重要的任务。我们希望提交的任务能够让我们更多地了解哪些类型的任务表现出逆缩放;逆缩放任务还将突出当前语言模型预训练和缩放范式的潜在问题。逆缩放任务很重要,因为它们代表了我们希望语言模型展示的行为与我们在实践中从训练目标和使用的数据中获得的行为之间的不匹配。随着语言模型不断变大并在更多现实世界的应用程序中使用,重要的是它们不会变得越来越糟或以尚未被发现的方式伤害用户。
主办者:Ethan Perez,AnthropicAI研究员

边栏推荐
猜你喜欢

【Unity编辑器扩展基础】、EditorGUILayout (三)

EMC RS485接口EMC电路设计方案
![[vi/vim] basic usage and command summary](/img/bc/0be3ae3f122c3c21b480e0678095a1.png)
[vi/vim] basic usage and command summary

The paging style flex is set to be displayed at the end (even if the number of pages is longer, there will be no line breaks at the end)
![[unity Editor Extension practice] dynamically generate UI code using TXT template](/img/20/1042829c3880039c528c63d0aa472d.png)
[unity Editor Extension practice] dynamically generate UI code using TXT template

攻防世界新手入门hello_pwn

Custom title bar view

Function and principle of remoteviews

JNI confusion of Android Application Security

websocket 1 分钟自动断开连接
随机推荐
Two writing methods of JNI function
为什么CAD导出PDF没有颜色
KDD 2022 | graph neural network generalization framework under the paradigm of "pre training, prompting and fine tuning"
What are the common modes of financial products in 2022?
JNI函数的2种书写方式
杰理之wif 干扰蓝牙【篇】
什么是泛型,怎么使用泛型分析
什么是数据合规?怎样做到数据合规?
Privilege management of vivo mobile phone
MATLAB的官方网站上其实有很多MATLAB的学习和使用资料(文档、视频都有不少)
【编解码】从零开始写H264解码器(1) 总纲
JNI confusion of Android Application Security
Jerry's wif interferes with Bluetooth [chapter]
ASP.NET CORE Study03
[vi/vim] basic usage and command summary
Unity load settings: application backgroundLoadingPriority
关于字符串转换的一些小技巧
智联招聘基于 Nebula Graph 的推荐实践分享
MapReduce project case 3 - temperature statistics
杰理之wif 干扰蓝牙【篇】