当前位置:网站首页>小 P 周刊 Vol.11
小 P 周刊 Vol.11
2022-07-01 21:38:00 【SenseParrots】

小 P 为你送上本周值得一看的信息~
有意见、建议与吐槽,欢迎直接给小 P 留言哦~
点击链接即可打开对应网页。
学界前沿
Yann LeCun 提出对 AI 的大胆新设想
Yann LeCun 这位颇具盛名的科学家日前提出了对下一代 AI 的大胆新设想。
在这份文件里,他针对“机器如何能像人类和动物一样高效学习”、“机器怎样才能学会推理和计划”、“机器如何能够在多个抽象层次上学习感知和行动计划的表征”等问题提出了一个架构和训练范式,可以用于构建自主智能体。
这个架构结合了一些概念,如可配置的预测世界模型,通过内在动机驱动的行为,以及通过自我监督学习训练的分层联合嵌入架构等。
你可以在 OpenReview 上读到 LeCun 发表的原文。
Yandex 发布开源界最大的 GPT-Like 神经网络 YaLM 100B
Yandex 将其研发的 YaLM 语言模型系列用于旗下的 Alice 语音助手及 Yandex Search 等服务。日前,该公司将他们研发出的最大规模模型 YaLM 100B 免费发布在了 GitHub 上。该项目采用了 Apache 2.0 协议,允许研究与商用。
在 Yandex 发布的这篇文章 中,他们讲述了从训练 YaLM 100B 中得到的经验教训,包括:如何加速模型训练、如何处理散度 (divergence) 等。
OpenAI 讲述 DALL·E 2 的预训练缓解措施
为了减少图像生成模型有关的风险,OpenAI 采取了一些举措来避免生成的图像违反他们的内容条款。
在这篇文章中,OpenAI 重点介绍了这些举措中的一个——预训练缓解措施。该措施可以直接修改 DALL·E 2 学习的数据。考虑到 DALL·E 2 使用互联网上数以亿计的带标注图片进行训练,OpenAI 需要删除和调整其中一些图片的权重,来改变模型的学习内容。
这篇文章主要讲述了三个不同的预训练缓解措施:
如何从 DALL·E 2 的训练数据集中过滤掉暴力和性的图像。这个措施可以避免模型根据输入的文本产生露骨的图像,也可以避免在输入与暴力和性无关的文本时,模型返回包含这些要素的图像。
OpenAI 发现过滤训练数据会放大偏见 (biases),他们如何缓解这种影响。例如,如果没有这种缓解措施,在与原始数据集上训练的模型相比,在过滤后的数据上训练的模型有时会产生更多描绘男性的图像,而描绘女性的图像则较少。
OpenAI 发现 DALL·E 这样的模型有时可以重现用于训练的图像,而不是创造新的图像。在实践中,他们发现这种图像反刍是由在数据集中多次复制的图像引起的。OpenAI 通过删除与数据集中其他图像视觉相似的图像来缓解这一问题。
你可以在 OpenAI 的博客 读到这篇文章的原文。
基础技术
100 个常见的 NumPy 测试题
这个网站从面试题、邮件列表和文档里面,选出了 100 个常见问题,并配上答案,供大家练习。
这些问题被分为 1~3 星三个难度,不妨来测测你对 NumPy 的熟悉程度?
例如:
- 一星:求以下表达式的结果。
np.array(0) / np.array(0)np.array(0) // np.array(0)np.array([np.nan]).astype(int).astype(float)- 一星:给定两个数列,求值的交集。(提示:使用
np.intersect1d) - 二星:给定两个数组,shape 分别是
(1, 3)和(3, 1)。如何用迭代器计算它们的和?(提示:使用np.nditer) - 三星:计算矩阵的秩。(提示:使用
np.linalg.svd, np.linalg.matrix_rank)
设计哲学
代码注释的艺术,优秀代码真的不需要注释吗?
雷军曾经说过一句名言:“我没有写过诗,但有人说我写的代码像诗一样优雅。”相信这也是无数工程师的追求。而在追求这种优雅的过程中,是否写注释、怎么写注释也是绕不开的问题。
作者通过他实际接触过的代码,讲述了他对于注释的观点:通过为变量精准命名、代码层次切割等方法让代码通俗易懂,把注释留给那些复杂的业务逻辑、magic number 和对外 API 定义。
工具推荐
从动手做项目中学习语言
这个网站收集以学习为目的各种实战教程(比如自己动手写数据库、编译器等等),按照计算机语言进行分类,帮助读者快速查找可以自己动手做的简单项目。
通过拖拽在线生成 tkinter 界面代码
我们用 Python 写一些小工具时,常常会用到 tkinter 作为图形界面。本工具支持通过在网页上拖拽组件,所见即所得,自动生成 Python 代码。
该工具已发布在 GitHub 上。你可以在 Demo 页面 在线体验。
感谢阅读,欢迎在评论区留言讨论哦~
P.S. 如果喜欢本篇文章,请多多 点赞,让更多的人看见我们 :D
关注 公众号「SenseParrots」,获取人工智能框架前沿业界动态与技术思考。
边栏推荐
- 薛定谔的日语学习小程序源码
- What is the difference between consonants and Initials? (difference between initials and consonants)
- 中通笔试题:翻转字符串,例如abcd打印出dcba
- 合成大西瓜小游戏微信小程序源码/微信游戏小程序源码
- pytest合集(2)— pytest運行方式
- GCC编译
- 杰理之、产线装配环节【篇】
- Pytest collection (2) - pytest operation mode
- 使用闭包实现点击按钮切换 toggle
- Accelera Systems Initiative是一个独立的非营利组织
猜你喜欢

芭比Q了!新上架的游戏APP,咋分析?

"The silk road is in its youth and looks at Fujian" is in the hot collection of works in the Fujian foreign youth short video competition

杰理之蓝牙耳机品控和生产技巧【篇】

杰理之、产线装配环节【篇】
![[NOIP2013]积木大赛 [NOIP2018]道路铺设 贪心/差分](/img/d1/a56231cd4eb3cc1d91d8a55048ccfe.png)
[NOIP2013]积木大赛 [NOIP2018]道路铺设 贪心/差分

二叉树的基本操作

东哥套现,大佬隐退?

pytest合集(2)— pytest运行方式

工控设备安全加密的意义和措施

Pytest collection (2) - pytest operation mode
随机推荐
leetcode刷题:栈与队列02(用队列实现栈)
从MLPerf谈起:如何引领AI加速器的下一波浪潮
PMP证书真的有用吗?
[noip2013] building block competition [noip2018] road laying greed / difference
新版图解网络PDF即将发布
4. 对象映射 - Mapping.Mapstercover
Aidl basic use
leetcode刷题:栈与队列01(用栈实现队列)
Fundamentals - IO intensive computing and CPU intensive computing
2022年低压电工考试试题及答案
王者战力查询改名工具箱小程序源码-带流量主激励广告
MIT|256KB 内存下的设备上训练
latex如何打空格
Significance and measures of security encryption of industrial control equipment
辅音和声母的区别?(声母与辅音的区别)
locust 系列入门
Can I choose to open an account for stock trading on flush? Is it safe?
Application of real estate management based on 3D GIS
MySQL数据库驱动(JDBC Driver)jar包下载
[NOIP2013]积木大赛 [NOIP2018]道路铺设 贪心/差分