当前位置:网站首页>盗版DALL·E成梗图之王?日产5万张图像,挤爆抱抱脸服务器,OpenAI勒令改名
盗版DALL·E成梗图之王?日产5万张图像,挤爆抱抱脸服务器,OpenAI勒令改名
2022-07-05 09:35:00 【QbitAl】
杨净 发自 凹非寺
量子位 | 公众号 QbitAI
AI艺术家DALL·E达利,竟成梗图之王?
这阵子,国内外社交网络上,都刮起了一阵“达利”meme风。

比如这个,带着14公斤鱼的蜘蛛侠,这不就是我的日常摸鱼状态吗?

恐怖分子皮卡丘,还是很可爱怎么回事?

在Twitter上,有网友专门发起了#DalleMeme话题,同时Reddit上也已经开设了专栏weirddalle,目前已有9万人关注、每天近千人实时在线。
有个账号每天靠发“达利”meme图,几个月时间已经攒粉近百万。

可以说,达利家族真的靠梗图彻底出圈了。但就在大家玩得不亦乐乎的时候,达利的缔造者OpenAI却坐不住了:
改名!改名!改名!

这是怎么回事?
梗图之王,并非真DALL·E
原来,靠梗图出圈的“达利”,并非真正的达利。
它叫做DALL·E Mini,达利迷你版,比正版多了个Mini,但两者完全没有任何关系。
据作者介绍,当时几个志同道合的开发者,在达利的启发下,在Hugging Face上搞了个mini版,结果还获了奖。

主创之一Boris Dayma,在此基础上继续开发并将其开源。
免费的“达利”谁不用,要知道真正的DALL·E 2目前只有少部分内测资格~
于是乎,梗图之王就此诞生。
据Wired报道,Hugging Face的CEO曾大吐苦水:我们的工程师第一天晚上都没有睡觉。
要为这些模型提供大规模服务真的很困难。
而最近几周,达利迷你版每天会提供大约50000张图像。甚至有媒体称,已成互联网上最受欢迎meme生成器。

作者透露,达利迷你版的设计结构很简单。
核心两个组件:语言模型+图像解码器,它从互联网上数百万个图像-文本标题对学习而来。

语言模型使用的是BART,它并不直接处理文本,而是类似于序列到序列之间的建模。

以文本离散序列为输入,输出为图像的离散序列,然后用图像解码器VQGAN生成图像。

△哥斯拉骑单轮车
OpenAI坐不住了:改名!
就在达利迷你版爆火全网之际,OpenAI坐不住了,要求原作者改名。

迫于压力下,达利迷你版更名为了Craiyon,不过在Hugging Face上的界面名称还没有变。

不少网友表示:可以理解,这是一定会发生的事。但好的工具只会因为它的优点获得认可,而非营销噱头。

与此同时,OpenAI这边还在强调“为了与广大观众分享DALL·E的魔力”,时不时地在博客上发布一些规避风险的举措。
就在最近,他们在预训练过程加了过滤器,删除并重新加权了一些图像。
比如一些涉及军事枪支、暴力和性的图像,都会在过滤之后消失。

这一波对比操作, 被不少网友调侃:
你们还在测试,达利迷你版那边已经玩嗨了。

One More Thing
就在达利迷你版更名之际,又一个版本——min(DALL·E)诞生了,号称是最小实现。
它已被剥离成基本要素,并转换为 PyTorch,目前GitHub上已有上千星。

感兴趣的旁友,可戳下方链接了解~
https://github.com/kuprel/min-dalle
Craiyon体验链接
https://www.craiyon.com/
https://huggingface.co/spaces/dalle-mini/dalle-mini
参考链接:
[1]https://www.wired.com/story/dalle-ai-meme-machine/
[2]https://openai.com/blog/DALL·E-2-pre-training-mitigations/
[3]https://www.reddit.com/r/MachineLearning/comments/vmi13r/p_dalle_mini_stripped_to_its_bare_essentials_and/
[4]https://twitter.com/iScienceLuvr/status/1536294746041114624
[5]https://twitter.com/weirddalle
[6]https://www.reddit.com/r/weirddalle/
[7]https://www.reddit.com/r/dalle2/comments/vgtgdc/openai_who_runs_dalle2_alleged_threatened_creator/
边栏推荐
- [reading notes] Figure comparative learning gnn+cl
- The popularity of B2B2C continues to rise. What are the benefits of enterprises doing multi-user mall system?
- [ManageEngine] how to make good use of the report function of OpManager
- How to correctly evaluate video image quality
- Why do offline stores need cashier software?
- Three-level distribution is becoming more and more popular. How should businesses choose the appropriate three-level distribution system?
- LeetCode 503. 下一个更大元素 II
- 使用el-upload封装得组件怎么清空已上传附件
- LeetCode 503. Next bigger Element II
- What are the advantages of the live teaching system to improve learning quickly?
猜你喜欢

TDengine 连接器上线 Google Data Studio 应用商店

分布式数据库下子查询和 Join 等复杂 SQL 如何实现?

【数组的中的某个属性的监听】

Unity skframework framework (24), avatar controller third person control

Charm of code language

Unity SKFramework框架(二十二)、Runtime Console 运行时调试工具

Community group buying exploded overnight. How should this new model of e-commerce operate?

E-commerce apps are becoming more and more popular. What are the advantages of being an app?

TDengine ×英特尔边缘洞见软件包 加速传统行业的数字化转型

LeetCode 556. Next bigger element III
随机推荐
Analysis on the wallet system architecture of Baidu trading platform
植物大战僵尸Scratch
测试老鸟浅谈unittest和pytest的区别
小程序启动性能优化实践
What should we pay attention to when entering the community e-commerce business?
【数组的中的某个属性的监听】
卷起来,突破35岁焦虑,动画演示CPU记录函数调用过程
百度评论中台的设计与探索
H.265编码原理入门
Observation cloud and tdengine have reached in-depth cooperation to optimize the cloud experience of enterprises
正式上架!TDengine 插件入驻 Grafana 官网
Mobile heterogeneous computing technology GPU OpenCL programming (Advanced)
百度智能小程序巡檢調度方案演進之路
[how to disable El table]
Why do offline stores need cashier software?
Are databases more popular as they get older?
LeetCode 556. Next bigger element III
分布式数据库下子查询和 Join 等复杂 SQL 如何实现?
OpenGL - Model Loading
idea用debug调试出现com.intellij.rt.debugger.agent.CaptureAgent,导致无法进行调试