当前位置:网站首页>盗版DALL·E成梗图之王?日产5万张图像,挤爆抱抱脸服务器,OpenAI勒令改名
盗版DALL·E成梗图之王?日产5万张图像,挤爆抱抱脸服务器,OpenAI勒令改名
2022-07-05 09:35:00 【QbitAl】
杨净 发自 凹非寺
量子位 | 公众号 QbitAI
AI艺术家DALL·E达利,竟成梗图之王?
这阵子,国内外社交网络上,都刮起了一阵“达利”meme风。
比如这个,带着14公斤鱼的蜘蛛侠,这不就是我的日常摸鱼状态吗?
恐怖分子皮卡丘,还是很可爱怎么回事?
在Twitter上,有网友专门发起了#DalleMeme话题,同时Reddit上也已经开设了专栏weirddalle,目前已有9万人关注、每天近千人实时在线。
有个账号每天靠发“达利”meme图,几个月时间已经攒粉近百万。
可以说,达利家族真的靠梗图彻底出圈了。但就在大家玩得不亦乐乎的时候,达利的缔造者OpenAI却坐不住了:
改名!改名!改名!
这是怎么回事?
梗图之王,并非真DALL·E
原来,靠梗图出圈的“达利”,并非真正的达利。
它叫做DALL·E Mini,达利迷你版,比正版多了个Mini,但两者完全没有任何关系。
据作者介绍,当时几个志同道合的开发者,在达利的启发下,在Hugging Face上搞了个mini版,结果还获了奖。
主创之一Boris Dayma,在此基础上继续开发并将其开源。
免费的“达利”谁不用,要知道真正的DALL·E 2目前只有少部分内测资格~
于是乎,梗图之王就此诞生。
据Wired报道,Hugging Face的CEO曾大吐苦水:我们的工程师第一天晚上都没有睡觉。
要为这些模型提供大规模服务真的很困难。
而最近几周,达利迷你版每天会提供大约50000张图像。甚至有媒体称,已成互联网上最受欢迎meme生成器。
作者透露,达利迷你版的设计结构很简单。
核心两个组件:语言模型+图像解码器,它从互联网上数百万个图像-文本标题对学习而来。
语言模型使用的是BART,它并不直接处理文本,而是类似于序列到序列之间的建模。
以文本离散序列为输入,输出为图像的离散序列,然后用图像解码器VQGAN生成图像。
△哥斯拉骑单轮车
OpenAI坐不住了:改名!
就在达利迷你版爆火全网之际,OpenAI坐不住了,要求原作者改名。
迫于压力下,达利迷你版更名为了Craiyon,不过在Hugging Face上的界面名称还没有变。
不少网友表示:可以理解,这是一定会发生的事。但好的工具只会因为它的优点获得认可,而非营销噱头。
与此同时,OpenAI这边还在强调“为了与广大观众分享DALL·E的魔力”,时不时地在博客上发布一些规避风险的举措。
就在最近,他们在预训练过程加了过滤器,删除并重新加权了一些图像。
比如一些涉及军事枪支、暴力和性的图像,都会在过滤之后消失。
这一波对比操作, 被不少网友调侃:
你们还在测试,达利迷你版那边已经玩嗨了。
One More Thing
就在达利迷你版更名之际,又一个版本——min(DALL·E)诞生了,号称是最小实现。
它已被剥离成基本要素,并转换为 PyTorch,目前GitHub上已有上千星。
感兴趣的旁友,可戳下方链接了解~
https://github.com/kuprel/min-dalle
Craiyon体验链接
https://www.craiyon.com/
https://huggingface.co/spaces/dalle-mini/dalle-mini
参考链接:
[1]https://www.wired.com/story/dalle-ai-meme-machine/
[2]https://openai.com/blog/DALL·E-2-pre-training-mitigations/
[3]https://www.reddit.com/r/MachineLearning/comments/vmi13r/p_dalle_mini_stripped_to_its_bare_essentials_and/
[4]https://twitter.com/iScienceLuvr/status/1536294746041114624
[5]https://twitter.com/weirddalle
[6]https://www.reddit.com/r/weirddalle/
[7]https://www.reddit.com/r/dalle2/comments/vgtgdc/openai_who_runs_dalle2_alleged_threatened_creator/
边栏推荐
- Android privacy sandbox developer preview 3: privacy, security and personalized experience
- What should we pay attention to when developing B2C websites?
- Understanding of smt32h7 series DMA and DMAMUX
- Why does everyone want to do e-commerce? How much do you know about the advantages of online shopping malls?
- Principle and performance analysis of lepton lossless compression
- tongweb设置gzip
- Deep understanding of C language pointer
- [sorting of object array]
- How to implement complex SQL such as distributed database sub query and join?
- Develop and implement movie recommendation applet based on wechat cloud
猜你喜欢
The most comprehensive promotion strategy: online and offline promotion methods of E-commerce mall
LeetCode 556. Next bigger element III
Baidu app's continuous integration practice based on pipeline as code
【数组的中的某个属性的监听】
LeetCode 31. Next spread
Node の MongoDB Driver
OpenGL - Coordinate Systems
oracle 多行数据合并成一行数据
E-commerce apps are becoming more and more popular. What are the advantages of being an app?
OpenGL - Lighting
随机推荐
How to empty uploaded attachments with components encapsulated by El upload
卷起来,突破35岁焦虑,动画演示CPU记录函数调用过程
【技术直播】如何用 VSCode 从 0 到 1 改写 TDengine 代码
About getfragmentmanager () and getchildfragmentmanager ()
Analysis on the wallet system architecture of Baidu trading platform
Data visualization platform based on template configuration
Mobile heterogeneous computing technology GPU OpenCL programming (Advanced)
测试老鸟浅谈unittest和pytest的区别
What are the advantages of the live teaching system to improve learning quickly?
Roll up, break 35 - year - old Anxiety, animation Demonstration CPU recording Function call Process
解决Navicat激活、注册时候出现No All Pattern Found的问题
[team PK competition] the task of this week has been opened | question answering challenge to consolidate the knowledge of commodity details
From "chemist" to developer, from Oracle to tdengine, two important choices in my life
百度评论中台的设计与探索
【数组的中的某个属性的监听】
uni-app---uni. Navigateto jump parameter use
LeetCode 31. 下一个排列
TDengine 离线升级流程
tongweb设置gzip
Unity SKFramework框架(二十二)、Runtime Console 运行时调试工具