当前位置:网站首页>“听我说谢谢你”还能用古诗来说?清华搞了个“据意查句”神器,一键搜索你想要的名言警句...
“听我说谢谢你”还能用古诗来说?清华搞了个“据意查句”神器,一键搜索你想要的名言警句...
2022-07-31 13:45:00 【QbitAl】
明敏 发自 凹非寺
量子位 | 公众号 QbitAI
艾瑞巴得,又有神器来拯救文盲了!
天气太热只会念叨一句“热死了”?发朋友圈翻来覆去才憋出几个字?
这个检索神器值得了解一下。
只要在搜索框里输入你想表达的意思,如“热死了”。
立刻就能有20个表达这一意思的句子任君挑选。

句子类型还能按需选取,名言警句、歇后语、古诗文都不在话下。

并且给出的名言还会注明出处作者,这下再也不用啥话都往迅哥儿身上套了。

怪不得网友直呼:朋友圈文案高级表达查找替换系统。

而且,我们在试玩了几轮后发现,这个神器在hold住网络俗语“精髓”上的表现有些出人意料。
比如这两天大家都在说的“精神内耗”。
它给出了一段卢梭的话,完全拿捏住了词语本来的意思,语言逼格立马提升好几度。

甚至还能找出意思相近的古诗文。
来自欧阳修《秋声赋》中的这句“百忧感其心,万事劳其形,有动乎中,必遥其情”,说的意思就是焦虑使人精神疲惫。

果真是能通杀古今了。
于是,我们找来了更多网络流行语喂给它,看看还能擦出什么火花~
听我说谢谢你,但古诗版
第一个要尝试的网络名句,是“听我说,谢谢你”。
神器反向输出结果中,意思最为贴近的是王维的这句“举世无相识,终身思旧恩”。
这句诗中明确体现了说话主体人表达感谢之意,称得上是“听我说谢谢你”的究极上流版。

还有在句式上非常接近的结果,是温庭筠笔下的“知我意,感君怜”。

最让人意想不到的,是神器反向输出了《将进酒》里的“与君歌一曲,请君为我倾耳听”。

乍看之下,这个答案好像是错的。
但要知道“听我说谢谢你”能成为梗,就是因为防疫人员尴尬被迫听歌事件……
这么看,反向输出神器还意外扣了题。

不只是这句梗,还有很多网络用语,反向输出神器的回答都是貌似不着边际,但又让人觉得异常契合。
比如输入“无语子”,给出的诗句有:
满怀心腹事,尽在不言中。
这不就是大家表达无语时的真实心境吗?因为不便明说,所以沉默,所以无语。

还有这句“你品,你细品”,输出的诗句也都带有了仔细品读、反复回味的意思。

那么,这个好用又好玩的神器,到底是什么来头呢?
来自清华的“据意查句”
以上说的这个好登西,是由清华推出的“据意查句”神器——WantQuotes。
诞生自清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP),项目指导教师为孙茂松教授和刘知远副教授。
能够快速从全世界这么多语料中找到你想要的句子,这个神器主要靠的是一个超大的数据集和一个推荐模型。
数据集包含了英语、现代汉语和文言文三大部分。
其中,英语部分有6108个名言警句和126713个上下文文本段;
现代汉语部分,包含有3004句名言和408433个相关上下文;
文言文部分,则有4438段文言典故(包括古诗)和116537段相关上下文。

推荐模型方面,本文提出使用BERT作为句子编码器来学习名言警句和相关文本表示。
但由于绝大多数名言警句的表达都非常凝练,但是可能其中每个背后的意义又包含很多层,所以在本方法中,研究人员将义原引入到编码器中。
简单来说,义原是语言学中最小的语义单位。语言学家认为义原体系在任何语言中都适用,不与特定语言相关。
举个例子,“男孩”这个词可以由“人类”、“男性”、“儿童”这个三个义原表示,“女孩”则可以由“人类”、“女性”、“儿童”的组合来表达。

因此在模型中引入义原后,就能很好解决词义消歧的问题,并且能更准确地捕捉到词与词之间的关系。
也就是让模型把语言学得更加透彻。
而在具体任务对比中可以看到,本文方法的性能均优于其他方法。
同时用消融实验验证了训练方法的有效性(下表最后三行结果)。

在只给出左侧文本的条件下,本文方法的结果依旧优于过去方法。

还有反向词典和AI作诗系统
看到这里你可能觉得这项工作有点似曾相识。
没错,那个之前爆火的“反向词典”也来自这个实验室。
所谓“反向”,就是和常规词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。

比如还是这句“听我说谢谢你,因为有你,温暖了四季”,用成语应该怎么说?
反向词典可以立马抛出几十乃至上百个选项出来,并且还会标注推荐程度。
背景颜色越深,代表系统推荐程度越高。

要是碰上啥看不懂的,鼠标一点,就能查看具体释义。

而除了拯救现代失语人外,他们还让AI尝试过写古诗,之前也在网络上爆火过。

不得不说,THUNLP真是要把AI+中文玩出花了。
该实验室由孙茂松教授领衔,教师队伍中还有刘洋教授和刘知远副教授。

前不久,THUNLP还获得了ACL 2022最佳演示论文奖(Best Demo Paper Award)。
该奖项是ACL系列会议对System Demonstration论文授予的最佳论文奖项,每届会议基于评审人员评估的系统贡献度、完成度、影响力及会议演示综合效果的综合评价评选出一篇获奖论文。

One More Thing
目前,“反向词典”在网页端和微信小程序上都能使用,APP在路上了。
“据意查句”还只能在网页端使用(需要扫码关注公众号登陆一下子)。
另外,团队表示还是希望大家在使用时多给反馈、多提建议。
比如给好的推荐名句点赞,如果看到有错误之处也能直接指正。

对了,研发团队还表示,作为开源项目随时欢迎大家加入,参与项目设计&开发、提出需求、反馈问题。
感兴趣的话就去官网戳戳公告吧~
“据意查句”官网:
https://wantquotes.net/
“反向词典”官网:
https://wantwords.net/
参考链接:
https://weibo.com/5198011111/LE58vxn0N?
边栏推荐
- PHP Serialization: eval
- leetcode:485.最大连续 1 的个数
- C#控件ListView用法
- The batch size does not have to be a power of 2!The latest conclusions of senior ML scholars
- Install the latest pytorch gpu version
- 为什么 wireguard-go 高尚而 boringtun 孬种
- IDEA连接MySQL数据库并使用数据
- Unity study notes Description of AVPro video jump function (Seeking)
- Controller层代码这么写,简洁又优雅!
- 4.爬虫之Scrapy框架2数据解析&配置参数&数据持久化&提高Scrapy效率
猜你喜欢

八大排序汇总及其稳定性

【牛客刷题-SQL大厂面试真题】NO3.电商场景(某东商城)

Install the latest pytorch gpu version

C# control ListView usage

Batch大小不一定是2的n次幂!ML资深学者最新结论

The pre-sale of the new Hyundai Paristi is open, and safety and comfort are not lost

深度剖析 Apache EventMesh 云原生分布式事件驱动架构

IDEA can't find the Database solution

关于MySQL主从复制的数据同步延迟问题

IDEA如何运行web程序
随机推荐
csdn发文助手问题
TensorRT安装及使用教程「建议收藏」
文本相似度计算(中英文)详解实战
C# using NumericUpDown control
已解决(pymysqL连接数据库报错)pymysqL.err.ProgrammingError: (1146,“Table ‘test.students‘ doesn‘t exist“)
Error: npm ERR code EPERM
技能大赛训练题:交换机的远程管理
EXCEL如何快速拆分合并单元格数据
Miller_Rabin 米勒拉宾概率筛【模板】
C#获得网卡信息 NetworkInterface IPInterfaceProperties
浏览器被hao360劫持解决办法
selenium被反爬了怎么办?
使用CompletableFuture进行异步处理业务
3.爬虫之Scrapy框架1安装与使用
基于改进YOLOv5的轻量化航空目标检测方法
JSP中如何借助response对象实现页面跳转呢?
Reasons and solutions for Invalid bound statement (not found)
ADS与C#通信
AI cocoa AI frontier introduction (7.31)
Golang - gin - pprof - use and safety