当前位置:网站首页>NLP未来,路在何方?从学术前沿和业界热点谈起
NLP未来,路在何方?从学术前沿和业界热点谈起
2022-08-04 17:00:00 【夕小瑶】
近两年,人工智能的应用越来越“卷”了,每隔一段时间就会出现一个让人大呼“respect”的技术。
AI好像也更加懂人类,越来越接近“人的智能”。
就好比今年高考期间被各大科技媒体反复拿来讲的AI高考的案例。如今的“AI做题家”不光能参加高考,还能挑战本科生甚至研究生。比如,来自OpenAI的Codex在麻省理工学院的高数课程题目中正确率达到了81.1%,说能比肩顶尖学府本科生水平也不为过。
像AI实时翻译这种能力尽管之前翻车的不少,但对于它的商业化,行业的预期非常明确。在跨国会议中看到不同国家的参会者,操着不同的语言,无障碍进行交流的场景,已经不是遥不可及的想象。
聊天机器人的表现也不再仅仅是机械式的一问一答,有的已经可以感知情感,能分析情绪并给出相应的反馈。让虚拟偶像具备情感陪伴的能力也是大热的落地方向之一。
这些应用的背后都离不开自然语言处理(NLP)技术的不断精进。
再说说前不久被科技圈津津乐道的“东方名画”——虎戴VR。脑洞大开的外国网友,不按套路向谷歌人工智能作画系统Imagen,输送了指令:给宋代的东方老虎佩戴VR。结果产生了一系列毫无违和感的作品,谁看了都得说一声:谷歌,牛X!
Imagen是目前人工智能多模态理解与创作的集大成者,但这套模型对人类指令的精准识别和理解,背后发挥作用的同样是NLP。
可以说,要让人工智能更像“人的智能”,就躲不开语言理解和语言处理这个大热的方向。
NLP领域目前有哪些亟待突破的技术问题?长文本的语言处理的技术难点在哪里?面向开放域问答的自适应信息检索如何精益求精?NLP技术如何在小红书这样的复杂UGC内容社区中应用和落地?
想要得到这些问题的解答,你一定不能错过小红书技术团队出品的《REDtech 来了》系列第三期技术直播。8月5日19:00,小红书将邀请业内顶尖专家和大家一同探讨“自然语言处理的前沿与实践”。
除了张岳、庞亮两位学界大牛的分享干货满满之外,小红书社区搜索文本理解负责人曾书和小红书技术模型负责人王树森分享的小红书所面临的NLP问题和实践将会是第一手的工业界案例分享,同样不容错过。
作为国内独树一帜的内容社区,截至 2021 年10 月,小红书APP月活跃用户数已经超过 2 亿。小红书最大的特色在于其社区内容以UGC为主,且内容多以音视频+图文的多模态呈现,这对文本和内容的理解提出了更高的要求。
小红书对于用户内容去中心化的分发机制,也决定了在算法中对内容本身的理解占据了更大的比重,而不是简单依赖于对用户行为的分析。
海量UGC内容还带来了非标化的问题,最常见的案例就是对比喻义和引申义的理解。
当一个用户看到一片令人心旷神怡的草地,他拍下照片并记录“仿佛置身于塞尔达旷野之息”。算法该如何理解这里的这篇笔记的核心内容,如何判断哪些用户会喜欢这篇笔记?
再比如在一篇旅行笔记中,用户把一座海边的渔村称作“福建小希腊”,当其他用户用“希腊”作为关键词搜索时,这篇笔记是否该出现,何时出现——这背后都是复杂的NLP问题。
对于这些问题,小红书会尝试哪些更好的解决方式?小红书的业务场景和数据还可以孕育哪些令人激动的技术问题?相信在8月5日晚的这场直播中也将找到答案。
直播收看攻略:
时间:2022 年 8 月 5 日(周五)19:00-21:00
直播平台:关注【小红书技术 REDtech 】视频号,预约直播,不见不散。(直播也将在抖音与B站同步进行,搜索“小红书技术 REDtech ”)
扫描下方二维码进入直播交流群,将第一时间获取直播链接及开播提醒。
我们将在微信群内发布嘉宾演讲精华和抽奖活动, 参与互动提问还有机会被嘉宾pick解答哦。
目前,小红书REDstar顶尖技术人才招聘计划已经正式启动。“REDstar“是小红书面向全球高校顶尖技术人才发起的专属人才招聘计划,将为REDstar提供有行业竞争力的薪酬福利、极富诚意的专属培养方案以及敢于提拔年轻人的实践通道。诚挚地邀请各技术领域的优秀同学加入,一起用技术让生活变得更加美好!
REDstar项目期间,锁定小红书技术分享直播间,开拓前沿技术视野,深入了解小红书技术团队的真实业务场景和技术氛围。提前入群还有机会获得与专家直接互动机会。
点击阅读原文,成为REDstar
即刻投递,抢占先机!
边栏推荐
猜你喜欢
shell脚本详解 --------循环语句之for循环
Cesium快速上手0-Cesium安装与基本介绍
Mobile magic box CM211-1_YS foundry _S905L3B_RTL8822C_wire brush firmware package
LeetCode 每日一题——1403. 非递增顺序的最小子序列
RTL8762DK 远端设备配对
Mobile Hisense IP102H_905L3-B_wire brush firmware package
LeetCode Question of the Day - 1403. Minimum Subsequence in Non-Increasing Order
安装win11提示开启安全模式如何解决
Copycat CNN: Stealing Knowledge by Persuading Confession with Random Non-Labeled Data阅读心得
跨链桥已成行业最大安全隐患 为什么和怎么办
随机推荐
ping不通百度
SAP 电商云 Spartacus UI SSR 里 engine 和 engine instance 的区别
刷爆朋友圈!Alibaba出品亿级并发设计速成笔记太香了!
icu是哪个国家的域名?icu是什么域名?
西西成语接龙小助手
移动魔百盒CM201-1_CW_S905L2_MT7668_线刷固件包
Heilongjiang Mobile New Magic Hundred Box M411A_2+8_S905L3A_wire brush firmware package
CSDN21天学习挑战赛——程序流程控制(02)
【LeetCode每日一题】——540.有序数组中的单一元素
湖北电信天邑TY1608_S905L3B_MT7668_卡刷固件包
九联_UNT400G_S905L2_(联通)_线刷固件包
Mobile BesTV_R3300-L_S905L_8189_wire brush firmware package
Codeforces Round #811 (Div. 3)
广东移动魔百盒M411A _905L3_线刷固件包
不需要服务器,教你仅用30行代码搞定实时健康码识别
域名哪家便宜?怎么买便宜域名?
海报 | 夏季高温,危化品安全风险的注意事项必须get!
R语言使用cov函数计算矩阵或者dataframe数据变量之间的协方差、cor函数计算相关性、cor函数通过method参数指定相关性、相关性计算方法Pearson,Spearman, Kendall
罗振宇折戟创业板/ B站回应HR称用户是Loser/ 腾讯罗技年内合推云游戏掌机...今日更多新鲜事在此...
葫芦娃解析