当前位置:网站首页>语音直播系统——做好敏感词汇屏蔽打造绿色社交环境
语音直播系统——做好敏感词汇屏蔽打造绿色社交环境
2022-08-02 14:26:00 【InfoQ】
伴随着语音直播系统软件的发展,覆盖的用户群体变得越来越广泛,鱼龙混杂的用户而带来的负面影响便是语音直播系统中信息内容的不规范,为了降低这样的情况对用户使用体验的影响,则要做好敏感词汇屏蔽工作,以打造绿色的社交环境。
在语音直播系统中要屏蔽的内容一般包含广告,非法词汇,谣言等,在不同的场景下所达到的屏蔽级别也有所不同,常见的屏蔽方式一般有同步过滤和异步召回两种。在语音直播系统开发时,针对敏感的具体的屏蔽流程是什么样的呢?
一•敏感词汇的发现
1•用户举报
语音直播系统软件在开发时实现了举报功能,而且将其设在了好几个模块中,只需用户在使用中看见了不良的信息,都可以进行举报,系统软件就会对该举报内容进行处理。
2•内容聚合
这些所谓的内容聚合其实就是根据内容的相似度开展不良信息的判断,一般内容的相似度计算方法主要有两种,一类是在原始长文本中切分出有意义的term,然后根据term集合开展文本相似度计算。
二•敏感词汇的鉴别
1•特征识别
根据语音直播系统中后台设置的敏感词汇特征开展配对。
2•模型配对
在没有任何能够供参考的敏感特征样本时,就可以通过模型配对方式进行鉴别,该鉴别方式通常是基于机器学习。
3•规则匹配
在语音直播系统中,可使用的规则包括正则表达式,多模式匹配算法等。
三•敏感词汇的处理
1•基础处理
也是语音直播系统开发中较为常规的敏感词汇处理方式,包括封禁用户、删除用户、删除内容、封禁内容、封禁IP或设备等。
2、隐蔽操作
比较常见的隐蔽操作就是把敏感词汇内容设为仅用户自己可见。
3、后续操作
将语音直播系统软件日常运营中发现的不良信息开展汇总,随后逐步完善系统内的模型和规则,提高敏感词汇屏蔽效果。
在语音直播系统开发时,有许多不知名的功能却有着不可忽视的作用,像敏感词汇屏蔽就是这样。实际上不管是什么功能的实现,全部都是为了提升消费者的使用体验,满足消费者的使用需求,这样才能保证开发的语音直播系统软件能够吸引到更多用户。
边栏推荐
猜你喜欢
随机推荐
PAT甲级 1143 最低公共祖先
炎炎夏日打造一个属于自己的“便携小空调”吧
Impulse response invariant method and bilinear transformation method for IIR filter design
为什么四个字节的float表示的范围比八个字节的long表示的范围要广
移除元素 - 双指针
2022-0801 第六小组 瞒春 学习笔记
【滤波器】最小均方(LMS)自适应滤波器
2022-07-10 第五小组 瞒春 学习笔记
单例模式(singleton pattern)
EL 表达式 & JSTL 标签库
常见(MySQL)面试题(含答案)
加点字符就能让qq昵称很酷的神奇代码?
为什么四个字节的float表示的范围比八个字节的long要广
Cookie 和 Session
lammps学习(一)单晶硅纳米磨削
JSP技术
职工管理系统(SSM整合)
this beta version of Typora is expired, please download and install a newer version.Typora的保姆级最新解决方法
第三章-函数的增长-3.1-渐近记号
2022-07-11 第五小组 瞒春 学习笔记