当前位置:网站首页>数据标注典型案例,景联文科技如何助力企业搭建数据方案
数据标注典型案例,景联文科技如何助力企业搭建数据方案
2022-07-02 22:09:00 【景联文科技】
作为人工智能发展的三大要素之一,数据的作用至关重要。
景联文科技为企业提供专业数据方案设计,帮助企业快速搭建与自己算法模型匹配的数据方案,进行新业务领域的探索。
景联文科技是长三角地区规模最大的AI基础数据服务商,自研数据标注平台,建立成熟的标注、审核、质检机制,支持计算机视觉、语音工程、自然语言处理等多类型数据标注项目。
凭借高质量训练数据与全球上百家大型科技企业、科研机构保持深度合作。

用户案例
1. 知名安防厂商 违禁品2d分割标注
一、需求:
50万张图像33个种类违禁品分割标注
二、项目难点:
1)标注数据量大,工期紧张。
2)违禁品种类多标签多,相似物品判别难度大。
三、解决方案:
1)针对标注规则体系,配置专属商务、项目经理、标注员、质检员、技术人员,加班对团队进行培训,学习专业知识,调整标注规范返修数据。
2)景联文标注平台预标注能力与自动质检功能有效提高标注效率与质量
3)全量质检和两轮抽检三次数据质检后分批提交数据,针对已提交数据反馈的问题及时和客户确认
四、交付结果:
工期内足额完成交付,一次合格率 98%。

2. 政府智慧城市视频标注项目
一、需求:
2万辆车辆跟踪、1000+事件类型标注
二、项目难点:
1)视频总时长4000分钟,标注场景多(包括城市道路,高速公路,城市高架等),事件类型多,工期紧张。
2)视频抽帧、数据清洗较为耗时。
3)视频数据中展现的事件类型较多,普通算法辅助标注的效果不明显。
三、解决方案:
1)针对标注规则体系,安排商务、项目、标注、质检、技术人员对项目背景及目的、规则、注意事项、难点、平台操作、项目要求(准确率、日产量)进行培训。
2)景联文标注平台连续帧预标注功能有效提高标注效率与质量
3)全量质检和两轮抽检三次数据质检后分批提交数据,实时监控进度,一边返修一边检查,随时解决问题。
四、交付结果:
工期内足额完成交付,一次合格率 98.5%。

此外,在计算机视觉领域,景联文科技在矩形拉框、多边形标注、语义分割、实例分割、人脸关键点、车道线、视频连续帧标注、情感分析等项目上均有丰富的标注经验。
- 国家级实验室 声纹识别语音标注
一、需求:
非确定场景下多人对话语音50000条标注
二、项目难点:
1)项目前期标注需求不清晰,反复修改标注规则。
2)部分音频存在多地域口音,算法辅助标注的效果不明显,人工识别也较为困难。
三、解决方案:
1)配备3年以上语音标注项目管理经验的项目经理和标注团队。
2)针对变动的标注规则,即时反馈标注过程遇到的问题并提供多个解决方案,计划预留返修时间,制定预警机制,严格控制关键时间节点。
3)景联文标注平台预标注和自动质检功能有效提高标注效率与质量
四、交付结果:
工期内足额完成交付,一次合格率 98%。

此外,在语音工程领域,景联文科技在ASR语音转写、语音清洗、语音切割、情绪判定、音素标注、韵律标注、机器翻译等项目上均有丰富的标注经验。
- 国家级实验室 文本标注
一、需求:
文本标注20万条,包含意图匹配、概括缩写、整合归纳、标签分类等不同规则
二、项目难点:
1)标注内容涉猎广难度大,对标注人员素质能力要求高。
2)文本类型多、场景多、篇幅长,标签数量多,累计标签和选项达530余个
3)准确率要求99%,工期紧张。
三、解决方案:
1)配备3年以上NLP标注项目管理经验的项目经理和标注团队。
2)安排标注团队对项目背景、目的、规则、注意事项、难点、平台操作、项目要求(准确率、日产量)进行培训和考核,考核淘汰40%,剩余60%人员进入正式任务。
3)根据项目要求进行项目结构分析,基于WBS原理将项目按照其内在结构和实施过程的顺序进行逐层分解成树状图,形成相对独立、易于管理和检查的项目各单元项目责任、进度等具体地落实到本项目每个参与者,确保标注质量。
四、交付结果:
工期内足额完成交付,一次合格率 99%。

此外,在自然语言处理领域,景联文科技在ocr转写、语句泛化、情感分析、命名实体、词性标注、槽位提取、文本匹配、意图匹配、文本清洗、信息抽取等项目上均有丰富的标注经验。
边栏推荐
- [chestnut sugar GIS] how does global mapper batch produce ground contour lines through DSM
- [Solved] Splunk: Cannot get username when all users are selected“
- Splunk audit 的设定
- [chestnut sugar GIS] ArcMap - how to batch modify the font, color, size, etc. of annotation elements
- I admire that someone explained such an obscure subject as advanced mathematics so easily
- Performance optimization - rigorous mode
- Jerry's prototype has no touch, and the reinstallation becomes normal after dismantling [chapter]
- Wait to solve the zombie process
- 中国信通院、清华大学、腾讯安全,云原生安全产学研用强强联合!
- Oracle cursor
猜你喜欢

大话云原生之负载均衡篇-小饭馆客流量变大了
![[LeetCode] 数组中的第K个最大元素【215】](/img/72/d3e46a820796a48b458cd2d0a18f8f.png)
[LeetCode] 数组中的第K个最大元素【215】

【喜欢的诗词】好了歌

Baidu AI Cloud - create a face recognition application

首批 | 腾讯云完成国内首个云原生安全成熟度评估

Oracle PL / SQL programming
![[leetcode] reverse the word III in the string [557]](/img/72/d3e46a820796a48b458cd2d0a18f8f.png)
[leetcode] reverse the word III in the string [557]

odoo13搭建医院HRP环境(详细步骤)

Mathematical modeling -- graph and network models and methods (I)

`${}`的用法
随机推荐
用sentinel熔断比例阈值改不了,设置慢调用比例没效果
P7072 [CSP-J2020] 直播获奖
'when to use const char * and when to use const char []' - when to use const char * and when to use const char []
LeetCode 968. 监控二叉树
【硬件】标准阻值的由来
解决 excel 文件上传时更改选中的文件出现错误net::ERR_UPLOAD_FILE_CHANGED
位的高阶运算
[leetcode] most elements [169]
Splunk audit 的设定
傑理之修改不需要長按開機功能【篇】
[leetcode] reverse string [344]
Zhong Xuegao responded that the product will not melt for 1 hour: it contains solid components and cannot melt into water
[chestnut sugar GIS] how does global mapper batch produce ground contour lines through DSM
Jerry's built-in short press and long press, no matter how long it is, it is a short press [chapter]
Storage unit conversion
存储单位换算
【板栗糖GIS】arcscene—如何做出有高度的高程图
【板栗糖GIS】arcmap—为什么使用自定义捕捉的时候,经典捕捉的勾要去掉呢?
【洛谷P1541】乌龟棋【DP】
杰理之充电拔出,无法触摸开机【篇】