当前位置:网站首页>数据标注典型案例,景联文科技如何助力企业搭建数据方案
数据标注典型案例,景联文科技如何助力企业搭建数据方案
2022-07-02 22:09:00 【景联文科技】
作为人工智能发展的三大要素之一,数据的作用至关重要。
景联文科技为企业提供专业数据方案设计,帮助企业快速搭建与自己算法模型匹配的数据方案,进行新业务领域的探索。
景联文科技是长三角地区规模最大的AI基础数据服务商,自研数据标注平台,建立成熟的标注、审核、质检机制,支持计算机视觉、语音工程、自然语言处理等多类型数据标注项目。
凭借高质量训练数据与全球上百家大型科技企业、科研机构保持深度合作。
用户案例
1. 知名安防厂商 违禁品2d分割标注
一、需求:
50万张图像33个种类违禁品分割标注
二、项目难点:
1)标注数据量大,工期紧张。
2)违禁品种类多标签多,相似物品判别难度大。
三、解决方案:
1)针对标注规则体系,配置专属商务、项目经理、标注员、质检员、技术人员,加班对团队进行培训,学习专业知识,调整标注规范返修数据。
2)景联文标注平台预标注能力与自动质检功能有效提高标注效率与质量
3)全量质检和两轮抽检三次数据质检后分批提交数据,针对已提交数据反馈的问题及时和客户确认
四、交付结果:
工期内足额完成交付,一次合格率 98%。
2. 政府智慧城市视频标注项目
一、需求:
2万辆车辆跟踪、1000+事件类型标注
二、项目难点:
1)视频总时长4000分钟,标注场景多(包括城市道路,高速公路,城市高架等),事件类型多,工期紧张。
2)视频抽帧、数据清洗较为耗时。
3)视频数据中展现的事件类型较多,普通算法辅助标注的效果不明显。
三、解决方案:
1)针对标注规则体系,安排商务、项目、标注、质检、技术人员对项目背景及目的、规则、注意事项、难点、平台操作、项目要求(准确率、日产量)进行培训。
2)景联文标注平台连续帧预标注功能有效提高标注效率与质量
3)全量质检和两轮抽检三次数据质检后分批提交数据,实时监控进度,一边返修一边检查,随时解决问题。
四、交付结果:
工期内足额完成交付,一次合格率 98.5%。
此外,在计算机视觉领域,景联文科技在矩形拉框、多边形标注、语义分割、实例分割、人脸关键点、车道线、视频连续帧标注、情感分析等项目上均有丰富的标注经验。
- 国家级实验室 声纹识别语音标注
一、需求:
非确定场景下多人对话语音50000条标注
二、项目难点:
1)项目前期标注需求不清晰,反复修改标注规则。
2)部分音频存在多地域口音,算法辅助标注的效果不明显,人工识别也较为困难。
三、解决方案:
1)配备3年以上语音标注项目管理经验的项目经理和标注团队。
2)针对变动的标注规则,即时反馈标注过程遇到的问题并提供多个解决方案,计划预留返修时间,制定预警机制,严格控制关键时间节点。
3)景联文标注平台预标注和自动质检功能有效提高标注效率与质量
四、交付结果:
工期内足额完成交付,一次合格率 98%。
此外,在语音工程领域,景联文科技在ASR语音转写、语音清洗、语音切割、情绪判定、音素标注、韵律标注、机器翻译等项目上均有丰富的标注经验。
- 国家级实验室 文本标注
一、需求:
文本标注20万条,包含意图匹配、概括缩写、整合归纳、标签分类等不同规则
二、项目难点:
1)标注内容涉猎广难度大,对标注人员素质能力要求高。
2)文本类型多、场景多、篇幅长,标签数量多,累计标签和选项达530余个
3)准确率要求99%,工期紧张。
三、解决方案:
1)配备3年以上NLP标注项目管理经验的项目经理和标注团队。
2)安排标注团队对项目背景、目的、规则、注意事项、难点、平台操作、项目要求(准确率、日产量)进行培训和考核,考核淘汰40%,剩余60%人员进入正式任务。
3)根据项目要求进行项目结构分析,基于WBS原理将项目按照其内在结构和实施过程的顺序进行逐层分解成树状图,形成相对独立、易于管理和检查的项目各单元项目责任、进度等具体地落实到本项目每个参与者,确保标注质量。
四、交付结果:
工期内足额完成交付,一次合格率 99%。
此外,在自然语言处理领域,景联文科技在ocr转写、语句泛化、情感分析、命名实体、词性标注、槽位提取、文本匹配、意图匹配、文本清洗、信息抽取等项目上均有丰富的标注经验。
边栏推荐
- 百度智能云-创建人脸识别应用
- E-commerce system microservice architecture
- 傑理之修改不需要長按開機功能【篇】
- [chestnut sugar GIS] how does global mapper batch produce ground contour lines through DSM
- 电商系统微服务架构
- 存储单位换算
- PHP implements querying the data matching the date of birth according to the entered age
- 【洛谷P1541】乌龟棋【DP】
- 【板栗糖GIS】global mapper 如何通过dsm批量制作贴地等高线
- NC50965 Largest Rectangle in a Histogram
猜你喜欢
首批 | 腾讯云完成国内首个云原生安全成熟度评估
Go语言sqlx库操作SQLite3数据库增删改查
[chestnut sugar GIS] ArcScene - how to make elevation map with height
Qt QScrollArea
PMP项目整合管理
【板栗糖GIS】global mapper 如何通过dsm批量制作贴地等高线
数组进阶提高
QT qsplitter splitter
`${}`的用法
World Environment Day | Chow Tai Fook serves wholeheartedly to promote carbon reduction and environmental protection
随机推荐
解决 excel 文件上传时更改选中的文件出现错误net::ERR_UPLOAD_FILE_CHANGED
Jerry's fast touch does not respond [chapter]
世界环境日 | 周大福用心服务推动减碳环保
The kth largest element in the [leetcode] array [215]
送给即将工作的自己
大话云原生之负载均衡篇-小饭馆客流量变大了
LeetCode 968. 监控二叉树
Storage unit conversion
[Luogu p1541] tortoise chess [DP]
How can I use knockout's $parent/$root pseudovariables from inside a . computed() observable?
从2022年Q1财报看携程的韧性和远景
How should programmers write logs
手写ORM(对象关系映射)增删改查
杰理之快速触摸不响应问题【篇】
【板栗糖GIS】arcmap—如何批量修改注记要素的字体,颜色,大小等
杰理之样机在多次触摸后会触发关机【篇】
杰理之、产线装配环节【篇】
创新实力再获认可!腾讯安全MSS获2022年度云原生安全守护先锋
Wait to solve the zombie process
Qt QSplitter拆分器