当前位置:网站首页>滴滴开源DELTA:AI开发者可轻松训练自然语言模型
滴滴开源DELTA:AI开发者可轻松训练自然语言模型
2022-07-05 12:38:00 【石臻臻的杂货铺】
滴滴开源DELTA:AI开发者可轻松训练自然语言模型
8月2日消息,自然语言处理领域顶级会议ACL2019在意大利弗洛伦萨继续召开。会上滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台DELTA,以进一步帮助AI开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力NLP应用更好落地。
DELTA是滴滴第22个开源项目。自然语言处理模型和语音模型是很多AI系统与用户交互的接口,此次滴滴正式这一开源深度学习模型训练框架,旨在进一步降低开发者创建、部署自然语言处理系统和语音模型的难度。

DELTA主要基于TensorFlow构建,能同时支持NLP(自然语言处理)和语音任务及数值型特征的训练。整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。
用户准备好模型训练数据,并指定好配置Configuration,模型训练pipeline可以根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。在训练结束之后,自动生成模型文件保存。该模型文件形成统一接口,可以直接上线使用,快速产品化,能让从研究到生产变得更容易。

值得注意的是,除可支持多种模型的训练,DELTA还支持灵活配置,开发者可基于DELTA搭建成多达几十种的复杂的模型;此外,DELTA在多种常用任务上提供了稳定高效的benchmark,用户可以简单快速的复现论文中的模型的结果,同时也可以在此基础上扩展新的模型。在模型构建完成后,用户可以使用DELTA的部署流程工具,迅速完成模型上线。从论文到产品部署无缝衔接。
目前AI开发者可登陆Github(https://github.com/didi/delta)查看DELTA的详细介绍和源代码,利用DELTA加快实验进度,部署用于文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等任务的系统。用户亦可在滴滴的开源平台上(https://didi.github.io/)获取更多滴滴开源项目的相关信息。
实际上,NLP和语音技术在滴滴已经有广泛的应用。通过大量应用了包括自然语言处理、深度学习、知识图谱、语音、推荐等技术,滴滴自建了基于AI的智能客服系统,能利用人工智能技术辅助人工客服,提高人工客服处理问题的效率,并减少人工客服在重复、简单问题上的处理量。此外,基于语音识别以及自然语言理解技术,滴滴也在构建驾驶员语音助手,日本和澳洲的滴滴司机即将能用语音直接“免接触”接单。而在未来,这一语音助手也将支持全方位的语音交互服务,包括影音娱乐、信息查询、车内环境调节,到乘客通信、客服,甚至是加油、充电或维保服务。与此同时,滴滴也在积极推进相关能力的开放,通过提供一站式自然语言处理工具、一站式机器人开放平台,帮助行业合作伙伴更好地实现AI应用落地。
边栏推荐
- Constructing expression binary tree with prefix expression
- GPS data format conversion [easy to understand]
- Taobao, pinduoduo, jd.com, Doudian order & Flag insertion remarks API solution
- Redis clean cache
- C language structure is initialized as a function parameter
- View and modify the MySQL data storage directory under centos7
- A possible investment strategy and a possible fuzzy fast stock valuation method
- ZABBIX agent2 monitors mongodb nodes, clusters and templates (official blog)
- Programming skills for optimizing program performance
- Using docker for MySQL 8.0 master-slave configuration
猜你喜欢

Knowledge representation (KR)

Pytoch monolayer bidirectional_ LSTM implements MNIST and fashionmnist data classification

About LDA model

Principle of universal gbase high availability synchronization tool in Nanjing University

在家庭智能照明中应用的测距传感芯片4530A

Redis highly available slice cluster

Taobao order amount check error, avoid capital loss API

CVPR 2022 | 基于稀疏 Transformer 的单步三维目标识别器

Taobao short videos are automatically released in batches without manual RPA open source

Distributed cache architecture - cache avalanche & penetration & hit rate
随机推荐
GNN(pytorch-geometric)
Transactions from December 27 to 28, 2021
NPM install reports an error
Redis highly available sentinel mechanism
Redis cluster configuration
CVPR 2022 | 基于稀疏 Transformer 的单步三维目标识别器
Kotlin function
10 minute fitness method reading notes (2/5)
Kotlin variable
Learning items
Take you hand in hand to develop a service monitoring component
ZABBIX agent2 installation
Simply take stock reading notes (3/8)
Just a coincidence? The mysterious technology of apple ios16 is actually the same as that of Chinese enterprises five years ago!
Distributed solution - Comprehensive decryption of distributed task scheduling platform - xxljob scheduling center cluster
Oppo Xiaobu launched Obert, a large pre training model, and promoted to the top of kgclue
Add a new cloud disk to Huawei virtual machine
Clear neo4j database data
Distributed solution - completely solve website cross domain requests
struct MySQL