当前位置:网站首页>PyTorch分布式backends
PyTorch分布式backends
2022-08-02 19:42:00 【harry_tea】
DistributedDataParallel(DDP)
Backend
在Pytorch进行分布式训练中,需要在不同的进程间进行通信,完成模型训练过程中参数的传递,主要考虑通信后端和通信模式选择,这要依赖IPC通信机制,这些通信机制是由Pytorch之外的第三方实现的,目前一共支持三种: Pytorch backends
- nccl——NVIDIA(GPU训练推荐)
- gloo——Facebook
- mpi——OpenMPI
Initialization Methods
通信方法,目前主要有三种
- TCP initialization :init_method=‘tcp://10.1.1.20:23456’
- Shared file-system initialization:init_method=‘file:///mnt/nfs/sharedfile’
- env
边栏推荐
猜你喜欢
AI Scientist: Automatically discover hidden state variables of physical systems
Redis cluster configuration
Detailed explanation of common examples of dynamic programming
Electron使用指南之初体验
如何解决图像分类中的类别不均衡问题?不妨试试分开学习表征和分类器
磁盘分区的知识
MySQL安装配置教程(超级详细)
Introduction of uncommon interfaces of openlayers
What is a Field Service Management System (FSM)?what is the benefit?
太魔人招新啦|快来加入我们吧!
随机推荐
ECCV 2022 | 通往数据高效的Transformer目标检测器
Triacetin是什么化学材料
脑机接口003 | 马斯克称已实现与云端的虚拟自己对话,相关概念股份大涨
[安洵杯 2019]easy_web
4KMILES加入艾盛集团,以更强劲的数字商务能力,加速中国跨境电商的全域全效增长
J9数字论:互联网跨链桥有什么作用呢?
基于“无依赖绝对定位”实现的圣杯三栏布局
扫码预约 | 观看Apache Linkis数据处理实践以及计算治理能力
光源控制器接口定义说明
Introduction of uncommon interfaces of openlayers
软件测试分类
es DELETE index 源码分析
Shell: conditional statements
日志框架学习
健康报告-设计与实现
2022-07-28
2022-07-26
Electron User Guide Beginning Experience
Caldera(二)高级实战
EMQX Newsletter 2022-07|EMQX 5.0 正式发布、EMQX Cloud 新增 2 个数据库集成