当前位置:网站首页>MindSpore:【模型训练】【mindinsight】timeline的时间和实际用时相差很远
MindSpore:【模型训练】【mindinsight】timeline的时间和实际用时相差很远
2022-07-30 19:04:00 【小乐快乐】
问题描述:
【功能模块】
【模型训练】【mindinsight】【timeline】
【操作步骤&问题现象】
1、训练模型,跑了两个epoch,耗时大概十分钟
2、下载timeline

3、导入到chrome的tracing功能中
【截图信息】
timeline:

看到timeline中颜色条集中在两个地方,一个是0days附近,一个是在2.315days前那里。从timeline上看一个用时超过1天。而且在下载timeline的那个地方,显示Total operator execution time:597285262.1108ms,相当于6.9天
但从loss-step的折线图看,2个epoch总共才用了624秒:

为什么程序实际上只跑了十分钟,但timeline那里却显示那么久?
解决方案:
是AIcpu和AIcore算子的时间戳没有对齐。我们正在修复,会尽快合入master分支。您可以基于现有的timeline文件,主要关注AIcore算子的信息(Process 0下的算子)进行性能分析。
边栏推荐
猜你喜欢

Fixed asset visualization intelligent management system

VS Code 连接SQL Server

- daily a LeetCode 】 【 191. A number of 1

Read the "Language Model" in one article

沉浸式体验科大讯飞2022消博会“官方指定产品”

SwiftUI iOS Boutique Open Source Project Complete Baked Food Recipe App based on SQLite (tutorial including source code)

Swiper轮播图片并播放背景音乐

【网站放大镜效果】两种方式实现

中集世联达工业级成熟航运港口人工智能AI产品规模化应用,打造新一代高效能智慧港口和创新数字港口,全球港航人工智能能领军者中集飞瞳

JS提升:Promise中reject与then之间的关系
随机推荐
高精度加法
还有三天忙完
跨域问题的解决方法
scrapy基本使用
Tensorflow2.0 confusion matrix does not match printing accuracy
Codeblocks + Widgets create window code analysis
第14章 类型信息
MongoDB打破了原则引入SQL?
微信小程序云开发 | 城市信息管理
防抖和节流有什么区别,分别用于什么场景?
Golang logging library zerolog use record
OneFlow source code analysis: Op, Kernel and interpreter
crontab中写go run不执行的问题
【剑指 Offe】剑指 Offer 17. 打印从1到最大的n位数
The problem of writing go run in crontab does not execute
natural language processing nltk
【剑指 Offer】剑指 Offer 22. 链表中倒数第k个节点
Spark学习:编译Spark项目时遇到的报错
Entering the applet for the first time
WEBSOCKETPP使用简介+demo