当前位置:网站首页>lsf基础命令
lsf基础命令
2022-07-02 13:58:00 【TMC~McGrady】
1、mylsfhosts
mylsfhosts:查询当前用户可用的queues_name及所有的hosts节点。
2、bjobs
bjobs:检查当前用户提交作业状态。会显示所有jobs的JOBID、USER、STAT、QUEUE、FROM_HOST、EXEC_HOST、JOB_NAME、SUBMIT_TIME。
bjobs -r:显示正在运行的jobs。
bjobs -a:显示正在运行的和最近完成的作业。
bjobs -p: 显示等待运行的作业和等待原因。
bjobs -s: 显示正在挂起的作业和挂起的原因。
bjobs -l: 显示该作业的所有信息。
bjobs -u all -m machine_name:查询指定machine_name的所有jobs情况。
3、bhist
bhist:显示最近完成作业或正在运行作业的历史情况。
4、bkill
bkill jobid:删除指定job。
5、bpeek
bpeek jobid:当作业正在运行时显示它的标准输出,监视作业运行。Cannot bpeek an interactive job,不能peek交互式作业。
6、bqueues
bqueues:显示所有的队列信息,QUEUE_NAME、PRIO、STATUS、MAX、JL/U、JL/P、JL/H、NJOBS、PEND、RUN、SUSP。
7、bhosts
bhosts queues_name:显示各节点作业相关情况,HOST_NAME、STATUS、JL/U、MAX、NJOBS、RUN、SSUSP、USUSP、RSV。
bhosts -l machine_name:Total一行为整体状况,Reserved一行为预留,尤其是mem。
8、lsload
lsload machine_name:查询指定machine_name的负载情况,后面可以带多个服务器,同时查看。HOST_NAME、status、r15s、r1m、r15m、ut、pg、ls、it、tmp、swp、mem。
r15s:The 15-second exponentially averaged CPU run queue length.
r1m:The 1-minute exponentially averaged CPU run queue length.
r15m:The 15-minute exponentially averaged CPU run queue length.
ut:The CPU utilization exponentially averaged over the last minute, between 0 and 1. CPU利用率。
pg:The memory paging rate exponentially averaged over the last minute, in pages per second.内存分页速度。
ls:The number of current login users. login users用户登录数。
it:On UNIX, the idle time of the host (keyboard not touched on all logged in sessions), in minutes. 主机空闲时间。
On Windows, the it index is based on the time a screen saver has been active on a particular host.
tmp:The amount of free space in /tmp, in MB. tmp中可用的空间大小。
swp:The amount of available swap space. 可用缓存空间大小。
By default, the amount is displayed in KB. The amount may appear in MB depending on the actual system swap space. Use LSF_UNIT_FOR_LIMITS in lsf.conf to specify a larger unit for the limit (GB, TB, PB, or EB).
mem:The amount of available RAM. 可用mem空间大小。
By default, the amount is displayed in KB. The amount may appear in MB depending on the actual system memory. Use LSF_UNIT_FOR_LIMITS in lsf.conf to specify a larger unit for the limit (GB, TB, PB, or EB).
9、bsub
bsub:提交给lsf作业的命令
-I:交互模式,此时终端不能输入。-Ip、-Is表示在提交job的时候提供虚拟Terminal支持,比如vim这种应用。
-q:指定queues。
-P project_name:指定项目,一般用于标识和统计。
-m hostname:指定服务器,需要确保机器在当前队列中。
-R:
select: 资源选择,满足特定需求的计算节点。比如-R “select[mem>1G]”,表示内存大于1G的,才可以被用来执行相关的作业。
rusage:资源用量,作业需要使用的资源数量。比如-R “rusage[mem=512M]”,表示内存使用量为512M,保留给作业使用。调度器将这些资源从节点可用资源中扣除,不再分配给别人。
-R ‘rusage[mem=204800]’:单位为M,总共200G,保留200G的内存给该job使用。
order:资源顺序,计算节点的选择顺序。比如-R “order[mem]”,当多个机器可选的时候,优先选择内存较大的计算节点。
==-R ‘ut < 0.5 && r1m <10 && mem > 204800 && swap > 50000 order[ut]’ ==,多条件控制选择服务器。
IBM Knowledge Center中包含LSF相关的所有文档 :https://www.ibm.com/docs/en/spectrum-lsf/10.1.0
LSF命令行参考列表包括了每一个命令行帮助文档的链接:https://www.ibm.com/docs/en/spectrum-lsf/10.1.0?topic=reference-command
下载LSF社区版可以快速安装和使用LSF,虽然在数据中心是这管理员的活儿,但是自己想要试一下的话这个最便捷。:https://www.ibm.com/support/pages/where-do-i-download-lsf-community-edition
10、lshosts
lshosts hostname:查看机器资源状态,HOST_NAME、type、model、cpuf ncpus、maxmem、maxswp、server、RESOURCES。
边栏推荐
- 大厂面试总结大全
- LeetCode 4. 寻找两个正序数组的中位数(hard)
- LeetCode 3. 无重复字符的最长子串
- unity Hub 登錄框變得很窄 無法登錄
- john爆破出现Using default input encoding: UTF-8 Loaded 1 password hash (bcrypt [Blowfish 32/64 X3])
- Machine learning perceptron model
- 串口控制舵机转动
- Understand the key technology of AGV -- the difference between laser slam and visual slam
- LeetCode 1. 两数之和
- System Verilog实现优先级仲裁器
猜你喜欢

Sim2real environment configuration tutorial

大廠面試總結大全

According to the atlas of data security products and services issued by the China Academy of information technology, meichuang technology has achieved full coverage of four major sectors

Multi task prompt learning: how to train a large language model?

linux下配置Mysql授权某个用户远程访问,不受ip限制

Yyds dry inventory uses thread safe two-way linked list to realize simple LRU cache simulation

Kubernetes three open interfaces first sight

Ranger (I) preliminary perception

Bib | graph representation based on heterogeneous information network learning to predict drug disease association

SSM integration exception handler and project exception handling scheme
随机推荐
[North Asia data recovery] data recovery case of raid crash caused by hard disk disconnection during data synchronization of hot spare disk of RAID5 disk array
618 reprise en profondeur: la méthode gagnante de la famille Haier Zhi
LeetCode 2. Add two numbers
PCL point cloud image transformation
Unity Json 编写
Unity uses ugui to set a simple multi-level horizontal drop-down menu (no code required)
[error record] the connection of the flutter device shows loading (disconnect | delete the shuttle/bin/cache/lockfile file)
R及RStudio下载安装教程(超详细)
只是巧合?苹果iOS16的神秘技术竟然与中国企业5年前产品一致!
历史上的今天:支付宝推出条码支付;分时系统之父诞生;世界上第一支电视广告...
[cloud native] briefly talk about the understanding of flume, a massive data collection component
VMware安装win10镜像
Take you ten days to easily complete the go micro service series (I)
Cloud native cicd framework: Tekton
unity Hub 登錄框變得很窄 無法登錄
Library management system (Shandong Agricultural University Curriculum Design)
配置基于接口的ARP表项限制和端口安全(限制用户私自接入傻瓜交换机或非法主机接入)
渗透工具-内网权限维持-Cobalt strike
流批一体在京东的探索与实践
What is the difference between self attention mechanism and fully connected graph convolution network (GCN)?