云彩店邀请码|半壳|优胜
随着航天、军事、生物等领域对高性能计算的需求迅速发展,作为高性能计算领域主流的集群系统,由于其集中式管理,使其可扩展规模受到了一定的限制,造成单个集群所提供的计算能力已经逐渐不能满足高性能应用的发展需求。另一方面,对于一些组织,内部具有多个分散的集群系统,由于集群用户的工作性质、方式和时间的不同,造成了整个组织内部集群负载不均衡,计算资源使用率非常低。多集群系统就是为了解决上述问题而提出的,它是基于元计算的思想将分散的集群系统通过高速网络有效的组织起来,提供给用户一个强大的高性能计算环境,达到节省投资,提高计算资源的使用率。为此,多集群系统的作业管理系统研究是实现上述问题的基础,也是重点和难点,其目标是在多集群系统中,实现集群资源共享和负载均衡,统一管理和调度用户作业,提高作业吞吐率,缩短作业平均等待时间和总运行时间。 本论文基于元计算思想构建的多集群系统的结构,设计了作业管理系统的五层软件模型、执行流程和核心数据。以OpenPBS为研究基础设计和实现了单元集群作业管理系统和多集群高层调度器两个功能模块并提出了用于集群内部作业调度的多分区装填算法和用于集群间作业调度的最少资源使用算法。最终实现了多集群间及集群内部的作业管理。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/275796.html
本站部分内容来源网络如有侵权请联系删除