云彩店邀请码|半壳|优胜
随着机群规模的不断扩大,机群系统的能耗急剧增长,并且系统的效率也不断下降,能耗和效率问题已成为目前制约机群系统进一步发展的瓶颈。由于异构加速结点在体系结构设计上的优势,其单机的数值计算能力比传统的通用服务器计算结点高很多,并且能耗利用率也高很多。因此,人们开始将异构加速结点应用于机群系统中,使得大规模异构机群成了近两年来机群系统研究的热点。虽然现在已有了大量的机群监控系统,但是它们在规模伸缩性方面还需要进一步的提高,此外,现有大部分系统不能很好满足异构环境的需求,因此本文致力于监控系统的研究,为解决上述问题做出有效的探索。具体的说,本文的工作和贡献主要包括以下几个方面:1) 设计并实现了适用于异构机群环境的系统监控代理程序架构。本研究采用模块化设计方式,重构了监控代理程序的架构,使得系统的监控功能具备良好的可定制性与扩展性,以满足异构机群环境下各种异构结点的监控需求。2) 优化了监控系统在大规模机群环境分布式监控架构。在优化后的分布式监控架构中:a) 采用 “主动/被动”结合的方式收集原始监控数据,b) 使用层次化的数据聚合树来组织主监控代理程序进行分布式数据汇总、传输、存储,c) 使用“基于路径查询表达式”机制来获取与查询数据。这样的监控架构降低了监控数据传输与存储的资源消耗。此外,还提出了一种针对该数据聚合树的自动构造算法,用于自动构造分布式监控树,以提高系统的易配置性。3) 在监控系统中设计与实现了数据服务功能。本文所述原型系统中实现了XML数据服务功能,向其它子系统(如负载均衡、作业调度)直接提供性能数据,这样可以避免其它子系统对同类性能数据的重复采集。除了向外部系统提供数据以外,系统内部各个组件之间可能相互调用数据服务接口,系统各个组件之间的数据传输便是使用数据服务功能实现的。本文最后还设计了相关的实验对原型系统的功能进行了验证,并对系统各个关键组件的性能进行了测试与分析。实验表明,本文所研究和实现的监控原型既满足了大规模异构机群系统监控需求,又具备易配置性,并且性能开销低。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/204535.html
本站部分内容来源网络如有侵权请联系删除