摘要:目前在航空、航天、能源动力等工业领域,利用 CAE 进行反复设计、分析、优化已成为标准的必经步骤和手段。不同的CAE 应用程序对硬件资源例如处理器、网络和存储的要求各不相同,本文分析了CAE高性能计算平台的需求和挑战,提出了CAE高性能的主要解决方案,以供参考。
关键词:CAE 高性能 计算平台
中图分类号:TP338 文献标识码:A 文章编号:1007-9416(2016)06-0227-01
1 CAE高性能计算平台的需求和挑战
计算机辅助工程(CAE,Computer Aided Engineering)是用计算机辅助求解复杂工程和产品结构强度、刚度、屈曲稳定性、动力响应、热传导、三维多体接触、弹塑性等力学性能的分析计算以及结构性能的优化设计等问题的一种近似数值分析方法。CAE从60年代初在工程上开始应用到今天,现已成为工程和产品结构分析中(如航空、航天、机械、土木结构等领域)必不可少的数值计算工具,同时也是分析连续介质力学各类问题的一种重要手段。
2 CAE的主要步骤
CAE 应用程序基本可以分成两大类,一类是共享内存应用程序,一类是分布式内存应用程序。其主要有三个步骤,第一步是建模亦即前处理,通常在工作站上进行;第二步是求解过程,这是至关重要的一步,需要占用大量的CPU、内存资源以及存储空间,通常是在高性能计算机上完成。这个过程涉及到的软件有Fluent、Ansys、Nastran、Ls-Dyna等;第三步是后处理过程,对计算结果进行处理分析,通常也是在工作站上完成。CAE计算的核心内容是高性能计算。为了使高性能计算机系统能够更好的满足CAE应用软件的需求,需要对主流CAE软件进行深入分析。
3 CAE高性能的主要解决方案
通过对CAE软件的分析我们可以了解到,对于大部分CAE应用,对于节点间并行MPI支持非常好,适合在双路计算节点上运行,做通用计算,而部分CAE软件对内存的需求比较高,则适合在胖节点上用OpenMP方式来计算,因此我们推荐大内存的四路或者八路服务器作为集群胖节点。通过对于CAE应用性能的专业化分析和汇总,提供针对化的解决方案。在高性能应用集群主要解决CAE软件应用中的一下几个主要问题。
3.1 工作站解决方案
主要用于前后处理方面的工作,用于网格划分和可视化显示。由于对于服务器显示和处理能力的要求都比较高,因此我们推荐使用带有专业级显卡的工作站配置。
3.2 计算节点解决方案
显示算法和隐式算法对计算能力的需求不用,方案配置了双路节点,适合于分布式内存的显示计算和流体软件CFD的计算,配置了多路胖节点适合于共享内存的隐式计算。不同架构的设计体现针对化专业化的解决方案。
3.3 网络带宽问题解决方案
在大型CAE软件应用中,并行化对于网络延时和带宽的要求很高,因此要根据需求配置了以太网交换环境或者更快的40Gb的Infiniband网络,满足所有节点无阻塞的计算交换需求,网络延时低。
3.4 存储带宽问题的解决方案
部分CAE软件在计算过程中,会产生大量临时文件,一个优秀的存储系统能够满足软件对于网络带宽的需求。浪潮不仅可以提供了专业级的直连存储,更有8Gb接口的光纤存储系统,通过专有的存储节点构建Lustre并行文件系统,接入以太网,甚至40GB的Infiniband网络,不至于出现CPU等待数据计算的情况,大大提高了计算效率。
4 解决方案的注意事项
4.1 计算系统紧密结合客户应用
在高性能系统设计的过程中要充分考虑CAE客户典型应用,针对客户应用定制化开发系统。针对隐式有限元分析应用浪潮配置胖节点,可选八路胖节点;针对流体类应用配置双路主流计算节点,针对前后处理可选图形工作站,塔式、机架可选;存储方面可提供NAS存储、光纤存储、IB SAN存储等方案,对于IO带宽需求特别高的场合,可以配置性能较好、兼容性较高的并行文件系统。
4.2 完善互联系统
管理网络采用万兆为主干的千兆线速网络,可开辟对教育网/公网的独立IP,实现广域网用户登录使用集群;IPMI网络采用非线速千兆交换机,互联所有节点,管理员通过办公用机可实现集群的带外管理;KVM本地监控网络通过菊花链方式,最多实现960台计算机的KVM监管;计算网络采用IB网络全线速互联,带宽达到56Gb/s,延时1微秒内,充分保证计算中间数据交互。
4.3 确保调度系统先进高效
集群管理软件要通过浏览器(IE,firefox等)进行操作,全面实现集群的监控、管理、报警的软件,用户通过ClusterEngine图形界面提交自己的科学计算任务,ClusterEngine会根据集群中的资源使用情况和作业的资源要求数量来合理的调度用户提交的作业,从而达到提高资源利用率和作业的执行效率的作用。ClusterEngine还可以为集群管理员统计作业的资源消耗情况和用户的资源使用情况,并生成报表,为集群管理员优化系统提供依据。
4.4 确保集群系统绿色节能
所有节点尽量采用80PLUS高效电源,提高电源转换效率,降低用户运维成本。结合Cluster Engine节能组件,可以自动将空闲资源设置为待机或者关机状态,整体节能至少会降低20%。
5 结语
自二十世纪六十年代以来CAE技术得到飞速发展,其原动力是不断增长的工业需求,这其中航天航空、能源动力等领域是其发展的强大的推动力。如大型复杂飞行器结构的流-固耦合计算,涉及计算空气动力学、计算燃烧学、计算传热学、计算结构力学等众多学科,目前CAE已成为航空、航天、能源动力等工业领域不可或缺的研究手段。CAE高性能计算平台的建设,对于企业生产目标的实现,有核心的基础技术支撑作用。