`
猫耳呀
  • 浏览: 170403 次
社区版块
存档分类
最新评论

阿里云E-HPC赋能制造业仿真云弹性

阅读更多

摘要: 从公测开始说起 去年9月份E-HPC开始公测,某仿真客户便开始申请使用弹性高性能服务。该客户因为业务关系已开始或多或少使用云计算产品,另一方面传统制造业发展问题也促使客户想尝试做出一些改变。 经过同客户的初步交流,客户的主要痛点集中在以下方面:客户从事仿真行业,通过服务传统的制造业获得营收,因此客户的客户集中在汽车,航天,船舶等。

从公测开始说起

去年9月份E-HPC开始公测,某仿真客户便开始申请使用弹性高性能服务。该客户因为业务关系已开始或多或少使用云计算产品,另一方面传统制造业发展问题也促使客户想尝试做出一些改变。

经过同客户的初步交流,客户的主要痛点集中在以下方面:客户从事仿真行业,通过服务传统的制造业获得营收,因此客户的客户集中在汽车,航天,船舶等。一方面该仿真企业的客户在不同阶段对算力的需求也不尽相同,有时也突然遇到比较大的仿真需求的客户,自己机房的小规模的机器经常满足不了生产需要,总的来说一年四季客户对计算力的需求总是会有各种各样的波动。

最开始的弹性

E-HPC刚上线时为在云上资源所建立的集群提供了计算机群扩容和缩容的功能,这意味者在云上New出来的计算节点一方面要能部署同其他计算节点一样高性能软件栈,另外一方面要求节点要有同一套POSIX账号体系,以便集群作业调度器能够将用户提交的作业调度到该节点上运行。客户刚开始便很快完成了基于ECS的集群创建,刚开始运行需要几十个计算核心的算例,通过E-HPC的扩容完成计算机群节点的增加,同时可以马上在该集群运行更多核心的结构和流体求解器计算作业。

能自动伸缩的弹性

       客户为制造企业提供仿真服务,有些算例客户在运行前可以预估大概需要多少计算核心计算多少时间,但有些复杂算例,客户也无法确定资源需求量。客户希望E-HPC产品提供的计算机群能够贴着客户从仿真系统提交的作业数量和实际的真正运行作业的计算核心数走,即客户想尽可能用好每一个CPU周期,因此希望E-HPC能帮助客户自动完成自动增加计算节点和自动减少集群的计算节点。所以,AutoScale功能便上线了。AutoScale可以根据整个高性能集群的负载和策略动态调整计算机群扩容和缩容。

同云桌面/GPU服务器的结合

 

一般在仿真工作流里面,完成大量的仿真计算后会进入到渲染阶段,所以一般会经过GPU服务器集群的Pipeline,最后通过云桌面展示给客户的客户。于是E-HPC开始支持自定义镜像,方便客户从带有特点渲染软件的镜像启动GPU实例完成仿真后处理工作,并且E-HPC开始推出支持竞价实例的扩容方式以便客户能够使用较低的成本完成一些无状态的训练任务。

超级计算集群

传统的高能计算,为了计算的极致,从每年的Top500来看,在计算存储网络方面都有很明显的特点。首先,在计算方面高能计算的集群的计算节点倾向于选择高主频类型的处理器,频率基本都在3GHz~4GH;其次在存储方面 基本是基于传统企业级盘阵,存储系统的可靠性放在盘阵自身的容错能力上,很少使用多副本的方案;在网络方面,传统应用多使用基于同步通信的并行算法,因此为了能达到较大的加速比一般使用低延迟的RDMA网络甚至是专门定制的通信网络。

年初云上超级计算集群(SCC)开始公测,提供能运行超算应用的计算存储和网络基础设施,SCC能够给流体仿真之类的有限元分析软件提供近乎线性的加速比。结合E-HPC提供的弹性,客户很快便完成了POC测试。

我们可以看到对于同样几亿单元的有限元分析,使用SCC无论是单节点的计算能力还是多节点加速比都有显著提升,因此客户给反馈了如下的测试感受:

“1.计算性能强劲:无论是单节点的计算能力,还是多节点分布式计算能力都有显著提升,在测试项目计算规模之内,都可以获得非常不错的加速效率”

“2.集群互联IO性能:RDMA高速互联可以满足一定范围内的大规模的机械,流体等仿真应用计算要求,效果显著” ,要性能有性能,要弹性有弹性之后,客户便更有信心将仿真生产系统往云上迁移。

仿真应用迁云

该仿真客户经过多年的仿真服务实践,开发了一款仿真系统,该系统集成了制造仿真行业常用的商业软件,基本覆盖碰撞仿真,流体动力学,机械结构,电磁模拟等。 

该仿真系统提供了统一的Portal给不同的制造企业以一致的体验完成仿真工作流,早期的系统结构基本如下图所示:从中我们可以看出早期的结构基本立足于传统超算,融合了CAE并行计算、计算资源调度、软硬件资源管理、远程图形桌面以及CAE专业应用等技术,由此面向仿真用户提供仿真计算服务。客户需要很重的成本来拥有这些基础设置作为生产资料来服务客户的客户。然而,经过交流,客户的心声是做仿真他们是专业的,但是经营IT基础设施只是为了维持他们的仿真生产系统而进行的活动;他们想专注于仿真服务,而将IT基础设施迁往云上,于是客户便有了仿真系统迁云的想法。

客户想通过将仿真系统迁云,达到以下效果:

1.用户不需要购买任何物理IT硬件资源,通过Web即可开展仿真分析工作。

2.统一管理和调配专业软件软件管理,充分利用昂贵的CAE软件资源。  

3.通过云计算弹性充分利用云上资源进行仿真。

经过逐渐的验证,客户在阿里云上完成了将仿真流程收敛到下面的结构:

从上面的分析,我们可以发现客户能够更加专注于仿真工作流本身,而将对IT基础设施的使用变成了阿里云上一条一条的OpenAPI;需要集群时通过一条OpenAPI New出一个超算集群,算力不够时通过一条Open API New出新的计算机群,作业空闲时通过一条Open API释放计算机群,不想手动操作时通过一条Open API 自动伸缩集群。客户不用再考虑自建机房,备货,扩建,设备运维...... 。

总结 

随着工业仿真技术的不断发展和成熟以及工业产品的自身的复杂程度越来越高,目前现在多数工业仿真对象都是在各种复杂物理环境条件情况下进行的,这种情况决定了完成工业级的仿真工作需要大量的计算和高性能的存储资源,以及配套的可以执行快创建和访问仿真模型和数据,并能够实现较高程度的自动化仿真流程。工业上的仿真技术在产品研发中所扮演的角色在流程上越来越靠前,不再是产品设计完成后的后端验证。与此同时,工业仿真技术在产品生命周期的下游也发挥着越来越重要的作用,比如分析来自工业物联网中机器的实时操作数据。因此,工业仿真所需计算资源、人才培养、环境建设的难度都在增加。但对于企业来讲,搭建一个环境并培养专职的仿真工程师并不容易,仅仅是购买软硬件的需求调研就可能花费数月时间,之后还得投入大量的时间和精力进行专业领域仿真培训和应用部署。 

同其他的企业级IT应用一样,云计算技术正在给仿真应用带来巨大的改变。通过仿真云平台能够对产品进行设计、改进、创新进行模型的快速验证和方案的对比。对于传统制造企业来说,使用云计算技术的价值归根结底是不用购买和管理物理计算集群,从而可以改变传统的仿真应用流程,更加专注于仿真应用本身。基于云计算技术,企业将可以用到更加灵活的软件使用价格,并可以随时随地进行建模解决复杂的仿真应用问题。借助同时模拟多个不同设计方案的能力,基于云计算技术的仿真可以支持传统制造业更轻松地进行产品设计和工程仿真。通过在阿里云上仿真,可以很快获取弹性资源,能够在很短的时间就可以进行完整的仿真生产流程。不管是加快产品创新,还是满足制造业不断增长的仿真需求或是,加强全球合作提高IT投资回报率,都会收到立竿见影的效果。

 

原文链接

分享到:
评论

相关推荐

    智能车竞赛介绍(竞赛目标和赛程安排).zip

    全国大学生智能汽车竞赛自2006年起,由教育部高等教育司委托高等学校自动化类教学指导委员会举办,旨在加强学生实践、创新能力和培养团队精神的一项创意性科技竞赛。该竞赛至今已成功举办多届,吸引了众多高校学生的积极参与,此文件为智能车竞赛介绍

    集字卡v4.3.4微信公众号原版三种UI+关键字卡控制+支持强制关注.zip

    字卡v4.3.4 原版 三种UI+关键字卡控制+支持获取用户信息+支持强制关注 集卡模块从一开始的版本到助力版本再到现在的新规则版本。 集卡模块难度主要在于 如何控制各种不同的字卡组合 被粉丝集齐的数量。 如果不控制那么一定会出现超过数量的粉丝集到指定的字卡组合,造成奖品不够的混乱,如果大奖价值高的话,超过数量的粉丝集到大奖后,就造成商家的活动费用超支了。我们冥思苦想如何才能限制集到指定字卡组合的粉丝数,后我们想到了和支付宝一样的选一张关键字卡来进行规则设置的方式来进行限制,根据奖品所需的关键字卡数,设定规则就可以控制每种奖品所需字卡组合被粉丝集到的数量,规则可以在活动进行中根据需要进行修改,活动规则灵活度高。新版的集卡规则,在此次政府发布号的活动中经受了考验,集到指定字卡组合的粉丝没有超出规则限制。有了这个规则限制后,您无需盯着活动,建好活动后就无人值守让活动进行就行了,您只需要时不时来看下蹭蹭上涨的活动数据即可。 被封? 无需担心,模块内置有防封功能,支持隐藏主域名,显示炮灰域名,保护活动安全进行。 活动准备? 只需要您有一个认证服务号即可,支持订阅号借用认证服务号来做活动。如果您

    出口设备线体程序详解:PLC通讯下的V90控制与开源FB284工艺对象实战指南,出口设备线体程序详解:PLC通讯与V90控制集成,工艺对象与FB284协同工作,开源学习V90控制技能,出口设备1200

    出口设备线体程序详解:PLC通讯下的V90控制与开源FB284工艺对象实战指南,出口设备线体程序详解:PLC通讯与V90控制集成,工艺对象与FB284协同工作,开源学习V90控制技能,出口设备1200线体程序,多个plc走通讯,内部有多个v90,采用工艺对象与fb284 共同控制,功能快全部开源,能快速学会v90的控制 ,出口设备; 1200线体程序; PLC通讯; 多个V90; 工艺对象; FB284; 功能开源; V90控制。,V90工艺控制:开源功能快,快速掌握1200线体程序与PLC通讯

    基于Arduino与DAC8031的心电信号模拟器资料:心电信号与正弦波的双重输出应用方案,Arduino与DAC8031心电信号模拟器:生成心电信号与正弦波输出功能详解,基于arduino +DAC

    基于Arduino与DAC8031的心电信号模拟器资料:心电信号与正弦波的双重输出应用方案,Arduino与DAC8031心电信号模拟器:生成心电信号与正弦波输出功能详解,基于arduino +DAC8031的心电信号模拟器资料,可输出心电信号,和正弦波 ,基于Arduino;DAC8031;心电信号模拟器;输出心电信号;正弦波输出;模拟器资料,基于Arduino与DAC8031的心电信号模拟器:输出心电与正弦波

    (参考项目)MATLAB口罩识别检测.zip

    MATLAB口罩检测的基本流程 图像采集:通过摄像头或其他图像采集设备获取包含面部的图像。 图像预处理:对采集到的图像进行灰度化、去噪、直方图均衡化等预处理操作,以提高图像质量,便于后续的人脸检测和口罩检测。 人脸检测:利用Haar特征、LBP特征等经典方法或深度学习模型(如MTCNN、FaceBoxes等)在预处理后的图像中定位人脸区域。 口罩检测:在检测到的人脸区域内,进一步分析是否佩戴口罩。这可以通过检测口罩的边缘、纹理等特征,或使用已经训练好的口罩检测模型来实现。 结果输出:将检测结果以可视化方式展示,如在图像上标注人脸和口罩区域,或输出文字提示是否佩戴口罩。

    kernel-debug-devel-3.10.0-1160.119.1.el7.x64-86.rpm.tar.gz

    1、文件内容:kernel-debug-devel-3.10.0-1160.119.1.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/kernel-debug-devel-3.10.0-1160.119.1.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、更多资源/技术支持:公众号禅静编程坊

    day02供应链管理系统-补充.zip

    该文档提供了一个关于供应链管理系统开发的详细指南,重点介绍了项目安排、技术实现和框架搭建的相关内容。 文档分为以下几个关键部分: 项目安排:主要步骤包括搭建框架(1天),基础数据模块和权限管理(4天),以及应收应付和销售管理(5天)。 供应链概念:供应链系统的核心流程是通过采购商品放入仓库,并在销售时从仓库提取商品,涉及三个主要订单:采购订单、销售订单和调拨订单。 大数据的应用:介绍了数据挖掘、ETL(数据抽取)和BI(商业智能)在供应链管理中的应用。 技术实现:讲述了DAO(数据访问对象)的重用、服务层的重用、以及前端JS的继承机制、jQuery插件开发等技术细节。 系统框架搭建:包括Maven环境的配置、Web工程的创建、持久化类和映射文件的编写,以及Spring配置文件的实现。 DAO的需求和功能:供应链管理系统的各个模块都涉及分页查询、条件查询、删除、增加、修改操作等需求。 泛型的应用:通过示例说明了在Java语言中如何使用泛型来实现模块化和可扩展性。 文档非常技术导向,适合开发人员参考,用于构建供应链管理系统的架构和功能模块。

    基于四旋翼无人机的PD控制研究 附Matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    C#与VB实现欧姆龙PLC的Fins TCP通信案例源码:调用动态链接库进行数据读写,定时器与计数器数据区的简洁读写操作示例,C#与VB实现欧姆龙PLC的Fins TCP通信案例源码:调用动态链接库进

    C#与VB实现欧姆龙PLC的Fins TCP通信案例源码:调用动态链接库进行数据读写,定时器与计数器数据区的简洁读写操作示例,C#与VB实现欧姆龙PLC的Fins TCP通信案例源码:调用动态链接库进行读写操作,涵盖定时器计数器数据区学习案例,C#欧姆龙plc Fins Tcp通信案例上位机源码,有c#和VB的Demo,c#上位机和欧姆龙plc通讯案例源码,调用动态链接库,可以实现上位机的数据连接,可以简单实现D区W区定时器计数器等数据区的读写,是一个非常好的学习案例 ,C#; 欧姆龙PLC; Fins Tcp通信; 上位机源码; 动态链接库; 数据连接; D区W区读写; 定时器计数器; 学习案例,C#实现欧姆龙PLC Fins Tcp通信上位机源码,读写数据区高效学习案例

    可调谐石墨烯超材料吸收体的FDTD仿真模拟研究报告:吸收光谱的化学势调节策略与仿真源文件解析,可调谐石墨烯超材料吸收体:化学势调节光谱的FDTD仿真模拟研究,可调谐石墨烯超材料吸收体FDTD仿真模拟

    可调谐石墨烯超材料吸收体的FDTD仿真模拟研究报告:吸收光谱的化学势调节策略与仿真源文件解析,可调谐石墨烯超材料吸收体:化学势调节光谱的FDTD仿真模拟研究,可调谐石墨烯超材料吸收体FDTD仿真模拟 【案例内容】该案例提供了一种可调谐石墨烯超材料吸收体,其吸收光谱可以通过改变施加于石墨烯的化学势来进行调节。 【案例文件】仿真源文件 ,可调谐石墨烯超材料吸收体; FDTD仿真模拟; 化学势调节; 仿真源文件,石墨烯超材料吸收体:FDTD仿真调节吸收光谱案例解析

    RBF神经网络控制仿真-第二版

    RBF神经网络控制仿真-第二版

    松下PLC与威纶通触摸屏转盘设备控制:FPWINPRO7与EBPRO智能编程与宏指令应用,松下PLC与威纶通触摸屏转盘设备控制解决方案:FPWINPRO7与EBPRO协同工作,实现多工位转盘加工与IE

    松下PLC与威纶通触摸屏转盘设备控制:FPWINPRO7与EBPRO智能编程与宏指令应用,松下PLC与威纶通触摸屏转盘设备控制解决方案:FPWINPRO7与EBPRO协同工作,实现多工位转盘加工与IEC编程模式控制,松下PLC+威纶通触摸屏的转盘设备 松下PLC工程使用程序版本为FPWINPRO7 7.6.0.0版本 威纶通HMI工程使用程序版本为EBPRO 6.07.02.410S 1.多工位转盘加工控制。 2.国际标准IEC编程模式。 3.触摸屏宏指令应用控制。 ,松下PLC; 威纶通触摸屏; 转盘设备控制; 多工位加工控制; IEC编程模式; 触摸屏宏指令应用,松下PLC与威纶通HMI联控的转盘设备控制程序解析

    基于循环神经网络(RNN)的多输入单输出预测模型(适用于时间序列预测与回归分析,需Matlab 2021及以上版本),基于循环神经网络(RNN)的多输入单输出预测模型(matlab版本2021+),真

    基于循环神经网络(RNN)的多输入单输出预测模型(适用于时间序列预测与回归分析,需Matlab 2021及以上版本),基于循环神经网络(RNN)的多输入单输出预测模型(matlab版本2021+),真实值与预测值对比,多种评价指标与线性拟合展示。,RNN预测模型做多输入单输出预测模型,直接替数据就可以用。 程序语言是matlab,需求最低版本为2021及以上。 程序可以出真实值和预测值对比图,线性拟合图,可打印多种评价指标。 PS:以下效果图为测试数据的效果图,主要目的是为了显示程序运行可以出的结果图,具体预测效果以个人的具体数据为准。 2.由于每个人的数据都是独一无二的,因此无法做到可以任何人的数据直接替就可以得到自己满意的效果。 这段程序主要是一个基于循环神经网络(RNN)的预测模型。它的应用领域可以是时间序列预测、回归分析等。下面我将对程序的运行过程进行详细解释和分析。 首先,程序开始时清空环境变量、关闭图窗、清空变量和命令行。然后,通过xlsread函数导入数据,其中'数据的输入'和'数据的输出'是两个Excel文件的文件名。 接下来,程序对数据进行归一化处理。首先使用ma

    【图像识别】手写文字识别研究 附Matlab代码+运行结果.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    旅游管理系统(基于springboot,mysql,java).zip

    旅游管理系统中的功能模块主要是实现管理员;首页、个人中心、用户管理、旅游方案管理、旅游购买管理、系统管理,用户;首页、个人中心、旅游方案管理、旅游购买管理、我的收藏管理。前台首页;首页、旅游方案、旅游资讯、个人中心、后台管理等功能。经过认真细致的研究,精心准备和规划,最后测试成功,系统可以正常使用。分析功能调整与旅游管理系统实现的实际需求相结合,讨论了Java开发旅游管理系统的使用。 从上面的描述中可以基本可以实现软件的功能: 1、开发实现旅游管理系统的整个系统程序;  2、管理员;首页、个人中心、用户管理、旅游方案管理、旅游购买管理、系统管理等。 3、用户:首页、个人中心、旅游方案管理、旅游购买管理、我的收藏管理。 4、前台首页:首页、旅游方案、旅游资讯、个人中心、后台管理等相应操作; 5、基础数据管理:实现系统基本信息的添加、修改及删除等操作,并且根据需求进行交流查看及回复相应操作。

    Boost二级升压光伏并网结构的Simulink建模与MPPT最大功率点追踪:基于功率反馈的扰动观察法调整电压方向研究,Boost二级升压光伏并网结构的Simulink建模与MPPT最大功率点追踪:基

    Boost二级升压光伏并网结构的Simulink建模与MPPT最大功率点追踪:基于功率反馈的扰动观察法调整电压方向研究,Boost二级升压光伏并网结构的Simulink建模与MPPT最大功率点追踪:基于功率反馈的扰动观察法调整电压方向研究,Boost二级升压光伏并网结构,Simulink建模,MPPT最大功率点追踪,扰动观察法采用功率反馈方式,若ΔP>0,说明电压调整的方向正确,可以继续按原方向进行“干扰”;若ΔP<0,说明电压调整的方向错误,需要对“干扰”的方向进行改变。 ,Boost升压;光伏并网结构;Simulink建模;MPPT最大功率点追踪;扰动观察法;功率反馈;电压调整方向。,光伏并网结构中Boost升压MPPT控制策略的Simulink建模与功率反馈扰动观察法

    基于matlab平台的图像去雾设计.zip

    运行GUI版本,可二开

    Deepseek相关参考资源文档

    Deepseek相关主题资源及行业影响

    WP Smush Pro3.16.12 一款专为 WordPress 网站设计的图像优化插件开心版.zip

    WP Smush Pro 是一款专为 WordPress 网站设计的图像优化插件。 一、主要作用 图像压缩 它能够在不影响图像质量的前提下,大幅度减小图像文件的大小。例如,对于一些高分辨率的产品图片或者风景照片,它可以通过先进的压缩算法,去除图像中多余的数据。通常 JPEG 格式的图像经过压缩后,文件大小可以减少 40% – 70% 左右。这对于网站性能优化非常关键,因为较小的图像文件可以加快网站的加载速度。 该插件支持多种图像格式的压缩,包括 JPEG、PNG 和 GIF。对于 PNG 图像,它可以在保留透明度等关键特性的同时,有效地减小文件尺寸。对于 GIF 图像,也能在一定程度上优化文件大小,减少动画 GIF 的加载时间。 懒加载 WP Smush Pro 实现了图像懒加载功能。懒加载是一种延迟加载图像的技术,当用户滚动页面到包含图像的位置时,图像才会加载。这样可以避免一次性加载大量图像,尤其是在页面内容较多且包含许多图像的情况下。例如,在一个新闻网站的长文章页面,带有大量配图,懒加载可以让用户在浏览文章开头部分时,不需要等待所有图片加载,从而提高页面的初始加载速度,同时也能

    1. Download this file: https://cdn-media.huggingface.co/frpc-gradio-0.3/frpc-windows-amd64.exe

    Could not create share link. Missing file: C:\Users\xx\.conda\envs\omni\Lib\site-packages\gradio\frpc_windows_amd64_v0.3 1. Download this file: https://cdn-media.huggingface.co/frpc-gradio-0.3/frpc_windows_amd64.exe 2. Rename the downloaded file to: frpc_windows_amd64_v0.3 3. Move the file to this location: C:\Users\xx\.conda\envs\omni\Lib\site-packages\gradio

Global site tag (gtag.js) - Google Analytics