并行超算云
并行智算云
首页
产品服务
超算云
智算云
超算行业云
设计仿真云
运维服务
软件产品
解决方案
气象海洋超算云
人工智能超算云
生命科学行业云
企业级混合云
院校级混合云
服务中心
常见问题
软件下载
新闻资讯
并行教育
会议竞赛
并行学园
并行直播课
并行基金
关于并行
企业简介
市场活动
联系我们
加入我们
新闻资讯

CCDM2024丨并行科技陈健分享算力产品选型与性能优化的实践经验

发布时间:2024-08-14 13:21 作者:

7月28日至30日,由济南大学和山东农业大学联合承办的第十届中国数据挖掘会议(CCDM2024)在山东泰安成功举办。CCDM是由中国计算机学会和中国人工智能学会主办的数据挖掘盛会。此次会议汇聚数据挖掘理论与应用研究领域的近千余名专家学者,旨在共商行业最新研究成果、创新思想与科技方法,探索未来发展图景。



应用运行特征分析:“秒速”确定最高性能、最高性价比的大模型训练资源


并行科技作为首家专注于算力服务的上市公司应邀出席本次活动。CCF杰出会员、副理事长并行科技董事长陈健博士活动中发表题为《基于大模型“应用运行特征”的算力产品选型分析和性能优化》的主题演讲。

随着人工智能技术的飞速发展,大模型在智能革命中扮演着越来越重要的角色。而大模型训练是超算应用,其性能和加速比是其中的关键因素。对此,陈健博士在本次报告中重点与现场行业嘉宾深入探讨了大模型的运行特征、算力产品选型逻辑以及性能优化的策略与方法,为行业发展提供宝贵的经验参考。

基于用户的应用需求与行业案例,陈健博士介绍了Paramon/Paratune应用运行特征采集分析软件,这是并行科技打造优质算力服务的重要手段。该软件面向高性能计算、大数据和人工智能领域,可以像“CT”扫描一般对大规模并行应用程序进行“秒级监控”,从而实时分析大规模并行应用程序的性能指标,据此诊断故障、定位性能瓶颈。通过这一软件,用户可以快速确定适合自身需要的算力选型,找到最高性能和最高性价比的算力资源,实现高质量、高性能、高性价比的大模型训练。

当天活动现场,陈健博士为嘉宾具体展示了如何根据大模型的运行特征进行算力产品的具体选型。例如,Llama3-70B训练模型分析显示其为计算密集型,应选择计算能力高的显卡;而Llama3 70B Instruct推理模型则为访存密集型,显存带宽高的显卡更为合适。并展示了一项1300亿参数模型的应用在通过运行特征分析后,其GPU利用率由75%提升至95%,使NVLink和IB通信都得到了更加充分的利用,从而让大模型训练整体效率提升了超40%。


并行科技“算海计划”:以算力大布局,成就行业新奇迹

在本次主题报告中,陈健博士还向现场嘉宾介绍了并行科技的“算海计划”,该计划旨在与算力建设合作伙伴共同建设面向模型训练的超大规模单体集群。并行科技合作内蒙古新型算力基地,规划建设4000个22kW高功率智算机柜,最大可以支持单一集群6万卡。这一规划将加速推动算力资源高效、快捷、按需分配与合理化使用,减少政府、企业重复建设的资源浪费,形成灵活的商业合作模式,让算力资源真正赋能千行百业实际需求。

作为国家“东数西算”发展战略八大枢纽节点之一,内蒙古的自然气候条件优势有利于解决数据中心的散热问题。同时,作为能源大省,当地充沛的风能与太阳能资源更为算力中心的建设、运营打下了扎实的能源基础。而性价比拔群的蒙西电网,其电费单价低至0.32元,是并行科技合作内蒙古算力基地实现算力商业化的有利支撑。


CCDM2024的成功举办不仅为算力领域的从业者提供了开放的交流平台,更为算力服务的未来发展探索了更多可能。并行科技也将秉持自身17年的发展经验,依托算力网络服务模式,在算力服务领域继续深耕开拓,广结行业合作伙伴,共同为科技强国的繁荣愿景贡献力量。


欢迎免费体验Paratera并行产品免费试用

助力科技强国 让计算更简单

海量计算资源 减少排队 按需付费 7x24小时服务

——    填写试用申请,并注册平台账户,专属客户经理将为您申请2000核时或200元卡时免费试算资源   ——

*为必填项