连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。

夸娥1.2主要升级点:

▼MFU提升10% 最高可达55%

在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。

稠密模型集群训练中,MFU最高达到55%。

▼Flash Attention2优化

通过集成最新的MUSA SDK平台与优化后的Flash Attention2技术,结合新版Torch MUSA和算子融合,显著提升了大模型训练的效率与资源利用率,大幅缩短训练周期,并降低了整体成本。

▼64K长文本支持

增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。

▼支持混合专家模型MoE

MCCL通信库完成了All2All优化,并针对muDNN算子在不同形状下的矩阵运算进行了优化,以更好地支持MoE(Mixture of Experts)大模型的训练。

这不仅提升了智算效率,还为更大规模参数的大模型训练提供了高度可扩展的基础。

▼断点续训

进一步提升了大模型训练的Checkpoint(检查点)读写性能,写入时间小于2秒,显著提高训练效率。

▼优化DeepSpeed

支持DeepSpeed、Ulysses的适配和性能优化,强化了长文本训练支持。

适配国内外多款大模型,在Hugging Face上支持训练和微调主要的开源大模型,创新型企业可以灵活选择不同的大模型开发智能应用。

▼稳定性提升

千卡集群软硬件进一步成熟,实现了连续无故障训练长达15天。

新版本引入了KUAE Aegis可靠性功能,加强了对GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。

▼可视化/可观测

引入了PerfSight性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据,有助于快速发现并恢复训练期间的故障,满足大模型上的性能调优需求。

▼内置模型库中新增大模型

KUAE内置模型库Model Zoo新增LLaMA2全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

以上就是关于【连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2】的相关消息了,希望对大家有所帮助!

Like (0)
广众网的头像广众网
Previous 2024年8月20日 下午9:06
Next 2024年8月20日 下午9:20

相关推荐

  • 毕竟丰田!产量七连跌、刹车问题全球召回:依然躺赢千亿利润

    祸不单行。 广汽丰田、一汽丰田,要召回132124辆车,理由是刹车出了问题,停车需要的距离延长了。 同样的事情、同样的理由也在美国上演,丰田计划召回在美超过42000辆汽车。 这对于丰田来说无异于雪上加霜,因为这家全球第一车厂,销量正在连续下滑:8月份全球卖出82万辆车,同比下降3.1%,到8月为止卖出616.3辆,同比下降了5.2%。 而且在日本的本土,销…

    2024年10月20日
    2200
  • 刚反超问界 零跑又立军令状:三年成为TOP5

    价格战打了半年,是时候接受市场检验了,零跑最先发布2024半年报。 上半年营收88.5亿元,同比增长52.2%,交付为86696辆,同比增长94.8%。 单看这两组数据,确实甩开其他新造车不少,无论是涨幅还是交付量,都是妥妥的第一梯队。更有意思的是,在上周销量榜单中,零跑还超越了问界,仅次于理想,成了名副其实的小理想。 账面数据虽然不错,但从整体来看,仍能看…

    2024年8月17日
    7200
  • 热搜第一!国庆假期还有2天:网友们开始听《反方向的钟》了

    10月6日消息,离国庆假期结束还有2天,《反方向的钟》再度成热门歌曲,相关话题甚至冲上了微博热搜榜第一名。 有网友评论:听一万遍能让我回到国庆第一天吗? 公开信息显示,《反方向的钟》是周杰伦演唱的歌曲,由方文山作词,周杰伦作曲、编曲,收录在周杰伦2000年11月7日发行的专辑《Jay》中,歌词中的反方向的钟象征着时间的逆流,希望能够回到过去。 这首歌被网友应…

    2024年10月6日
    2800
  • 智界R7正式开启全国交付:余承东与尹同跃共同交车

    10月15日消息,鸿蒙智行宣布其智界R7已启动全国规模交付。 在首批车主交付仪式上,华为常务董事余承东和奇瑞汽车董事长尹同跃亲自出席,为车主交付新车钥匙。 智界R7自上市以来市场反响热烈,仅14天内累计大定订单就突破了2万台,而在十一黄金周期间,大定订单更是超过了9600台。 智界R7定位为鸿蒙智行的首款轿跑SUV,车身尺寸为4956×1981&…

    2024年10月15日
    1500
  • 曝RTX 5080综合效能不及RTX 4090!特供5080D要无

    10月13日消息,据媒体报道,NVIDIA即将在CES 2025上发布的新一代RTX 50系列GPU中,RTX 5080的综合效能可能无法与现有的RTX 4090相抗衡。 因此,原本计划为中国大陆市场推出的特供版RTX 5080 D可能会被取消,但性能更强的RTX 5090 D版本则确定存在,并预计在明年1月底上市。 据悉,RTX 5090将搭载GB202-…

    2024年10月13日
    1000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信