关注我们
QRcode 邮件联系 新浪微博
首页 > 科技 » 正文

大模型训练可“自动驾驶” 蚂蚁集团全面开源相关技术

 小尚

近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。

(图:蚂蚁集团的自动化分布式深度学习系统DLRover现已全面开源)

该技术框架名为DLRover,目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中,运行环境复杂多变,不管多么“崎岖的地形”,DLRover都可以“轻松行驶”。

2023 年大模型技术的发展,带来了工程实践的爆发,如何管理数据,提高训练和推理效率,最大化利用现有算力,成了关键一环。

本文标签:
《湮灭线 》机械霸权下的终末之旅!耕升 GeForce RTX 4070 SUPER 踏雪Mini助力开启肉鸽宇宙
河北一女子充话费 1000元误充给对方要不回:中国电信、律师回应