有望改写AI未来！NVIDIA全新nGPT使训练速度暴增20倍

广众网 • 2024年10月20日下午7:04 • 科技 • 25 views

10月20日消息，据媒体报道，NVIDIA的最新研究可能彻底改变AI的未来，其研究团队提出了一种名为归一化Transformer（nGPT）的新型神经网络架构。

这一架构在超球面（hypersphere）上进行表示学习，能够显著提升大型语言模型（LLM）的训练速度，最高可达20倍，同时保持了模型的精度。

nGPT架构的核心在于将所有向量，包括嵌入、多层感知机（MLP）、注意力矩阵和隐藏状态，归一化为单位范数。

这种归一化处理使得输入的token在超球面表面上移动，每一层模型都通过位移来贡献最终的输出预测。

实验结果表明，nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍，具体加速效果取决于序列长度。

例如，在1k上下文中，训练速度提高了4倍；在4k上下文中，提高了10倍；而在8k上下文中，更是提高了20倍。

研究人员指出，nGPT的优化路径从超球面上的点开始，通过位移来贡献最终的输出预测，其中位移量由MLP和注意力模块定义。

这种方法不仅提高了训练速度，还增强了模型的稳定性。

以上就是关于【有望改写AI未来！NVIDIA全新nGPT使训练速度暴增20倍】的相关消息了，希望对大家有所帮助！

Like (0)

0 0

每日热讯|一个关键词看总书记闽皖行冲上了热搜，透露了哪些信息？

Previous 2024年10月20日下午7:04

全国首批，四家上市公司股票回购增持专项贷款落地深圳

Next 2024年10月20日下午7:05

科技

荣耀YOYO助理爆料华为Mate 70发布会时间：11月18/20日

11月5日消息，在前不久的荣耀发布会上，YOYO升级为智能体，AI体验成为行业天花板，是目前最聪明的手机助手。在日前华为Mate 70官宣本月发布后，有博主询问YOYO该机何时发布，它直接给出预测：华为Mate 70系列预计将在11月中下旬正式发布，可能的日期为18日或20日。这也确实符合此前爆料的日期，最终很可能在20日前后。据悉，Mate 70系列…

广众网
2024年11月5日
10000
科技

中石化直属品牌！鸥露竹浆抽纸28包秒杀价29.99元

鸥露竹浆抽纸270张28包原价59.99元，今日秒杀，到手价是29.99元，折合1包约1.07元。购买链接：天猫(券后29.99元) 世界500强中石化直属品牌，出口欧盟，优等品认证。竹琨抑菌，慈竹原浆，安全无添加，亲肤无尘屑，湿水不易破，可接触食品。精选北纬28度、海拔800米以上、2-3年生高山峡谷慈竹为原料，采用FEPP食品级环保制浆造纸技术，无…

广众网
2024年10月1日
21000
科技

谷歌Pixel 9 Pro Fold摄像头规格曝光：4800万像素配F1.7光圈

8月6日消息，谷歌Pixel 9 Pro Fold折叠屏手机的摄像头规格已经通过Camera FV-5 认证数据库的认证，将配备4800万像素摄像头。根据认证的信息显示，Pixel 9 Pro Fold将配备一颗1200万像素的后置主摄像头，支持像素合并技术，可输出相当于4800万像素的图像，与Pixel Fold的相机规格保持一致。据悉，这枚主摄像头具…

广众网
2024年8月6日
50000
科技

恒源祥7A纯棉抗菌男士内裤3条装：19.9元大促

天猫【恒源祥内裤旗舰店】恒源祥 7A 纯棉抗菌男士内裤3条装日常售价为29.9 元，今日下单领取 10 元优惠券，到手价为 19.9 元。抑制三大细菌，持久健康卫生，7A级抑菌，U型双层内裆，轻软不勒，服贴无感。舒适棉印花，高支面料，舒适透气，质感高级舒适柔软，拒绝闷热，干爽透气，吸湿排汗，反复拉扯回弹力好，耐穿不变形，活性印染清洗不掉色。臀部一片式裁…

广众网
2024年8月18日
63000
科技

2699元闪迪至尊超极速SDXC UHS-I存储卡2TB上架：最高读取250 MB/s

10月15日消息，闪迪至尊超极速SDXC UHS-I存储卡2TB版本上架，首发2699元。据官方介绍，这款SanDisk至尊超极速SDXC UHS-I存储卡以其卓越的性能，为用户提供前所未有的存储体验。该存储卡具备U3和V30视频速度等级，最高连续读取速度可达惊人的250 MB/s，而最高顺序写入速度也达到了150 MB/s，确保在连拍模式下也能精准捕捉…

广众网
2024年10月15日
10000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信