AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为AMD-135M。

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135小模型隶属于Llama家族,有两个版本:

一是基础型AMD-Llama-135M,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型AMD-Llama-135M-code,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
创建与部署流程

它使用了一种名为推测解码(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。

比如在MI250加速器上,性能可提升最多约2.8倍,锐龙AI CPU上可提升最多约3.88倍,锐龙AI NPU上可提升最多约2.98倍。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
推测解码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

以上就是关于【AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍】的相关消息了,希望对大家有所帮助!

Like (0)
广众网的头像广众网
Previous 2024年10月1日 下午6:22
Next 2024年10月1日 下午6:40

相关推荐

  • 米家口袋照片打印机1S发布3个月疯狂缺货!小米:正加紧备货

    10月18日消息,今年7月,米家口袋照片打印机1S发布,售价399元。 该产品上市便成为小米米家最火产品之一,即使经过多轮发售,至今依然供不应求,想原价购买只有靠手速抢购,否则只能加价在第三方平台或个人卖家买到。 今日,小米集团副总裁、中国区总裁王晓雁发布视频,与小米生态链总经理陈波进行对话。 视频中,王晓雁首先向陈波询问了网友最关心的口袋照片打印机何时有货…

    2024年10月19日
    1500
  • 首款支持澎湃智联!小米全屋路由BE3600 Pro套装图赏

    10月30日消息,小米全屋路由BE3600 Pro昨晚正式发布,单只售价349元,套装到手699元。 现在套装版已经来到我们评测室,想下面为大家带来图赏。 小米全屋路由BE3600 Pro,搭载全新四核Wi-Fi 7处理器,性能提升120%,配备2.5G网口,轻松驾驭2500兆宽带。 融合MILO双频聚合与4K QAM高速传播技术,结合OFDMA与Multi…

    2024年10月30日
    1200
  • 官方喊话鼓励公司采取弹性上下班、居家办公等方式:网友点赞

    10月28日消息,据国内媒体报道称,国务院办公厅日前印发通知显示,鼓励单位采取弹性上下班、居家办公等方式,营造家庭友好型工作环境。 官方在通知中提出完善生育支持政策体系和激励机制,健全覆盖全人群、全生命周期的人口服务体系,有效降低生育、养育、教育成本。 《措施》指出,强化职工权益保障。完善促进妇女就业政策,加强对女性劳动者特别是生育再就业女性的职业技能培训。…

    2024年10月29日
    1700
  • 小车高速出口竟然停车 大货车紧急避让 货撒多条车道

    9月3日消息,出口早准备,实线禁变道。错过出口时,请勿在匝道出口处犹豫不决,实线变道、停车等危险行为极易引发交通事故。 浙江交警公布了一起生动的案例:近日,杭州高速交警在G56杭瑞高速一处匝道出口附近发现一辆小车实线变道后,后方一辆正常行驶的大货车紧急刹车,直接冲到了匝道上。 惯性造成货物倾斜抛洒,散落一地的货物占据了匝道出口及主线第二车道。 由于该路段处于…

    2024年9月4日
    2500
  • 自主品牌高端奇迹!问界M9上市10个月累计大定突破16万台

    10月26日消息,鸿蒙智行官宣,问界M9上市10个月大定超16万台。月均大定超1.6万台,这无疑创造了中国汽车品牌高端车型的历史记录! 本月10日,鸿蒙智行官宣问界M9大定超15万台,也就是说短短半个月时间,再产生了1万的大定,这样的速度确实让很多友商羡慕不已,何况M9还是均价50多万的豪华SUV。 当前在售的M9分为六座和五座两种版本,分为增程和纯电,全系…

    2024年10月26日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信