Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • 机器人帮游客轻松登泰山 新春科技添乐趣

    新春期间,泰山景区迎来了一位特殊的“助手”——登山助力机器人,为游客们的登山之旅带来了前所未有的便捷与乐趣。这一创新举措展示了科技与旅游的完美融合,为广大游客提供了更加舒适、轻松的登山体验。 1月30日,泰山文旅集团与深圳市肯綮科技有限公司共同开发的登山助力机器人首次在泰山景区内试运营。这款机器人是一款专为帮助游客攀登泰山设计的外骨骼机器人,外观酷炫,引得周…

    2025年1月31日
    12500
  • 阿门·汤普森拿下21分7篮板4助 火箭惜败灰熊止四连胜

    北京时间1月31日上午十点半,西部第三灰熊客场对阵西部第二火箭。两队此前三次交手火箭全胜,加之双方在西部排名上竞争激烈,这次对决备受关注。火箭最近状态极佳,双杀了联盟第一骑士,绝杀卫冕冠军凯尔特人,还击败了老鹰。杰伦格林在对阵灰熊时表现尤为出色,场均可以贡献30.3分、2.3次抢断和4.3个三分球,三分命中率高达59.1%。因此,灰熊能否限制住杰伦格林成为比…

    2025年1月31日
    4200
  • 切尔诺贝利核电站目前辐射水平正常 爆炸声后情况稳定

    国际原子能机构报告称,2月14日凌晨,其驻切尔诺贝利核电站的团队听到爆炸声,并发现“新安全封隔”设施内出现火情。这个设施主要用于保护切尔诺贝利核电站的4号反应堆。初步调查显示,事故原因是有一架无人机撞击了该设施的顶部。尽管发生了这样的事件,目前核电站内外的辐射水平仍然保持正常和稳定状态。 责任编辑:张佳鑫 0764

    2025年2月16日
    2900
  • 节前红包行情来了吗 利好消息助力市场

    节前红包行情来了吗。在众多积极因素的推动下,A股市场持续放量上涨,上涨趋势得到进一步巩固,节前有望迎来一波红包行情。特朗普1月20日就职的不确定性即将结束,加之他计划在其“百日新政”期间访华,对华关税政策的不确定性有所降低。此外,近期美元指数出现回落迹象,离岸人民币汇率有望结束贬值,开启新一轮升值趋势,这些都对中国资产构成利好,港股的表现尤为突出。 截至上午…

    2025年1月20日
    3700
  • 干饭哥或将入学北京体育大学 最终录取名单以国家体育总局公示为准

    2月4日,北京体育大学公布2025年招收保送录取优秀运动员综合考核名单,巴黎奥运会“双金王”、苏州小将盛李豪在列。校方表示,后续还将由各单位进行资格审核,最终录取名单以国家体育总局公示为准。 责任编辑:乔娇 TT0002

    2025年2月6日
    3900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信