Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • 美国宣布对钢铝产品加征关税 巴西总统:将对等回应

    针对美国总统特朗普宣布将对所有输美钢铝产品加征25%关税一事,当地时间2月14日,巴西总统卢拉在接受媒体采访时表示,若美国对巴西提高钢铝产品关税,巴西将向世贸组织提出申诉,或对美国商品对等征收关税。 卢拉强调,目前巴美贸易平衡,希望双边关系和谐、建设性地发展。他表示巴西并不寻求贸易冲突,但若美国对巴西采取措施,巴西将会对等回应。 当地时间2月10日,美国总统…

    2025年2月15日
    5500
  • 四川两部门亲自下场护版权 织密电影版权防护网

    2月15日,四川省版权局与四川省文化和旅游厅联合发布了关于电影《哪吒之魔童闹海》版权保护的公告。公告呼吁公众增强版权法律保护意识,自觉抵制盗版行为,维护权利人的合法权益,持续激发电影创作热情,促进电影产业繁荣发展。此外,公告还建议观众选择正规渠道和影院观影,不以任何形式盗录或传播分享盗版音频视频,并提醒未经权利人授权不得制作电影相关周边产品。同时,鼓励公众发…

    2025年2月17日
    5700
  • 春晚四大分会场气象服务全力“护航” 精准预报保障演出

    2025年乙巳蛇年的新年钟声即将敲响,这将是“申遗”成功后全球华人一起度过的首个春节。随着春节临近,春晚彩排也在紧锣密鼓进行。今年春晚在重庆、湖北武汉、西藏拉萨和江苏无锡四地设置分会场,从魔幻城市到九省通衢,从青藏高原到江南水乡,将尽展山河锦绣的美好年景。 考虑到春晚分会场有不少演出是在户外进行,气象因素对其影响较大,为保障春晚精彩演出,各地气象工作者做了大…

    2025年1月28日
    5700
  • 送政策上门!北京劳动保障监察部门走进161个工地宣讲保障工资支付政策 助力农民工权益保护

    2月16日,北京市人力资源和社会保障局组织了300余名劳动保障监察执法人员走进161个项目工地,宣讲保障工资支付相关政策,发放宣传手册近1万份,覆盖了超过10万名农民工。春节假期结束后,北京市工程建设领域迎来复工复产高峰。为推动项目高效有序复工复产,切实保障农民工合法劳动报酬权益,助力一季度经济良好开局,全市各级人社部门深入复工项目工地,深度宣讲《保障农民工…

    2025年2月17日
    4700
  • 官方通报货车在马路上倾倒建筑垃圾 违法事件调查中

    重庆市大渡口区城市管理局于1月20日发布通报,称有网民在抖音平台发布视频反映“大渡口区中航昕璟辰附近一货车在马路上倾倒建筑垃圾”。当天上午8时左右,城市管理综合行政执法支队跳磴大队前往现场核实情况。经调查发现,1月19日晚间,在二纵线中航昕璟辰西北160米附近发生了一起违法倾倒装修垃圾事件,估计垃圾量约为100余方。该路段由重庆城投基础设施建设有限公司负责修…

    2025年1月21日
    5300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信