DeepSeek新模型火到海外 开源大模型正超越闭源

DeepSeek上周发布了开源模型DeepSeek-R1,并声称其性能可以与OpenAI的o1正式版相媲美,这一消息在海外AI业界引发了广泛讨论。焦点在于,当开源模型的能力达到甚至超越最新的闭源模型时,可能会改变整个大模型的竞争格局。

DeepSeek新模型火到海外 开源大模型正超越闭源

根据DeepSeek的介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中的得分接近或超过o1正式版。该模型在后训练阶段大规模应用了强化学习技术,在仅有少量标注数据的情况下显著提升了推理能力。

Meta首席AI科学家Yann Lecun认为,DeepSeek-R1的发布意味着开源大模型正在超越闭源模型,而不是单纯地表明中国公司在AI领域超越美国公司。他表示,DeepSeek将从开放研究和开源中受益,类似于Meta的PyTorch和Llama。通过提出新想法并在他人工作的基础上进行实现,由于这些工作是公开和开源的,每个人都能从中获益,这就是开放研究和开源的力量。

责任编辑:张佳鑫 0764

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7279.html

(0)
广众网的头像广众网
上一篇 2025年1月27日 下午6:45
下一篇 2025年1月27日 下午6:45

相关推荐

  • DeepSeek训练仍基于英伟达CUDA生态 国产AI芯片迎适配潮

    在DeepSeek极低成本的推动下,开源模型和闭源模型之间的差距显著缩小,掀起了一轮国产AI芯片厂商竞相适配的风潮。自2月1日以来,多家国产头部AI芯片厂商宣布与DeepSeek旗下不同模型展开适配工作,据统计,目前至少有20家国内厂商参与其中。 AI芯片市场主要包括CPU、GPU、ASIC、FPGA等不同类型芯片。随着AI对大规模并行计算的需求增加,GPU…

    2025年2月15日
    3200
  • 雷达锁定目标,战斗从白天打到深夜……厉兵秣马潜心砺剑

    演练场上风雷动,练兵备战气如虹。近日,东部战区空军某部着眼实战演训任务需求,融入复杂敌情背景,开展跨昼夜、全要素、拓展性综合演练,全面锤炼部队战斗力。 “西北方向发现不明空情……”随着一声刺耳的警报声响起,全体官兵闻令而动,迅速奔赴战斗岗位,架设天线、吊装导弹、竖起雷达,一场复杂电磁环境下的抗击战斗演练正式拉开帷幕。 “前方发现染毒地带,我方有人员受伤!”“…

    2025年2月18日
    2700
  • 27省会国土空间总规出炉 明确城市定位与发展蓝图

    2月13日,国务院批复了《武汉市国土空间总体规划(2021—2035年)》,至此全国27个省会(首府)城市的国土空间总体规划已获批复。未来十年,这些城市的规模和定位已经明确,我国区域协调发展蓝图基本明晰。 党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》提出,完善国家战略规划体系和政策统筹协调机制,强化国家发展规划战略导…

    2025年2月18日
    3000
  • 官方预警!2025年猪价或下行10%-20%

    2025年猪价或下行10%-20% 农业农村部生猪产业监测预警首席专家王祖力表示,“2025年2-5月份肥猪上市同比可能会增加2.5%左右。也就意味着过完春节之后的二三月份,可能猪价会下跌。”结合能繁母猪、新生仔猪、产能利用率同步上涨,农业农村部畜牧兽医局官方预计今年肥猪上市量将增加4%左右,全年猪价极可能下行10%—20%。 责任编辑:乔娇 TT0002

    2025年1月22日
    3900
  • 抖音副总裁:不建议开车直播会被封 车内直播规则明确

    近日,雷军和余承东在开车直播时被抖音封禁,引起了广泛关注。对此,抖音集团副总裁李亮在微博上进行了回应,介绍了抖音对车内直播的具体要求。他表示,抖音不建议在开车期间进行直播。如果确实需要直播,应由副驾或后座乘客拍摄,确保不影响驾驶。驾驶员需专心驾驶,不得与直播间互动或查看手机。他还提到,尽管智能驾驶技术正在快速发展,但目前法规仍禁止驾驶时双手离开方向盘。随着技…

    2025年1月28日
    5000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信