最壕的DeepSeek玩家:10多万元买8台Mac、显存达496GB

DeepSeek-R1,正在接受全球网友真金白银的检验。

花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

总计496G显存(64*7+48),才能跑起个4bit量化版,但属实算得上“家用AGI”配置了。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

另一个极端是选择R1数据蒸馏版Qwen 1.5B小模型,小到浏览器就能跑,每秒能输出60个tokens。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

与此同时,各种榜单也在抓紧测试,纷纷跑出了结果。

R1正横扫各大榜单。

首先是LiveBench,与LiveCodeBench一样,题目是随时间更新的,所以相对受认可。

R1的表现在o1-preview到o1之间,其中只有数据一项超过o1。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

不过再带上成本成本约1/30这个条件看,又是不一样的感觉,给老哥整无语了。

唯一的抱怨是上下文窗口太短。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

o1系列一战成名的ARC-AGI,测试结果分为公开数据和私有数据两部分。

DeepSeek R1在私有数据上解决了15.8%的问题,与DeepSeek-V3相比翻倍还多。

公开数据上更是解决了20.5%的问题,与DeepSeek-V3相比上涨约46%。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

总的来看,DeepSeek-R1表现与o1-preview相近,但稍低。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

但同样,带上几毛钱就能解决一道题,o1系列至少要10块钱这个背景来看,又是不一样的感觉。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

考验任务规划能力的PlanBench,同样的剧本再次上演。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

在开发者Xeophon自己的个人测试上,甚至超过了o1-preview。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

同一个测试上,R1数据蒸馏的Qwen 32B,与DeepSeek-V3,GPT-4o和Gemini Flash处于同一水平。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

最后,还有人从中看到新的创业机会。

谁来构建一个平台,能轻松地在DeepSeek R1上进行OpenAI风格的强化微调。

至少在短期内,是一个巨大的机会。

R1在正确数据和微调方法下,可能在特定任务上大幅提升。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

参考链接:

[1]https://x.com/alexocheema/status/1881561143736664180

[2]https://x.com/reach_vb/status/1881809400995934640

[3]https://livebench.ai/#/[2]https://x.com/arcprize/status/1881761987090325517

[4]https://x.com/TheXeophon/status/1881443117787984265

责任编辑:上方文Q

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/5654.html

(0)
广众网的头像广众网
上一篇 2025年1月22日 下午6:17
下一篇 2025年1月22日 下午6:17

相关推荐

  • 第三代中国自主量子计算编程框架发布:比美国最多快320倍

    广众网1月21日消息,为了充分挖掘量子计算的巨大潜力,本源量子自主研发了QPanda量子计算编程框架。这一创新工具旨在帮助开发者更高效地设计、优化、运行及理解量子程序。 作为最新进展,本源量子现已推出第三代中国自主知识产权的量子计算编程框架——QPanda3。 根据Benchpress的测试结果,QPanda3在量子线路编译方面的性能显著优于 Qiskit …

    2025年1月21日
    7300
  • 真金白银支持!全球手机用户AI应用花费超10亿美元:ChatGPT独占40%

    广众网1月23日消息,根据Sensor Tower的最新报告,2024年全球手机用户在AI聊天机器人和AI生成工具上的支出达到了12.7亿美元,其中AI聊天机器人应用占据了10.7亿美元的收入。 这一数字在2022年仅为3000万美元,2023年激增至4.55亿美元,显示出用户对AI应用的热情和付费意愿的增长。 Sensor Tower预测,如果这种增长趋势…

    2025年1月23日
    4600
  • AOC推出新款27游戏显示器:FHD 240Hz屏首发799元

    广众网1月24日消息,AOC推出了新款27G11ZE2游戏显示器,首发到手799元。 据悉,新款显示器采用了27英寸Fast IPS面板,8bit色深,分辨率为FHD(1920 x 1080),刷新率达到了240Hz,响应时间(MPRT)为0.3ms,亮度为300尼特。 同时,其静态对比度为1000:1,sRGB色域为123%,支持HDR10,兼容AMD F…

    2025年1月24日
    6400
  • 第一批回家过年的人已经堵路上了:服务区也堵上了 都是车和人

    广众网1月23日消息,随着春节假期临近,国内春运也逐步迎来了高峰期。公路客运作为春运的主力,堵车的压力也是直线上升。 据报道,今年春节假期高速免费时间为1月28日(除夕)00:00至2月4日(正月初七)24:00,共计8天。 不少旅客原以为提前几天出行,虽然要掏高速费,但能避开最高峰也算合适。不过有这种想法的人不在少数,最终高速拥堵还是无可避免。“第一批聪明…

    2025年1月23日
    5400
  • 雷神ZQ27F210显示器今日首销:27英寸 2K 210Hz仅799元

    广众网1月25日消息,雷神旗下的“ZQ27F210”27英寸显示器于1月25日20:00正式开启首销,首发价为799元。 这款显示器主打“2K 210Hz”高刷新率,配备2560×1440分辨率的Fast-IPS面板,支持210Hz超高刷新率(原生200Hz,超频可达210Hz),亮度最高可达400尼特,响应速度仅为1ms。 此外,它还支持10-B…

    2025年1月25日
    5200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信