奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测来了

广众网 • 2024年8月8日下午6:14 • 科技 • 68 views

OpenAI神秘新模型，真的藏不住了！

先是有匿名聊天机器人现身lmsys竞技场，声称自己是GPT-4系列模型一部分，吊足了大家的胃口。

随后奥特曼又发了一个浮想联翩的推文，正是他花园里的草莓照片，并配文：i love summer in the garden。

上个月OpenAI正好被曝正在开发新一代基础模型草莓，前身据说是之前神秘兮兮的Q*。

不知是有意还是无意，但感觉就是有意，网友们就当奥特曼变相承认了。（Doge）

这就是对草莓计划的引用！发布时间就是在夏天。（美国的秋天从9月22日开始）

就在刚刚，ChatGPT官方推文开始走起了

的队形，更显得有理有据了。

新模型现身竞技场，网友第一波实测

最早在昨天下午，有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。

之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型系列一部分。

所以不少人怀疑OpenAI新模型要来了，也许就是草莓计划或者Q*。

网友进行了第一波实测。

像「9.11和9.9哪个大」这个难题也没有挑战成功。

而让它倒着写单词，同样也没回答出来。

诶不过，说草莓这个单词有多少个r倒是答对了。

还有河流难题，也直接轻松解决，而不像之前其他大模型回答得过于复杂。

如果一个人和一只狗要过河，但有个船只能承载一个人和一只动物，请问怎么过去？

最早在今年5月，OpenAI就被爆出正在开发草莓项目。

据今年7月路透社消息称，多个内部人士透露，这个项目会让公司的AI系统不仅能生成查询的答案，而且能够提前规划，自主可靠地浏览互联网，从而执行OpenAI 所称的深度研究（deep research）。

比如通过CUA（一种计算机代理）的帮助来自动浏览网页，该代理可以根据发现内容采取行动。

这也是迄今一众AI模型尚未解决的问题和难点。

草莓计划前身是Q*

在众多猜测中，草莓项目的前身极有可能是Q*。

去年11月，Q*首次被曝出，被认为过于强大，可能是通往AGI或超级智能的关键一步。

它被指具有这些特性，比如在数学和推理能力方面有很大的提升，突破了人类数据的限制，可以自己生产巨量训练数据，有自主学习和自我改进的能力等等。

在草莓项目正式被曝光的前几天，OpenAI科学家Noam Brown发了一条推特，感慨OpenAI总是会坚定地在重大研究方向上持续押注。

而这位科学家去年才跳槽到OpenAI，主要负责研究模型推理能力，之前一直被认为在研究Q*。

最新曝光显示，草莓使用的推理方法和2022年斯坦福发表的一种方法相似。

当时他们提出了一个自学推理（Self-Taught Reasoner，简称STaR）的方法。今年，斯坦福团队又基于STaR，提出了一种名为Quiet-STaR的推理方式，也就是Q*了

知情人士表示，OpenAI希望通过该项目大幅提升AI模型的推理能力，草莓已经在非常大的数据集上完成预训练，并使用了一种专门的处理方法，比如post-training等。

另外，内部之前也有过一次神秘模型的测试，当时数学测试成绩超过90%，不过也没法确认是否是Q*。

对此，OpenAI并没有直接回应。声明中表示：

We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.

(我们希望我们的AI模型能像我们一样看待和理解世界。对新的人工智能能力的持续研究是该行业的常见做法，人们普遍认为这些系统随着时间的推移在推理方面会有所改进。)

不过确实要说的是，距离OpenAI发布上一个重要基础模型，也就是GPT-4，已经过去了近17个月的时间。差不多一年半了，也该来新一代模型了。

结果奥特曼现在又发一些云里雾里的推文。网友大开脑洞：

如图所示这张图有五个草莓，但第五个还没有熟。而草莓成熟的时间在4-6周内，说明GPT-5也将在那时候发布。

好好好，我信了。

参考链接：[1]https://x.com/apples_jimmy/status/1821047312673890694[2]https://x.com/flowersslop/status/1821054928275533900[3]https://x.com/sama/status/1821207141635780938

以上就是关于【奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测来了】的相关消息了，希望对大家有所帮助！

Like (0)

0 0

骁龙8 Gen4价格屠夫！真我GT7 Pro参数曝光

Previous 2024年8月8日下午6:06

真我首家品牌服务旗舰店落户深圳：年底计划扩展至500家网点

Next 2024年8月8日下午6:23

科技

网友曝自己的小米SU7被盗结果车辆定位不到2小时被追回

8月11日消息，有博主爆料称，有群友表示，自己的小米SU7昨日晚间被盗。车主介绍，自己的车辆忘记锁车了，钥匙卡片还在车内，车辆已被开走，向群友求助怎么办。在群友的提醒下，车主打开小米汽车手机App，通过APP定位了车辆位置，并将钥匙卡片停用，打开代客模式。随后，车主报警和警察一起去追车，最终，在后台定位的指引下，把被盗车辆成功截停，全程不到2个小时。 …

广众网
2024年8月13日
61000
科技

图形性能高40%！苹果：Mac才是最好的AI PC

9月7日消息，据媒体报道，在微软联合英特尔、AMD、高通等厂商推出一系列Windows 11 AI+ PC之际，苹果正启动新一轮宣传，强调自家Mac才是最佳AI PC产品。在与Windows 11 AI+ PC产品的对比中，苹果自信地表示，配备M3芯片的MacBook Air在图形性能上比Copilot+ PC快达40%，网页浏览速度也提高了25%。随着…

广众网
2024年9月7日
25000
科技

定位厘米级！中国北斗系统服务及相关产品已输出到130余个国家

10月26日消息，据新华社报道，日前，第三届北斗规模应用国际峰会在湖南株洲召开，会议期间，《北斗产业发展蓝皮书（2024年）》正式发布。蓝皮书显示，北斗系统服务及相关产品已输出到130余个国家。中国积极参与国际标准的制定工作，多项与北斗卫星导航系统相关的国际标准相继发布，为民航、搜救卫星、海事、移动通信等多个关键领域产业发展应用奠定坚实基础。在峰会展览现…

广众网
2024年10月26日
12000
科技

网友已经幻想8月20日的自己：一根金箍棒力战众妖怪

8月17日消息，备受期待的国产游戏杰作《黑神话：悟空》预定于8月20日上午10点迎来解锁，届时，玩家们将终于可以亲身体验这款游戏。随着发布日期的临近，网络上已经涌现了大量由网友制作的相关视频，表达了他们对这一时刻的期盼。这些自制视频的前半部分通常描绘了《西游记》中孙悟空在狮驼岭英勇战斗的场景，以一己之力对抗三个妖怪，展现出精彩绝伦的战斗场面。然而，视频…

广众网
2024年8月18日
57000
科技

又一理想跟随者奇瑞捷途山海L7上市：12.98万起、最多坐7人

9月28日消息，昨晚，捷途品牌旗下中型SUV山海L7正式上市，4款配置车型，官方指导价为12.98-15.98万元，同时提供限时以旧换新价10.68-12.48万元。捷途山海L7的外观设计采用全新语言，乍看之下非常像是理想的设计语言，拥有封闭式前格栅与贯穿式前灯组相结合的设计。新车的长宽高分别为4749/1900/1720mm，轴距为2745mm，侧面设…

广众网
2024年9月28日
19000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信