首页 > 电脑教程 > 电脑教程 > 苹果拆解AI大脑,推理模型全是「装」的?Bengio兄弟合著

苹果拆解AI大脑,推理模型全是「装」的?Bengio兄弟合著

发布时间:2025-06-06 16:18:19来源: 18638159832
AI「思考」只是假象?
 
  刚刚,一项来自苹果的重磅研究揭示了「大推理模型(LRM)」背后的惊人真相——这些看似聪明的模型,在面对稍复杂点的题目时,准确率居然会全面崩溃!
 
  随着问题变难,推理模型初始会延长思考,但随后思考深度反而下降,尽管仍有充足token预算——它们恰在最需要深入思考时选择了放弃!
 
  这太违背直觉了,似乎Scaling Law在推理时完全失效了。
 
  值得一提的是,论文作者中还有Samy Bengio,他也是图灵三巨头Yoshua Bengio的兄弟。
 
 
  论文地址:https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf
 
  LRM模型因能「写出思考过程」而备受期待,被认为是AI推理能力跃升的关键。
 
 
  DeepSeek-R1 模式的开源开启了LLM进化到LRM的进程
 
  但研究人员通过可控游戏环境的系统实验证明:现有LRMs不仅在高复杂度任务上力不从心,甚至还展现出一种「反常的推理崩溃曲线」——题目越难,它们反而越不「努力」。
 
  研究还通过在相同计算token预算下对比思考模型与普通模型,发现:
 
  不同于大多数仅衡量最终性能的研究,这项最新研究分析了它们实际的推理轨迹——深入观察其冗长的「思考」过程。
 
  三种不同的性能区间
 
  与以往主要依赖数学问题来评估语言模型推理能力的研究不同,本研究引入了可控的解谜环境。
 
  这种环境可以精确调节问题的复杂度,同时保持逻辑过程的一致性,从而更严谨地分析模型的推理模式和局限性。
 

电脑教程更多>>

荣耀最强旗舰!荣耀Magic8 RSR保时捷设计明天首销:7999元起 荣耀MagicOS系统1月升级内容公布,含AI追色、带壳截屏等 iQOO15 Ultra双配色登场 以代号演绎未来科技 几场漂亮“大仗”背后,阿里已经重塑“组织优势” 分析清理微信储存空间的开源项目遭发函、下架?腾讯回应 存储涨价行情下如何省钱?新年高性价比DDR4主机配置推荐 华为手机迎来五则新消息:折叠屏、小屏、畅享、产能,均有新变化 这类ETF单周缩水超2000亿元,发生了什么?| ETF规模周报 京东健康发布AI产品“知医” 2.5K档最强!REDMI Turbo 5 Max跑分出炉:首发天玑9500s 联名泡泡玛特:荣耀500 Pro MOLLY 20周年限定版礼盒19日发布 开发周期紧张影响升级?消息称三星S26+屏幕尺寸与前代保持一致 快递驿站转让帖在线上涌现,经营者称每月只赚五六千,“不如去当保安” 小米澎湃OS3最后一批适配启动!你的手机能升吗?老用户必看 小米六款机型全面停更,你的手机会被波及吗,速速核对吧 荣耀Power2发布前瞻:外观、配置、续航、定价,基本没悬念了 真我手机更新到UI7.0?先看这3步,再决定要不要升级 苹果要出折叠屏了,这回真不是手机,是桌面? 全维赋能,智启征程!华为与中国互联网的2025精彩纷呈 VIVO迈出了第一步,抱住了一条大腿,身价直接上了一个档次! 余承东一锤定音,享界轿车改道旅行车成爆款 传长安汽车因2025年销量未达目标而取消员工年终奖引发不满!目标300万辆,完成291.3万辆,官方暂无回应 混动双雄终极对决:凯美瑞省油开10年,雅阁快得像电车? 5.59万配自动挡、倒车影像、无钥匙启动,起亚奕跑值得买吗? 车宽两米,续航超六百,别克这新车能行? 大众全新SUV亮相,省油还能装,这车能火? 1 月 8/10 日连发!比亚迪三款 DM-i 新车 210km 续航 + 云辇 - C 加持 奔驰“小g”官图疑似曝光 纯电动力 2027年首发亮相 全新一代宝马3系首次全面曝光,外观,内饰大升级,真漂亮 全新奔驰GLA曝光,21寸轮毂+贯穿尾灯,把轻奢智能SUV玩