HRM-Text技术解析：1500美元训练1B参数模型，潜空间递归推理的革命

AI搜索 2026-06-14 3 阅读

HRM-Text 递归推理潜空间小模型 Yoshua Bengio AI研究

背景：CoT链式推理的"伪推理"危机

过去两年，思维链（Chain-of-Thought, CoT）推理成为了大语言模型解决复杂问题的标准范式。然而2025年底至2026年初的一系列研究指出：CoT推理本质上是"语言层面的伪推理"。

HRM（Hidden Recursive Model）架构的核心创新在于：将推理过程从"语言输出空间"转移至"模型内部状态空间"。

HRM-Text的训练成本约为1500美元，核心原因是：参数量小（1B）、数据效率高、训练时间短（8张H100上约48小时）。

HRM-Text的出现，为AI推理研究开辟了一条全新的技术路线。它证明了"在潜空间中完成推理"不仅是理论可行的，而且可以在极低成本下实现具有竞争力的性能。