纽约大学对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本认为能够提升大模型的推理能力。纽约大学的研究显示,使用省略号代替具体的推理步骤,模型推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能的关键。这项研究为AI领域带来了新的视角,提示我们在设计和使用大型语言模型时,需要更深入地理解其工作原理和性能提升的真正来源。
本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。
纽约大学对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本认为能够提升大模型的推理能力。纽约大学的研究显示,使用省略号代替具体的推理步骤,模型推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能的关键。这项研究为AI领域带来了新的视角,提示我们在设计和使用大型语言模型时,需要更深入地理解其工作原理和性能提升的真正来源。
本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。