AI 能自我修正嗎？從 decoding、workflow 到 reasoning 的技術發展整理

大型語言模型的自我修正能力主要透過修改推論過程、調整工作流程及直接訓練模型參數三種途徑實現。在推論階段，對比解碼技術利用模型正確與錯誤狀態下的表徵差異，在不更動參數下提升輸出準確度。工作流程方面，透過生成後自動插入反思指令，能利用批判比生成容易的特性進行自我驗證，但效果受模型個性與指令影響。此外，透過強化學習訓練模型進行推理，能促使模型發展出自我偵測與修正的 emergent 能力，儘管這需要龐大算力。研究顯示，自我修正並非單純的知識問題，而是一種特定的模型狀態；在算力有限時，增加樣本多樣性往往比單純的驗證機制更具成本效益，顯示模型在推理過程中的思考代價與訓練策略至關重要。

Outlines

Sign in to continue reading, translating and more.