
大型語言模型的自我修正能力主要透過修改推論過程、調整工作流程及直接訓練模型參數三種途徑實現。在推論階段,對比解碼技術利用模型正確與錯誤狀態下的表徵差異,在不更動參數下提升輸出準確度。工作流程方面,透過生成後自動插入反思指令,能利用批判比生成容易的特性進行自我驗證,但效果受模型個性與指令影響。此外,透過強化學習訓練模型進行推理,能促使模型發展出自我偵測與修正的 emergent 能力,儘管這需要龐大算力。研究顯示,自我修正並非單純的知識問題,而是一種特定的模型狀態;在算力有限時,增加樣本多樣性往往比單純的驗證機制更具成本效益,顯示模型在推理過程中的思考代價與訓練策略至關重要。
Sign in to continue reading, translating and more.
Continue