【生成式人工智慧與機器學習導論2025】第 8 講：通用模型的終身學習 (Fine-tuning, Model Editing, Model Merging, Test-Time Training)

本次講座李宏毅教授主要講述了通用模型的終身學習，區別了 Pre-training 和 Post-training，並強調了後訓練的三個目標：可靠性、通用性和局部性。講座中，教授闡述了持續學習的重要性，並探討了如何評估模型訓練的成功與否，同時提醒聽眾最好的後訓練是不進行後訓練。李教授分享了四種技術：梯度下降微調、模型編輯、模型合併以及測試時訓練，詳細解釋了每種技術的原理、應用案例以及可能遇到的問題，並提供了相應的解決方案和參考文獻。

Outlines

Part 1: 基礎概念與需求

Part 2: 後訓練的風險與解決方案

Part 3: 模型編輯與合併

Part 4: 測試時訓練與持續學習

Sign in to continue reading, translating and more.

Continue

Hung-yi Lee

Part 1: 基礎概念與需求

通用模型終身學習的介紹與重要性

模型持續學習的需求與應用場景

持續學習的評估標準：可靠性、泛化性和局部性

Part 2: 後訓練的風險與解決方案

最佳的後訓練方法：避免後訓練

直接使用梯度下降微調模型的參數及常見問題

後訓練破壞 Alignment 能力及災難性遺忘

解決局部性問題的方法：限制可搜尋的參數範圍

解決局部性問題的方法：加入參數偏好和額外訓練資料

經驗回放與模型訓練資料的獲取

Part 3: 模型編輯與合併

模型編輯：ROM (Rank 1 Model Editing)

模型合併：參數的加加減減

模型合併的應用：Machine Unlearning 與類比推理

Part 4: 測試時訓練與持續學習

Test-Time Training：測試時的訓練

Test-Time Training 的方法與應用

Continuous Test-Time Training 與 Dynamic Suta

【生成式人工智慧與機器學習導論2025】第 8 講：通用模型的終身學習 (Fine-tuning, Model Editing, Model Merging, Test-Time Training)

Hung-yi Lee

Part 1: 基礎概念與需求

00:00通用模型終身學習的介紹與重要性

通用模型終身學習的介紹與重要性

05:03模型持續學習的需求與應用場景

模型持續學習的需求與應用場景

09:38持續學習的評估標準：可靠性、泛化性和局部性

持續學習的評估標準：可靠性、泛化性和局部性

Part 2: 後訓練的風險與解決方案

14:16最佳的後訓練方法：避免後訓練

最佳的後訓練方法：避免後訓練

18:12直接使用梯度下降微調模型的參數及常見問題

直接使用梯度下降微調模型的參數及常見問題

27:07後訓練破壞 Alignment 能力及災難性遺忘

後訓練破壞 Alignment 能力及災難性遺忘

38:31解決局部性問題的方法：限制可搜尋的參數範圍

解決局部性問題的方法：限制可搜尋的參數範圍

45:29解決局部性問題的方法：加入參數偏好和額外訓練資料

解決局部性問題的方法：加入參數偏好和額外訓練資料

53:05經驗回放與模型訓練資料的獲取

經驗回放與模型訓練資料的獲取

Part 3: 模型編輯與合併

1:02:02模型編輯：ROM (Rank 1 Model Editing)

模型編輯：ROM (Rank 1 Model Editing)

1:14:36模型合併：參數的加加減減

模型合併：參數的加加減減

1:27:49模型合併的應用：Machine Unlearning 與類比推理

模型合併的應用：Machine Unlearning 與類比推理

Part 4: 測試時訓練與持續學習

1:36:03Test-Time Training：測試時的訓練

Test-Time Training：測試時的訓練

1:45:25Test-Time Training 的方法與應用

Test-Time Training 的方法與應用

1:51:11Continuous Test-Time Training 與 Dynamic Suta

Continuous Test-Time Training 與 Dynamic Suta