YouTube01 Dec 2025

【生成式人工智慧與機器學習導論2025】第 8 講:通用模型的終身學習 (Fine-tuning, Model Editing, Model Merging, Test-Time Training)

Podcast cover

Hung-yi Lee

本次講座李宏毅教授主要講述了通用模型的終身學習,區別了 Pre-training 和 Post-training,並強調了後訓練的三個目標:可靠性、通用性和局部性。講座中,教授闡述了持續學習的重要性,並探討了如何評估模型訓練的成功與否,同時提醒聽眾最好的後訓練是不進行後訓練。李教授分享了四種技術:梯度下降微調、模型編輯、模型合併以及測試時訓練,詳細解釋了每種技術的原理、應用案例以及可能遇到的問題,並提供了相應的解決方案和參考文獻。

Outlines

Part 1: 基礎概念與需求

Part 2: 後訓練的風險與解決方案

Part 3: 模型編輯與合併

Part 4: 測試時訓練與持續學習

Sign in to continue reading, translating and more.

Continue
 
mindmap screenshot
Preview
preview episode cover
How to Get Rich: Every EpisodeNaval