30 Mar 2024
1h 10m

E227: 🧠 YC 陳宜昌:聯發科 資深機器學習研究員|台灣的大語言模型如何誕生?

Podcast cover

塞掐 Side Chat

這一期播客節目探討了大型語言模型(LLM)的興起,特別聚焦於GPT-3和ChatGPT的爆紅。GPT-3和ChatGPT通過調整模型與人的互動行為,使其能夠進行有意義的對話。然而,與其他理解型模型相比,GPT-3的優勢在於其泛用性和少量示例的學習能力。另外,聯發科的研發創新基地在LLM的發展方面起到了重要的推動作用,聚焦於技術發展、中文詞表置換技術和解決中文資料稀少的挑戰。最後,討論了AGI的定義、發展和模型大小與工具使用的重要性。

Outlines

Sign in to continue reading, translating and more.

Continue
 
mindmap screenshot
Preview
preview episode cover
How to Get Rich: Every EpisodeNaval