09 Dec 2025
1h 0m

#353.视觉智能RAG与Agent框架:突破传统限制,构建多模态AI应用

Podcast cover

跨国串门儿计划

本期跨国串门计划播客克隆了 AWS 首席机器学习布道师 Suman Debnath 的技术分享,深入探讨了基于视觉的检索技术以及如何利用 Agent 框架构建智能应用。Suman 首先介绍了多模态 RAG 的三种方案,然后重点讲解了基于视觉的检索模型 Call Patcher,详细阐述了其工作原理和优势,并分享了实际应用案例。他还介绍了 Strands Agent 框架,展示了如何用它将整个工作流变成一个 Agent,并加上语音功能。在随后的问答环节,Suman 解答了听众关于该技术在生产环境中的应用、扩展性以及与其他技术的结合等问题,强调了根据数据特点选择合适技术的重要性。

Outlines

Sign in to continue reading, translating and more.

Continue
 
mindmap screenshot
Preview
preview episode cover
How to Get Rich: Every EpisodeNaval