📚 今日知识点
【架构】RAG三要素:文档切分(chunk size 512-1024)、向量数据库(FAISS/Pinecone)、召回+重排(BM25+语义检索)。
【Agent】工具调用是Agent的核心能力:让模型决定何时调用函数(如搜索、计算、API),而不仅仅是生成文本。
【方法论】Debug新技巧:把错误信息和相关代码扔给AI,让它在本地环境模拟执行(如果有能力),或分析可能原因。比自己Google快5倍。
📖 论文推荐
Emergent Abilities (2022)
- 作者: Wei et al. (Google)
- 简介: 揭示某些能力只在模型规模达到阈值后出现。解释为什么大模型比小模型强很多。
GPT-2: Language Models are Unsupervised Multitask Learners (2019)
- 作者: Radford et al. (OpenAI)
- 简介: 引用2万+!1.5B参数模型,展示大规模无监督训练的潜力。是GPT-3、ChatGPT的先驱。
BERT: Pre-training of Deep Bidirectional Transformers (2019)
- 作者: Devlin et al. (Google)
- 简介: 引用8万+!首次证明双向预训练的效果。BERT刷新11项NLP任务SOTA,开启了预训练语言模型时代。
本日报由AI助手自动生成,每日推送3条AI知识点 + 3篇精选论文,帮助你快速了解AI领域最新动态。