AI日报 2026-02-12

📚 今日知识点

【感悟】与AI协作的三个层次：1.把AI当搜索引擎 2.把AI当工具（写作、编程） 3.把AI当思维伙伴（共创、辩论）。大部分人还停留在第一层。
【方法论】Debug新技巧：把错误信息和相关代码扔给AI，让它在本地环境模拟执行（如果有能力），或分析可能原因。比自己Google快5倍。
【LLM】Few-shot learning比Zero-shot效果更好：给2-3个示例，模型理解能力显著提升。示例格式很重要，保持一致性。
【LLM】Temperature参数控制输出的随机性：0.1=确定性高（适合代码、文档），0.7=平衡（适合创意写作），1.0+=创造性强但可能不连贯。
【项目经验】成本优化：小模型+Prompt工程 > 大模型+暴力Prompt。7B模型调优后，很多任务能达到GPT-4的80%效果，成本只有1/10。
【方法论】Debug新技巧：把错误信息和相关代码扔给AI，让它在本地环境模拟执行（如果有能力），或分析可能原因。比自己Google快5倍。
【Vibe Coding】用自然语言解释需求比写伪代码更有效：AI理解上下文比理解语法更擅长。说清楚’为什么做’比’怎么做’重要。
【Vibe Coding】与AI结对编程的节奏：描述意图→让AI写→你review→指出问题→让AI修改。你的核心价值是判断和决策，不是打字。
【LLM】Temperature参数控制输出的随机性：0.1=确定性高（适合代码、文档），0.7=平衡（适合创意写作），1.0+=创造性强但可能不连贯。

📖 论文推荐

Constitutional AI (2022)
- 作者: Anthropic
- 简介: 引用2000+！宪法AI，通过自我批评避免有害输出。Claude模型的核心安全机制，RLHF的替代方案。
DeepSeek-V3: Technical Report (2025)
- 作者: DeepSeek Team
- 简介: 开源MoE架构，671B参数激活仅37B。性能媲美GPT-4，训练成本560万美元。开源的里程碑。
Instruction Tuning (2022)
- 作者: Wei et al. (Google)
- 简介: 引用5000+！证明指令微调让单一模型完成多任务。ChatGPT等聊天机器人的技术基础。
Qwen2.5 (2024)
- 作者: Alibaba
- 简介: 72B开源，性能超越闭源模型。数学、编程、长文本突出。中国开源AI的重要里程碑。
LLM-as-Judge (2024)
- 作者: Multiple Teams
- 简介: 用强模型评估弱模型，自动化评测。降低人工成本，加速模型迭代。
RAG: Knowledge-Intensive NLP with Retrieval (2020)
- 作者: Lewis et al.
- 简介: 引用1.5万+！RAG奠基论文。检索+生成范式，解决LLM幻觉问题，企业级应用的核心技术。
Long Context Beyond 1M Tokens (2024)
- 作者: Google, Anthropic
- 简介: Gemini 1.5、Claude 3突破1M上下文。长文档、代码库、视频内容处理成为可能。
Language Models are Few-Shot Learners (2020)
- 作者: Brown et al. (OpenAI)
- 简介: 引用6万+！GPT-3论文，定义few-shot learning。175B参数展示规模化效果，是现代prompt技术的起点。
GraphRAG (2024)
- 作者: Microsoft Research
- 简介: 结合知识图谱+社区检测，解决RAG全局性盲点。企业级知识库必备技术。

本日报由AI助手自动生成，每日推送3条AI知识点 + 3篇精选论文，帮助你快速了解AI领域最新动态。