Prompt Engineering 完全指南:从入门到工程化2026-03-09·721 字·4 分钟Prompt Engineering 不是玄学,而是有规律可循的工程实践。从基础技巧到企业级工程化,本文覆盖提示词设计的完整方法论,包括 A/B 测试、版本管理、失效模式分析,以及在生产系统中管理提示词的最佳实践。
OpenAI API 工程化实践:从 Hello World 到生产2026-03-03·1678 字·8 分钟OpenAI API 是大多数 LLM 应用开发者的起点,但从 Hello World 到真正可靠的生产系统,中间有很多工程细节需要处理。本文覆盖 Function Calling、Structured Output、Batch API、Embeddings 的完整实践,以及速率限制、错误处理和成本控制的系统方案。
Claude API 开发完全指南:从调用到生产应用2026-02-24·1316 字·7 分钟Claude API 的设计哲学和 OpenAI 有些不同,但一旦理解其模式,就会发现它在长文本、代码生成和工具调用上非常可靠。本文覆盖从 SDK 配置到 Prompt Caching、Tool Use、Vision 的完整开发实践,以及生产中的错误处理与成本控制策略。
Embedding 模型选型与优化实战:从 BGE 到 OpenAI Embedding2026-02-21·940 字·5 分钟系统对比 2026 年主流 Embedding 模型,从原理到工程实践,覆盖选型决策、缓存设计和批量优化
LangChain 从入门到实战:构建 LLM 应用的工程框架2026-02-09·1045 字·5 分钟LangChain 是构建 LLM 应用最流行的框架,但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署,梳理真正有用的部分,并指出哪些功能实际工程中应该避免。
Advanced RAG:超越 Naive RAG 的高级检索增强技术2026-02-04·1214 字·6 分钟系统拆解 Naive RAG 的三类失败模式,提供混合检索、HyDE、查询改写、Parent-Child 分块等高级技术的完整实现
大模型赋能运维:LLM 在故障排查和自动化中的实际应用2026-01-31·992 字·5 分钟LLM 不能替代运维工程师,但确实能把重复性、低价值的工作自动化掉。本文分享我在实际工作中用 Claude 落地的几个场景。
LLM 成本优化实战:从 Token 预算到模型路由2026-01-19·1312 字·7 分钟我们的 AI 功能上线第一个月,LLM API 账单是 $18,000。通过模型路由、Prompt Caching 和 Batch API,第三个月降到了 $3,200。这篇文章记录具体怎么做到的。
LLM Tool Use 完全指南:Function Calling 设计模式与生产实践2026-01-18·1521 字·8 分钟从工程视角深入 LLM Tool Use:覆盖 OpenAI 与 Claude API 差异、工具 Schema 设计、并发调用、错误恢复,附完整运维助手代码示例
2026 大模型全景:主力模型横评与选型指南2026-01-09·788 字·4 分钟GPT-5.4、Claude Opus 4.6、Gemini 2.5 Pro、Llama 4 Scout、DeepSeek V3.2——2026年4月的大模型格局已经和一年前完全不同。本文从工程师视角梳理当前主力模型的真实规格与适用边界,给出场景化选型矩阵,并讨论开源追平闭源、推理模型标配化、agent workload 崛起这三个2026年的核心判断。