<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>大模型 on 黄文卓 | DevOps Engineer</title><link>https://socake.github.io/tags/%E5%A4%A7%E6%A8%A1%E5%9E%8B/</link><description>Recent content in 大模型 on 黄文卓 | DevOps Engineer</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>17691281867@163.com (Wenzhuo Huang)</managingEditor><webMaster>17691281867@163.com (Wenzhuo Huang)</webMaster><copyright>© 2026 Wenzhuo Huang</copyright><lastBuildDate>Mon, 09 Mar 2026 11:37:00 +0800</lastBuildDate><atom:link href="https://socake.github.io/tags/%E5%A4%A7%E6%A8%A1%E5%9E%8B/index.xml" rel="self" type="application/rss+xml"/><item><title>Prompt Engineering 完全指南：从入门到工程化</title><link>https://socake.github.io/posts/prompt-engineering-guide/</link><pubDate>Mon, 09 Mar 2026 11:37:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/prompt-engineering-guide/</guid><description>Prompt Engineering 不是玄学，而是有规律可循的工程实践。从基础技巧到企业级工程化，本文覆盖提示词设计的完整方法论，包括 A/B 测试、版本管理、失效模式分析，以及在生产系统中管理提示词的最佳实践。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/prompt-engineering-guide/featured.jpg"/></item><item><title>OpenAI API 工程化实践：从 Hello World 到生产</title><link>https://socake.github.io/posts/openai-api-engineering/</link><pubDate>Tue, 03 Mar 2026 11:41:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/openai-api-engineering/</guid><description>OpenAI API 是大多数 LLM 应用开发者的起点，但从 Hello World 到真正可靠的生产系统，中间有很多工程细节需要处理。本文覆盖 Function Calling、Structured Output、Batch API、Embeddings 的完整实践，以及速率限制、错误处理和成本控制的系统方案。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/openai-api-engineering/featured.jpg"/></item><item><title>Claude API 开发完全指南：从调用到生产应用</title><link>https://socake.github.io/posts/claude-api-development-guide/</link><pubDate>Tue, 24 Feb 2026 11:26:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/claude-api-development-guide/</guid><description>Claude API 的设计哲学和 OpenAI 有些不同，但一旦理解其模式，就会发现它在长文本、代码生成和工具调用上非常可靠。本文覆盖从 SDK 配置到 Prompt Caching、Tool Use、Vision 的完整开发实践，以及生产中的错误处理与成本控制策略。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/claude-api-development-guide/featured.jpg"/></item><item><title>Embedding 模型选型与优化实战：从 BGE 到 OpenAI Embedding</title><link>https://socake.github.io/posts/embedding-model-selection-guide/</link><pubDate>Sat, 21 Feb 2026 09:30:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/embedding-model-selection-guide/</guid><description>系统对比 2026 年主流 Embedding 模型，从原理到工程实践，覆盖选型决策、缓存设计和批量优化</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/embedding-model-selection-guide/featured.jpg"/></item><item><title>LangChain 从入门到实战：构建 LLM 应用的工程框架</title><link>https://socake.github.io/posts/langchain-practical-guide/</link><pubDate>Mon, 09 Feb 2026 11:01:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/langchain-practical-guide/</guid><description>LangChain 是构建 LLM 应用最流行的框架，但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署，梳理真正有用的部分，并指出哪些功能实际工程中应该避免。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/langchain-practical-guide/featured.jpg"/></item><item><title>Advanced RAG：超越 Naive RAG 的高级检索增强技术</title><link>https://socake.github.io/posts/advanced-rag-techniques/</link><pubDate>Wed, 04 Feb 2026 11:33:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/advanced-rag-techniques/</guid><description>系统拆解 Naive RAG 的三类失败模式，提供混合检索、HyDE、查询改写、Parent-Child 分块等高级技术的完整实现</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/advanced-rag-techniques/featured.jpg"/></item><item><title>大模型赋能运维：LLM 在故障排查和自动化中的实际应用</title><link>https://socake.github.io/posts/aiops-llm-devops/</link><pubDate>Sat, 31 Jan 2026 12:06:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/aiops-llm-devops/</guid><description>LLM 不能替代运维工程师，但确实能把重复性、低价值的工作自动化掉。本文分享我在实际工作中用 Claude 落地的几个场景。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/aiops-llm-devops/featured.jpg"/></item><item><title>LLM 成本优化实战：从 Token 预算到模型路由</title><link>https://socake.github.io/posts/llm-cost-optimization/</link><pubDate>Mon, 19 Jan 2026 13:03:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/llm-cost-optimization/</guid><description>我们的 AI 功能上线第一个月，LLM API 账单是 $18,000。通过模型路由、Prompt Caching 和 Batch API，第三个月降到了 $3,200。这篇文章记录具体怎么做到的。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/llm-cost-optimization/featured.jpg"/></item><item><title>LLM Tool Use 完全指南：Function Calling 设计模式与生产实践</title><link>https://socake.github.io/posts/llm-tool-use-function-calling/</link><pubDate>Sun, 18 Jan 2026 12:36:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/llm-tool-use-function-calling/</guid><description>从工程视角深入 LLM Tool Use：覆盖 OpenAI 与 Claude API 差异、工具 Schema 设计、并发调用、错误恢复，附完整运维助手代码示例</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/llm-tool-use-function-calling/featured.jpg"/></item><item><title>2026 大模型全景：主力模型横评与选型指南</title><link>https://socake.github.io/posts/llm-landscape-2025/</link><pubDate>Fri, 09 Jan 2026 13:50:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/llm-landscape-2025/</guid><description>GPT-5.4、Claude Opus 4.6、Gemini 2.5 Pro、Llama 4 Scout、DeepSeek V3.2——2026年4月的大模型格局已经和一年前完全不同。本文从工程师视角梳理当前主力模型的真实规格与适用边界，给出场景化选型矩阵，并讨论开源追平闭源、推理模型标配化、agent workload 崛起这三个2026年的核心判断。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/llm-landscape-2025/featured.jpg"/></item><item><title>大模型核心概念：工程师需要理解的 LLM 基础</title><link>https://socake.github.io/posts/llm-core-concepts/</link><pubDate>Mon, 17 Nov 2025 11:37:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/llm-core-concepts/</guid><description>同事第一次用 GPT-4 API 写代码时问我：为什么我发了一段中文，token 消耗比英文多那么多？为什么模型有时候会一本正经地胡说八道？这篇文章把我认为工程师必须理解的 LLM 概念系统整理了一遍，不涉及 Transformer 数学，只讲对你写代码有帮助的部分。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/llm-core-concepts/featured.jpg"/></item><item><title>RAG 系统设计与实战：检索增强生成完全指南</title><link>https://socake.github.io/posts/rag-system-design-practice/</link><pubDate>Tue, 11 Nov 2025 11:41:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/rag-system-design-practice/</guid><description>RAG（检索增强生成）是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计：文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩，以及用 RAGAS 框架评估 RAG 质量，最后分享生产环境踩坑记录。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/rag-system-design-practice/featured.jpg"/></item></channel></rss>