Embedding on 黄文卓 | DevOps Engineer

Embedding on 黄文卓 | DevOps Engineerhttps://socake.github.io/tags/embedding/Recent content in Embedding on 黄文卓 | DevOps EngineerHugo -- gohugo.iozh-CN17691281867@163.com (Wenzhuo Huang)17691281867@163.com (Wenzhuo Huang)© 2026 Wenzhuo HuangSat, 21 Feb 2026 09:30:00 +0800Embedding 模型选型与优化实战：从 BGE 到 OpenAI Embeddinghttps://socake.github.io/posts/embedding-model-selection-guide/Sat, 21 Feb 2026 09:30:00 +080017691281867@163.com (Wenzhuo Huang)https://socake.github.io/posts/embedding-model-selection-guide/系统对比 2026 年主流 Embedding 模型，从原理到工程实践，覆盖选型决策、缓存设计和批量优化大模型核心概念：工程师需要理解的 LLM 基础https://socake.github.io/posts/llm-core-concepts/Mon, 17 Nov 2025 11:37:00 +080017691281867@163.com (Wenzhuo Huang)https://socake.github.io/posts/llm-core-concepts/同事第一次用 GPT-4 API 写代码时问我：为什么我发了一段中文，token 消耗比英文多那么多？为什么模型有时候会一本正经地胡说八道？这篇文章把我认为工程师必须理解的 LLM 概念系统整理了一遍，不涉及 Transformer 数学，只讲对你写代码有帮助的部分。RAG 系统设计与实战：检索增强生成完全指南https://socake.github.io/posts/rag-system-design-practice/Tue, 11 Nov 2025 11:41:00 +080017691281867@163.com (Wenzhuo Huang)https://socake.github.io/posts/rag-system-design-practice/RAG（检索增强生成）是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计：文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩，以及用 RAGAS 框架评估 RAG 质量，最后分享生产环境踩坑记录。