Embedding 模型选型与优化实战:从 BGE 到 OpenAI Embedding2026-02-21·940 字·5 分钟系统对比 2026 年主流 Embedding 模型,从原理到工程实践,覆盖选型决策、缓存设计和批量优化
大模型核心概念:工程师需要理解的 LLM 基础2025-11-17·786 字·4 分钟同事第一次用 GPT-4 API 写代码时问我:为什么我发了一段中文,token 消耗比英文多那么多?为什么模型有时候会一本正经地胡说八道?这篇文章把我认为工程师必须理解的 LLM 概念系统整理了一遍,不涉及 Transformer 数学,只讲对你写代码有帮助的部分。
RAG 系统设计与实战:检索增强生成完全指南2025-11-11·1157 字·6 分钟RAG(检索增强生成)是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计:文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩,以及用 RAGAS 框架评估 RAG 质量,最后分享生产环境踩坑记录。