FastGPT 知识库问答系统:从部署到应用2026-03-20·733 字·4 分钟FastGPT是专注知识库问答的开源平台,相比Dify上手更快。本文覆盖MongoDB+PgVector部署、知识库创建与文档导入、Flow工作流配置、相似度阈值调优、API接入钉钉,以及运维知识库的实战案例。
Dify 私有化部署与 RAG 应用构建实战2026-03-12·665 字·4 分钟Dify是当前私有化部署最成熟的LLM应用构建平台。本文覆盖Docker Compose部署、多模型Provider配置、知识库创建与切片调优、RAG对话应用构建、工作流编排,以及API发布与生产监控。
Embedding 模型选型与优化实战:从 BGE 到 OpenAI Embedding2026-02-21·940 字·5 分钟系统对比 2026 年主流 Embedding 模型,从原理到工程实践,覆盖选型决策、缓存设计和批量优化
LangChain 从入门到实战:构建 LLM 应用的工程框架2026-02-09·1045 字·5 分钟LangChain 是构建 LLM 应用最流行的框架,但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署,梳理真正有用的部分,并指出哪些功能实际工程中应该避免。
RAG 评估体系:RAGAS 指标与幻觉检测实践2026-02-05·1391 字·7 分钟RAG 系统上线后,‘感觉回答质量还不错’不是一个可持续的评估方式。RAGAS 提供了一套可量化的评估框架,让你能追踪 Faithfulness、Answer Relevancy 等指标随时间的变化,并在每次改动后自动验证系统质量没有退化。
Advanced RAG:超越 Naive RAG 的高级检索增强技术2026-02-04·1214 字·6 分钟系统拆解 Naive RAG 的三类失败模式,提供混合检索、HyDE、查询改写、Parent-Child 分块等高级技术的完整实现
RAG 系统设计与实战:检索增强生成完全指南2025-11-11·1157 字·6 分钟RAG(检索增强生成)是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计:文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩,以及用 RAGAS 框架评估 RAG 质量,最后分享生产环境踩坑记录。
Milvus 向量数据库实战:从部署到生产应用2025-11-06·895 字·5 分钟覆盖向量数据库选型对比(Milvus/Qdrant/Weaviate/pgvector)、Milvus Standalone与Cluster部署、Collection Schema设计、HNSW/IVF_FLAT索引调优、混合搜索实战,以及生产环境常见问题处理。