RAG

FastGPT 知识库问答系统：从部署到应用

2026-03-20·733 字·4 分钟

FastGPT是专注知识库问答的开源平台，相比Dify上手更快。本文覆盖MongoDB+PgVector部署、知识库创建与文档导入、Flow工作流配置、相似度阈值调优、API接入钉钉，以及运维知识库的实战案例。

2026-03-12·665 字·4 分钟

Dify是当前私有化部署最成熟的LLM应用构建平台。本文覆盖Docker Compose部署、多模型Provider配置、知识库创建与切片调优、RAG对话应用构建、工作流编排，以及API发布与生产监控。

2026-02-21·940 字·5 分钟

系统对比 2026 年主流 Embedding 模型，从原理到工程实践，覆盖选型决策、缓存设计和批量优化

2026-02-09·1045 字·5 分钟

LangChain 是构建 LLM 应用最流行的框架，但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署，梳理真正有用的部分，并指出哪些功能实际工程中应该避免。

2026-02-05·1391 字·7 分钟

RAG 系统上线后，‘感觉回答质量还不错’不是一个可持续的评估方式。RAGAS 提供了一套可量化的评估框架，让你能追踪 Faithfulness、Answer Relevancy 等指标随时间的变化，并在每次改动后自动验证系统质量没有退化。

2026-02-04·1214 字·6 分钟

系统拆解 Naive RAG 的三类失败模式，提供混合检索、HyDE、查询改写、Parent-Child 分块等高级技术的完整实现

2025-11-11·1157 字·6 分钟

RAG（检索增强生成）是目前企业落地 LLM 最主流的方式。本文覆盖 RAG 系统的完整设计：文档处理管线、分块策略、向量检索与关键词混合检索、Rerank 重排序、上下文压缩，以及用 RAGAS 框架评估 RAG 质量，最后分享生产环境踩坑记录。

2025-11-06·895 字·5 分钟

覆盖向量数据库选型对比（Milvus/Qdrant/Weaviate/pgvector）、Milvus Standalone与Cluster部署、Collection Schema设计、HNSW/IVF_FLAT索引调优、混合搜索实战，以及生产环境常见问题处理。