跳过正文

大模型

多模态大模型实践:图像理解与视觉分析

多模态大模型实践:图像理解与视觉分析

·986 字·5 分钟
覆盖主流多模态模型选型对比、图像理解API调用方式、OCR/文档理解/图表解析等实际场景,以及一个完整的运维场景实战:用多模态模型自动分析Grafana截图并生成告警摘要。
Prompt Engineering 完全指南:从入门到工程化

Prompt Engineering 完全指南:从入门到工程化

·721 字·4 分钟
Prompt Engineering 不是玄学,而是有规律可循的工程实践。从基础技巧到企业级工程化,本文覆盖提示词设计的完整方法论,包括 A/B 测试、版本管理、失效模式分析,以及在生产系统中管理提示词的最佳实践。
OpenAI API 工程化实践:从 Hello World 到生产

OpenAI API 工程化实践:从 Hello World 到生产

·1678 字·8 分钟
OpenAI API 是大多数 LLM 应用开发者的起点,但从 Hello World 到真正可靠的生产系统,中间有很多工程细节需要处理。本文覆盖 Function Calling、Structured Output、Batch API、Embeddings 的完整实践,以及速率限制、错误处理和成本控制的系统方案。
Claude API 开发完全指南:从调用到生产应用

Claude API 开发完全指南:从调用到生产应用

·1316 字·7 分钟
Claude API 的设计哲学和 OpenAI 有些不同,但一旦理解其模式,就会发现它在长文本、代码生成和工具调用上非常可靠。本文覆盖从 SDK 配置到 Prompt Caching、Tool Use、Vision 的完整开发实践,以及生产中的错误处理与成本控制策略。
LangGraph 工作流编排:构建有状态的 AI 应用

LangGraph 工作流编排:构建有状态的 AI 应用

·1324 字·7 分钟
从LangChain Chain的局限出发,讲清楚LangGraph的状态机模型、Graph/Node/Edge的设计方式,以及条件分支、循环、人工介入、Checkpoint持久化的工程实现,最后用一个运维诊断工作流串起来所有概念。
Langfuse:LLM 应用可观测性平台实战

Langfuse:LLM 应用可观测性平台实战

·836 字·4 分钟
讲清楚为什么LLM应用必须要可观测性,以及如何用Langfuse从链路追踪、Prompt版本管理、评估实验到成本分析做到全覆盖,包含Docker自托管部署和Python SDK完整集成示例。
LangChain 从入门到实战:构建 LLM 应用的工程框架

LangChain 从入门到实战:构建 LLM 应用的工程框架

·1045 字·5 分钟
LangChain 是构建 LLM 应用最流行的框架,但也是踩坑最多的框架之一。本文从 LCEL 表达式、ReAct Agent、LangGraph 工作流到生产部署,梳理真正有用的部分,并指出哪些功能实际工程中应该避免。
RAG 评估体系:RAGAS 指标与幻觉检测实践

RAG 评估体系:RAGAS 指标与幻觉检测实践

·1391 字·7 分钟
RAG 系统上线后,‘感觉回答质量还不错’不是一个可持续的评估方式。RAGAS 提供了一套可量化的评估框架,让你能追踪 Faithfulness、Answer Relevancy 等指标随时间的变化,并在每次改动后自动验证系统质量没有退化。
LLM 微调入门:LoRA 让大模型适配私有场景

LLM 微调入门:LoRA 让大模型适配私有场景

·767 字·4 分钟
什么时候该微调、什么时候该用提示工程?本文给出决策框架,然后用Unsloth+QLoRA实战微调Qwen2.5-7B,覆盖数据格式、训练监控、权重合并、部署到vLLM测试,以及10个真实踩坑记录。
2026 大模型全景:主力模型横评与选型指南

2026 大模型全景:主力模型横评与选型指南

·788 字·4 分钟
GPT-5.4、Claude Opus 4.6、Gemini 2.5 Pro、Llama 4 Scout、DeepSeek V3.2——2026年4月的大模型格局已经和一年前完全不同。本文从工程师视角梳理当前主力模型的真实规格与适用边界,给出场景化选型矩阵,并讨论开源追平闭源、推理模型标配化、agent workload 崛起这三个2026年的核心判断。