MySQL 高可用实战:MGR + ProxySQL + Orchestrator 完整部署2026-04-12·2071 字·10 分钟详细讲解 MySQL 8.0 MGR 单主模式完整搭建过程、脑裂与 GTID 不一致处理方法、ProxySQL 读写分离配置和健康检查脚本、Orchestrator 自动故障转移与 ProxySQL 联动,以及 mysqld_exporter 监控集成。
PostgreSQL 高可用实战:Patroni + HAProxy + etcd 完整部署指南2026-04-12·1814 字·9 分钟详解 Patroni 自动故障转移机制,手把手完成 etcd 三节点集群搭建、Patroni 完整配置(含 pg_hba.conf 托管)、HAProxy 读写分离配置,以及 kill primary 故障切换演练全过程。
数据库运维实践:MySQL 高可用与 PostgreSQL 调优经验2025-04-08·1117 字·6 分钟数据库运维不复杂,但细节多、出问题代价大。本文整理了 MySQL 主从复制、慢查询分析、PostgreSQL 连接池这几个高频话题的实战经验,以及一些日常运维 SQL 备忘。
MongoDB 运维入门:部署、备份与生产性能调优2025-03-31·681 字·4 分钟MongoDB 运维从选型到调优:何时选 MongoDB、Replica Set 三节点部署、索引设计、mongodump 备份,以及 wiredTiger、连接池、大文档等生产踩坑。
PostgreSQL 运维实战:配置调优、连接池、慢查询与高可用2025-03-18·1918 字·10 分钟系统梳理 PostgreSQL 运维核心技能:从 shared_buffers、WAL 参数调优,到 PgBouncer 事务模式配置;从 pg_stat_statements 慢查询分析到 PITR 时间点恢复;以及主从流复制、膨胀表清理和 Prometheus 监控指标的完整实践。
Doris 与 StarRocks:一次严肃的生产选型笔记2025-01-22·1078 字·6 分钟Doris 和 StarRocks 同源、相似、又各有偏好。选哪个不是"谁更好"的问题,而是"谁更适合我们的场景"的问题。这篇文章是我在两套 OLAP 集群(一套 Doris、一套 StarRocks)上运维一年多后写的深度对比,希望能帮你跳过几个月的调研和踩坑。
数据库变更管理:从 gh-ost 到 Flyway 的完整工程化路径2025-01-08·1100 字·6 分钟很多团队把"数据库变更管理"当成几条 SQL + 一个工单,实际上这是工程化程度最低的一块地方。一边是开发随手写 ALTER 把线上锁住,一边是 DBA 手动盯着进度条祈祷不出事。这篇文章把我总结的 DB 变更管理最佳实践分成工具、流程、组织三个层面讲,每一层都有可以直接落地的方案。
Vitess 实战:把 MySQL 水平扩展到 PB 级的路2024-12-24·1263 字·6 分钟当 MySQL 单库扛不住、又不想切 TiDB 或 PG 的时候,Vitess 就成了最后一个选项。它保留了 MySQL 兼容性,用 vtgate 做分片代理,用 VReplication 做在线 resharding。听起来很美,但 Vitess 的学习曲线陡得惊人。这篇文章是我调研 Vitess 几个月、在 staging 跑通一个 4 shard 集群后的全面笔记。
MongoDB 分片集群实战:从 shard key 设计到 chunk 均衡的全链路2024-11-20·1406 字·7 分钟很多团队把 MongoDB 分片当成"设个 shard key 就完事",结果上线半年后发现 80% 数据在一个 shard 上、balancer 每天搬几十 GB 却怎么都追不上、某个 collection 出现 jumbo chunk 无法分裂。这篇文章把我在几套 MongoDB 分片集群上的经验整理出来,希望能让你在分片之前少走一些弯路。
Redis Cluster 扩缩容与数据迁移实战:从 SETSLOT 到 Atomic Slot Migration2024-11-08·1346 字·7 分钟很多团队把 Redis Cluster 当成"开箱即用"的分布式 Redis,直到要做扩缩容或数据迁移时才发现:SETSLOT 协议里有十几种状态,迁移过程中客户端重定向要么不生效要么风暴,migrate 卡住没法断,big key 直接把迁移拖垮。这篇文章把我在几套千亿级 Cluster 上做过的扩缩容、迁移、救火全过一遍。