TiDB Binlog 源码阅读系列文章（二）初识 TiDB Binlog 源码

作者：satoru

TiDB Binlog 架构简介

TiDB Binlog 主要由 Pump 和 Drainer 两部分组成，其中 Pump 负责存储 TiDB 产生的 binlog 并向 Drainer 提供按时间戳查询和读取 binlog 的服务，Drainer 负责将获取后的 binlog 合并排序再以合适的格式保存到对接的下游组件。

在《TiDB Binlog 架构演进与实现原理》一文中，我们对 TiDB Binlog 整体架构有更详细的说明，建议先行阅读该文。

启动测试集群

上个小节提到的 tests 目录里有一个名为 run.sh 脚本，我们一般会使用 make integration_test 命令，通过该脚本执行一次完整的集成测试，不过现在我们先介绍如何用它来启动一个测试集群。

启动测试集群前，需要在 bin 目录下准备好相关组件的可执行文件：

pd-server：下载链接（Linux / macOS）
tikv-server：下载链接（Linux / macOS）
tidb-server：下载链接（Linux / macOS）
pump, drainer, binlogctl：在 tidb-binlog 目录执行 make build

脚本依赖 MySQL 命令行客户端来确定 TiDB 已经成功启动，所以我们还需要安装一个 MySQL 客户端。

准备好以上依赖，运行 tests/run.sh --debug，就可以启动一个测试集群。启动过程中会输出一些进度信息，看到以下提示就说明亿成功启动：

Starting Drainer...
You may now debug from another terminal. Press [ENTER] to continue.

测试集群包含以下服务：

2 个作为上游的 TiDB 实例，分别使用端口 4000 和 4001
1 个作为下游的 TiDB 实例，使用端口 3306
PD 实例，使用端口 2379
TiKV，使用端口 20160
Pump ，使用端口 8250
Drainer，使用端口 8249

使用 MySQL 客户端连接任意一个上游 TiDB，可以用 SHOW PUMP STATUS 和 SHOW DRAINER STATUS 查询对应工具的运行状态，例如：

TiDB Binlog 源码阅读系列文章（二）初识 TiDB Binlog 源码

通过 binlogctl 也可以查询到同样的信息，例如：

$ bin/binlogctl -pd-urls=localhost:2379 -cmd pumps
[2019/06/26 14:36:29.158 +08:00] [INFO] [nodes.go:49] ["query node"] [type=pump] [node="{NodeID: pump:8250, Addr: 127.0.0.1:8250, State: online, MaxCommitTS: 409345979065827329, UpdateTime: 2019-06-26 14:36:27 +0800 CST}"]

接下来我们可以用 MySQL 客户端连接上端口为 4000 或 4001 的 TiDB 数据库，插入一些测试数据。

TiDB Binlog 源码阅读系列文章（二）初识 TiDB Binlog 源码