1. 概述
Zookeeper 是一个开源的分布式的,为分布式应用提供协调服务的 Apache 项目。
Zookeeper 从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper 就将负责通知已经在 Zookeeper 上注册的那些观察者做出相应的反应。
2. 特点
- Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
- 集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。
- 全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的。
- 更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行。
- 数据更新原子性,一次数据更新要么成功,要么失败。
- 实时性,在一定时间范围内,Client能读到最新数据。
3. 数据结构
ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树, 每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 1MB 的数据, 每个 ZNode 都可以通过其路径唯一标识。
4. 应用场景
4.1 统一命名服务
在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。(IP不容易记住,而域名容易记住)
4.2 统一配置管理
- 分布式环境下,配置文件同步非常常见。
- 一般要求一个集群中,所有节点的配置信息是一致的,比如 Kafka 集群。
- 对配置文件修改后,希望能够快速同步到各个节点上。
- 配置管理可交由ZooKeeper实现。
- 可将配置信息写入ZooKeeper上的一个Znode。
- 各个客户端服务器监听这个Znode。
- 一旦Znode中的数据被修改,ZooKeeper将通知各个客户端服务器。
4.3 统一集群管理
- 分布式环境中,实时掌握每个节点的状态是必要的。
- 可根据节点实时状态做出一些调整。
- ZooKeeper可以实现实时监控节点状态变化。
- 可将节点信息写入ZooKeeper上的一个ZNode。
- 监听这个ZNode可获取它的实时状态变化。
4.4 服务器动态上下线
4.5 软负载均衡
在Zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。
5. Zookeeper安装
5.1 安装
5.1.1 安装前准备
1. 安装 JDK
2. 拷贝 apache-zookeeper-3.5.7-bin.tar.gz 安装包到 Linux 系统下
3. 解压到指定目录
tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt/module/
4. 修改名称
mv apache-zookeeper-3.5.7 -bin/ zookeeper-3.5.7
5.1.2 配置修改
1. 将/opt/module/zookeeper-3.5.7/conf 这个路径下的 zoo_sample.cfg 修改为 zoo.cfg
mv zoo_sample.cfg zoo.cfg
2. 打开 zoo.cfg 文件,修改 dataDir 路径
vim zoo.cfg
修改如下内容:
dataDir=/opt/module/zookeeper-3.5.7/zkData
3. 在/opt/module/zookeeper-3.5.7/这个目录上创建 zkData 文件夹
mkdir zkData
5.1.3 操作 Zookeeper
1. 启动 Zookeeper
bin/zkServer.sh start
2. 查看进程是否启动
jps
4020 Jps
4001 QuorumPeerMain
3. 查看状态
bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/module/zookeeper-3.5.7/bin/../conf/zoo.cfg
Mode: standalone
4. 启动客户端
bin/zkCli.sh
5. 退出客户端
quit
6. 停止 Zookeeper
bin/zkServer.sh stop
5.2 配置参数解读
Zookeeper 中的配置文件 zoo.cfg 中参数含义解读如下:
- ickTime=2000: 通信心跳数, Zookeeper 服务器与客户端心跳时间,单位毫秒。
- Zookeeper 使用的基本时间,服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳,时间单位为毫秒。 它用于心跳机制,并且设置最小的 session 超时时间为两倍心跳时间。 (session 的最小超时时间是 2*tickTime)
- initLimit=10: LF 初始通信时限
- 集群中的 Follower 跟随者服务器与 Leader 领导者服务器之间初始连接时能容忍的最多心跳数(tickTime 的数量),用它来限定集群中的 Zookeeper 服务器连接到 Leader 的时限。
- syncLimit=5: LF 同步通信时限
- 集群中 Leader 与 Follower 之间的最大响应时间单位,假如响应超过 syncLimit * tickTime, Leader 认为 Follwer 死掉,从服务器列表中删除 Follwer。
- dataDir:数据文件目录 + 数据持久化路径
- 主要用于保存 Zookeeper 中的数据。
- clientPort =2181:客户端连接端口
- 监听客户端连接的端口,通常不做修改。
© 版权声明
THE END
暂无评论内容