2016-11-05

Kafka学习笔记整理

Apache Kafka是分布式发布-订阅消息系统…….

Kafka的基本介绍

Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发，之后成为Apache项目的一部分。具有快速、可扩展、分布式、可复制等特点。Kafka与传统消息系统相比，有以下不同：

它被设计为一个分布式系统，易于向外扩展
它同时为发布和订阅提供高吞吐量
它支持多订阅者，当失败时能自动平衡消费者
它将消息持久化到磁盘，因此可用于批量消费

架构

模型图
如上图所示，一个典型的kafka集群中包含若干producer（可以是web前端产生的page view，或者是服务器日志，系统CPU、memory等），若干broker（Kafka支持水平扩展，一般broker数量越多，集群吞吐率越高），若干consumer group，以及一个Zookeeper集群。Kafka通过Zookeeper管理集群配置，选举leader，以及在consumer group发生变化时进行rebalance。producer使用push模式将消息发布到broker，consumer使用pull模式从broker订阅并消费消息。

Kafka的配置参数

可在$KAFKA_HOME/config/server.properties文件中指定如下参数：

#当前broker的ID
broker.id=0
#broker服务监控的端口
port=9092
#当前broker的主机名，可以是IP地址
host.name=172.16.3.233
#创建topic时，默认的分区数量
num.partitions=1
#基于时间删除消息，与基于分区容量删除消息，为两种删除策略，哪种先达到，哪种就触发
log.retention.hours=168
#基于分区容量删除消息
log.retention.bytes=1073741824
#partition级别的复制数量
default.replication.factor = 1
#zookeeper的连接IP及端口
zookeeper.connect=localhost:2181

Kafka的常用命令

#启动zookeeper服务器
bin/zookeeper-server-start.sh  config/zookeeper.properties
#启动kafka server
bin/kafka-server-start.sh config/server.properties
#创建topic
bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
#list topic
bin/kafka-topics.sh --list --zookeeper localhost:2181
#向broker发送数据
bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
#从broker拉取数据
bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning

小周私记

Stay hungry，Stay foolish.

Kafka学习笔记整理

Kafka的基本介绍

相关概念

1. topic

2. partition

3. broker

4. 生产者

5. 消费者

架构

Kafka的配置参数

Kafka的常用命令