Kafka VS RocketMQ VS RabbitMQ-白红宇

-	-	kafka	RocketMQ	RabbitMQ	数据来源	相关文章
定位	设计定位	系统间的数据流管道，实时数据处理。例如：常规的消息系统、网站活性跟踪，监控数据，日志收集、处理等	非日志的可靠消息传输。例如：订单，交易，充值，流计算，消息推送，日志流式处理，binglog分发等	可靠消息传输。和RocketMQ类似。
基础对比	成熟度	日志领域成熟	成熟	成熟
	所属社区／公司	Apache	Alibaba开发，已加入到Apache下	Mozilla Public License
	社区活跃度	高	中	高	来源于网络
	API完备性	高	高	高
	文档完备性	高	高	高	来源于网络
	开发语言	Scala	Java	Erlang
	支持协议	一套自行设计的基于TCP的二进制协议	自己定义的一套 (社区提供JMS--不成熟)	AMQP
	客户端语言	C/C++、Python、Go、Erlang、.NET、Ruby、Node.js、PHP等	Java	Java、C、 C++、 Python、 PHP、Perl 等
	持久化方式	磁盘文件	磁盘文件	内存、文件
可用性、可靠性比较	部署方式	单机／集群	单机／集群	单机／集群
	集群管理	zookeeper	name server
	选主方式	从ISR中自动选举一个leader	不支持自动选主。通过设定brokername、brokerId实现，brokername相同，brokerid=0时为maser，其他为slave	最早加入集群的broker
	可用性	非常高分布式、主从	非常高分布式、主从	高主从，采用镜像模式实现，数据量大时可能产生性能瓶颈	rabbitMQ集群部署 http://www.cnblogs.com/knowledgesea/p/6535766.html RabbitMQ可用性、可靠性分析 http://blog.csdn.net/cadem/article/details/53422912?utm_source=itdadao&utm_medium=referral
	主从切换	自动切换 N个副本，允许N-1个失效；master失效以后自动从isr中选择一个主；	不支持自动切换 master失效以后不能向master发送信息，consumer大概30s（默认）可以感知此事件，此后从slave消费；如果master无法恢复，异步复制时可能出现部分信息丢失	自动切换最早加入集群的slave会成为master；因为新加入的slave不同步master之前的数据，所以可能会出现部分数据丢失
	数据可靠性	很好支持producer单条发送、同步刷盘、同步复制、异步。	很好 producer单条发送，broker端支持同步刷盘、异步刷盘，同步双写，异步复制。	好 producer支持同步／异步ack。支持队列数据持久化，镜像模式中支持主从同步	kafka也同步刷盘，但是效率较低 http://jm.taobao.org/2016/04/28/kafka-vs-rocktemq-4/
	消息写入性能	非常好每条10个字节测试：百万条/s	很好每条10个字节测试：单机单broker约7w/s，单机3个broker约12w/s	RAM约为RocketMQ的1/2， Disk的性能约为RAM性能的1/3	数据来源于网络单条消息的数据量越小，性能对比时kafka表现越好	kafka vs RocktMQ： https://engineering.linkedin.com/kafka/benchmarking-apache-kafka-2-million-writes-second-three-cheap-machines kafka vs RocktMQ VS RabbitMQ http://www.cnblogs.com/felixzh/p/6198070.html http://ju.outofmemory.cn/entry/177937
	性能的稳定性	队列/分区多时性能不稳定，明显下降。消息堆积时性能稳定	队列较多、消息堆积时性能稳定	消息堆积时，性能不稳定、明显下降
	单机支持的队列数	单机超过64个队列/分区，Load会发生明显的飙高现象，队列越多，load越高，发送消息响应时间变长	单机支持最高5万个队列，Load不会发生明显变化	依赖于内存	数据来源于网络测评 kafka新能降低是因为topic增多时，顺序写变成了随机写	Kafka vs RocketMQ: Topic数量对单机性能的影响 http://jm.taobao.org/2016/04/07/kafka-vs-rocketmq-topic-amout/?utm_source=tuicool&utm_medium=referral
	堆积能力	非常好消息存储在log中，每个分区由一个或多个segment log文件	非常好所有消息存储在同一个commit log中	一般生产者、消费者正常时，性能表现稳定；消费者不消费时，性能不稳定	http://www.cnblogs.com/purpleraintear/p/6033136.html
	复制备份	消息先写入leader的log，followers从leader中pull数据，pull到数据以后先ack leader，然后写入log中。 ISR中维护与leader同步的列表，落后太多的follwer会被删除掉	同步双写异步复制：slave启动线程从master中拉数据	普通模式下不复制；镜像模式下：消息先到mster，然后写到slave上。加入集群之前的消息不会被复制到新的slave上。
	消息投递实时性	毫秒级具体由consumer轮询间隔时间决定	毫秒级支持pull、push两种模式，延时通常在毫秒级	毫秒级
功能对比	顺序消费	支持顺序消费但是一台Broker宕机后，就会产生消息乱序(来自网上，尚未找到原因）	支持顺序消费在顺序消息场景下，消费失败时消费队列将会暂停	支持顺序消费
	定时消息	不支持	开源版本仅支持定时Level	不支持
	事务消息	不支持	支持	不支持
	Broker端消息过滤	不支持	支持通过tag过滤，类似于子topic	不支持
	消息查询	不支持	支持根据MessageId查询支持根据MessageKey查询消息	不支持
	消费失败重试	不支持失败重试 offset存储在consumer中，无法保证。 0.8.2版本后支持将offset存储在zk中	支持失败重试 offset存储在broker中	支持失败重试
	消息重新消费	支持通过修改offset来重新消费	支持按照时间来重新消息
	发送端负载均衡	可自由指定	可自由指定	需要单独loadbalancer支持
	消费并行度	消费并行度和分区数一致	顺序消费：消费并行度和分区数一致乱序消费：消费服务器的消费线程数之和	可一次抓取多条一起消费。镜像模式下其实也是从master消费
	消费方式	consumer pull	consumer pull ／broker push	broker push
	批量发送	支持默认producer缓存、压缩，然后批量发送	不支持	不支持
	消息清理	指定文件保存时间，过期删除	指定文件保存时间，过期删除	Consumer ack以后，消息将被标记为删除可用内存少于40%（默认），触发gc，gc时找到相邻的两个文件，合并right文件到left。
运维	系统维护	Scala语言开发，维护成本高	java语言开发，维护成本低	Erlang语言开发，维护成本高
	部署依赖	zookeeper	nameserver	Erlang环境
	管理后台	官网不提供，第三方开源管理工具可供使用；不用重新开发	官方提供，rocketmq-console	官方提供rabbitmqadmin	kafka管理后台比较；http://top.jobbole.com/31084/
	管理后台功能	Kafka Web Conslole Brokers列表；Kafka 集群中 Topic列表，及对应的Partition、LogSize等信息；Topic对应的Consumer Groups、Offset、Lag等信息；生产和消费流量图、消息预览 KafkaOffsetMonitor： Kafka集群状态；Topic、Consumer Group列表；图形化展示topic和consumer之间的关系；图形化展示consumer的Offset、Lag等信息 Kafka Manager 管理几个不同的集群；监控集群的状态(topics, brokers, 副本分布, 分区分布)；产生分区分配(Generate partition assignments)基于集群的当前状态；重新分配分区	Cluster、Topic、Connection、NameServ、Message、Broker、Offset、Consumer	overview、connections、channels、exchanges、queues、admin
总结	优点	1、在高吞吐、低延迟、高可用、集群热扩展、集群容错上有非常好的表现； 2、producer端提供缓存、压缩功能，可节省性能，提高效率。 3、提供顺序消费能力 4、提供多种客户端语言 5、生态完善，在大数据处理方面有大量配套的设施。	1、在高吞吐、低延迟、高可用上有非常好的表现；消息堆积时，性能也很好。 2、api、系统设计都更加适在业务处理的场景。 3、支持多种消费方式。 4、支持broker消息过滤。 5、支持事务。 6、提供消息顺序消费能力；consumer可以水平扩展，消费能力很强。 7、集群规模在50台左右，单日处理消息上百亿；经历过大数据量的考验，比较稳定可靠。	1、在高吞吐量、高可用上较前两者有所不如。 2、支持多种客户端语言；支持amqp协议。 3、由于erlang语言的特性，性能也比较好; 使用RAM模式时，性能很好。 4、管理界面较丰富，在互联网公司也有较大规模的应用;	数据来自网络
总结	缺点	1、消费集群数目受到分区数目的限制。 2、单机topic多时，性能会明显降低。 3、不支持事务	1、相比于kafka，使用者较少，生态不够完善。消息堆积、吞吐率上也有所不如。 2、不支持主从自动切换，master失效后，消费者需要一定的时间才能感知。 3、客户端只支持Java	1、erlang 语言难度较大。集群不支持动态扩展。 2、不支持事务、消息吞吐能力有限 3、消息堆积时，性能会明显降低