什么是消息队列?
MQ(Message Queue)消息队列或者叫消息队列中间件是分布式系统中的重要组件;其通用的使用场景可以简单的描述为:当不需要立即获得结果,但时并发量又需要控制的时候,就需要使用消息队列了。
消息队列也是消费者——生产者模型的典型代表:
- 一端,一个或多个生产者不断地往队列中写入消息
- 另一端,一个或多个消费者不断的从队列中读取消息来进行消费
- 通过队列解耦了两端的关联关系,甚至都感知不到彼此的存在
Python实现典型的生产者——消费者模型
"""
生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。
生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,
所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,
消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,
平衡了生产者和消费者的处理能力。
# 进程
# 一个进程就是一个生产者
# 一个进程就是一个消费者
# 队列
# 生产者和消费者之间的容器就是队列
"""
import time
import random
from multiprocessing import Process,Queue # Queue:进程队列
# from queue import Queue # 线程队列这么导入
def producer(q,name,food):
for i in range(10):
time.sleep(random.random())
fd = '%s%s'%(food,i)
q.put(fd)
print('%s生产了一个%s'%(name,food))
def consumer(q,name):
while True:
food = q.get()
if not food:break
time.sleep(random.randint(1,3))
print('%s吃了%s'%(name,food))
def cp(c_count,p_count):
"""
c_count: 消费者人数
p_count:生产者人数
"""
q = Queue(10)
for i in range(c_count):
Process(target=consumer, args=(q, '李不开')).start()
p_l = []
for i in range(p_count):
p1 = Process(target=producer, args=(q, '张开', '苹果'))
p1.start()
p_l.append(p1)
for p in p_l:p.join()
for i in range(c_count):
q.put(None)
if __name__ == "__main__":
cp(2,3)
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
为什么要用消息队列?
消息队列主要解决应用解耦、异步消息、流量削锋等问题,实现高性能、高可用、可伸缩和最终一致性架构。
应用解耦
场景:以电商平台为例,当产生订单后,需要订单系统调用库存系统。传统的做法就是订单系统直接调用库存系统,但有个缺点,假如库存系统无法访问,则订单减库存将失败,从而导致订单失败。所以,订单系统与库存系统解耦合。
订单系统:用户下单后,订单系统完成持久化处理,将消息写入消息队列,返回用户订单下单成功。 库存系统:订阅下单的消息,采用拉/推的方式,获取下单信息,库存系统根据下单信息,进行库存操作。 假如:在下单时库存系统不能正常使用。也不影响正常下单,因为下单后,订单系统写入消息队列就不再关心其他的后续操作了,实现订单系统与库存系统的应用解耦。
异步消息
场景说明:用户注册后,需要发注册邮件和注册短信。传统的做法有两种:
- 串行方式:将注册信息写入数据库成功后,发送注册邮件,再发送注册短信。以上三个任务全部完成后,返回给客户端。
- 并行方式:将注册信息写入数据库成功后,发送注册邮件的同时,发送注册短信。以上三个任务完成后,返回给客户端。与串行的差别是,并行的方式可以提高处理的时间。
假设三个业务节点每个使用50毫秒钟,不考虑网络等其他开销,则串行方式的时间是150毫秒,并行的时间可能是100毫秒。
问题来了,如何提高性能?答案是引入消息队列,如下图进行架构改造:
按照以上约定,用户的响应时间相当于是注册信息写入数据库的时间,也就是50毫秒。注册邮件,发送短信写入消息队列后,直接返回,因此写入消息队列的速度很快,基本可以忽略,因此用户的响应时间可能是50毫秒。因此架构改变后,异步的效率比串行提高了三倍,比并行提高了两倍。
流量削峰
场景:秒杀活动,一般会因为流量过大,导致流量暴增,应用挂掉。为解决这个问题,一般需要在应用前端加入消息队列。
其中:
- 消息队列发挥的作用:
- 可以控制活动的人数
- 可以缓解短时间内高流量压垮应用
- 用户的请求,服务器接收后,首先写入消息队列。假如消息队列长度超过最大数量,则直接抛弃用户请求或跳转到错误页面。
- 秒杀业务根据消息队列中的请求信息,再做后续处理。
其他的,应用场景也很多,包括在日志中、在消息通信中都发挥着不可替代的作用。这里不再一一举例了。
消息队列的常见模式
点对点模式
- 每个消息只有一个接收者(Consumer)(即一旦被消费,消息就不再在消息队列中)
- 发送者和接收者间没有依赖性,发送者发送消息之后,不管有没有接收者在运行,都不会影响到发送者下次发送消息
- 接收者在成功接收消息之后需向队列应答成功,以便消息队列删除当前接收的消息
发布-订阅模式
- 每个消息可以有多个订阅者
- 发布者和订阅者之间有时间上的依赖性。针对某个主题(Topic)的订阅者,它必须创建一个订阅者之后,才能消费发布者的消息
- 为了消费消息,订阅者需要提前订阅该角色主题,并保持在线运行
常用的消息队列软件
使用较多的消息队列软件有:
ActiveMQ
ActiveMQ是由Apache出品,ActiveMQ 是一个完全支持JMS1.1
和J2EE 1.4
规范的 JMS Provider
实现。它非常快速,支持多种语言的客户端和协议,而且可以非常容易的嵌入到企业的应用环境中,并有许多高级功能。
- 主要特性:
- 服从 JMS 规范:JMS 规范提供了良好的标准和保证,包括:同步或异步的消息分发,一次和仅一次的消息分发,消息接收和订阅等等。遵从 JMS 规范的好处在于,不论使用什么 JMS 实现提供者,这些基础特性都是可用的
- 连接性:ActiveMQ 提供了广泛的连接选项,支持的协议有:HTTP/S,IP 多播,SSL,STOMP,TCP,UDP,XMPP等等。对众多协议的支持让 ActiveMQ 拥有了很好的灵活性
- 支持的协议种类多:OpenWire、STOMP、REST、XMPP、AMQP
- 持久化插件和安全插件:ActiveMQ 提供了多种持久化选择。而且,ActiveMQ 的安全性也可以完全依据用户需求进行自定义鉴权和授权
- 支持的客户端语言种类多:除了 Java 之外,还有:C/C++,.NET,Perl,PHP,Python,Ruby
- 代理集群:多个 ActiveMQ 代理可以组成一个集群来提供服务
- 异常简单的管理:ActiveMQ 是以开发者思维被设计的。所以,它并不需要专门的管理员,因为它提供了简单又使用的管理特性。有很多中方法可以监控 ActiveMQ 不同层面的数据,包括使用在 JConsole 或者 ActiveMQ 的Web Console 中使用 JMX,通过处理 JMX 的告警消息,通过使用命令行脚本,甚至可以通过监控各种类型的日志
- 安装需要:
- Java JDK
- ActiveMQ安装包
- 优点:
- 跨平台(JAVA编写与平台无关有,ActiveMQ几乎可以运行在任何的JVM上)
- 可以用JDBC:可以将数据持久化到数据库。虽然使用JDBC会降低ActiveMQ的性能,但是数据库一直都是开发人员最熟悉的存储介质。将消息存到数据库,看得见摸得着。而且公司有专门的DBA去对数据库进行调优,主从分离
- 支持JMS :支持JMS的统一接口
- 支持自动重连
- 有安全机制:支持基于shiro,jaas等多种安全配置机制,可以对Queue/Topic进行认证和授权
- 监控完善:拥有完善的监控,包括Web Console,JMX,Shell命令行,Jolokia的REST API
- 界面友善:提供的Web Console可以满足大部分情况,还有很多第三方的组件可以使用,如hawtio
- 缺点:
- 社区活跃度不及RabbitMQ高
- 根据其他用户反馈,会出莫名其妙的问题,会丢失消息
- 目前重心放到activemq6.0产品-apollo,对5.x的维护较少
- 不适合用于上千个队列的应用场景
RocketMQ
RocketMQ出自阿里公司的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进,消息可靠性上比 Kafka 更好。RocketMQ在阿里集团被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。
- 主要特性:
- 是一个队列模型的消息中间件,具有高性能、高可靠、高实时、分布式特点
- Producer、Consumer、队列都可以分布式
- Producer向一些队列轮流发送消息,队列集合称为Topic,Consumer如果做广播消费,则一个consumer实例消费这个Topic对应的所有队列,如果做集群消费,则多个Consumer实例平均消费这个topic对应的队列集合
- 能够保证严格的消息顺序
- 提供丰富的消息拉取模式
- 高效的订阅者水平扩展能力
- 实时的消息订阅机制
- 亿级消息堆积能力
- 较少的依赖
- 安装需要:
- Java JDK
- 安装git、Maven
- RocketMQ安装包
- 优点:
- 单机支持 1 万以上持久化队列
- RocketMQ 的所有消息都是持久化的,先写入系统 PAGECACHE,然后刷盘,可以保证内存与磁盘都有一份数据,访问时,直接从内存读取
- 模型简单,接口易用(JMS 的接口很多场合并不太实用)
- 性能非常好,可以大量堆积消息在broker中
- 支持多种消费,包括集群消费、广播消费等
- 各个环节分布式扩展设计,主从HA
- 开发度较活跃,版本更新很快
- 缺点:
- 支持的客户端语言不多,目前是java及c++,其中c++不成熟
- RocketMQ社区关注度及成熟度也不及前两者
- 没有web管理界面,提供了一个CLI(命令行界面)管理工具带来查询、管理和诊断各种问题
- 没有在 mq 核心中去实现JMS等接口
Kafka
Apache Kafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的提交日志系统( a distributed commit log),之后成为Apache项目的一部分。Kafka系统快速、可扩展并且可持久化。它的分区特性,可复制和可容错都是其不错的特性。
- 主要特性:
- 快速持久化,可以在O(1)的系统开销下进行消息持久化
- 高吞吐,在一台普通的服务器上既可以达到10W/s的吞吐速率
- 完全的分布式系统,Broker、Producer、Consumer都原生自动支持分布式,自动实现负载均衡
- 支持同步和异步复制两种HA
- 支持数据批量发送和拉取
- zero-copy:减少IO操作步骤
- 数据迁移、扩容对用户透明
- 无需停机即可扩展机器
- 其他特性:严格的消息顺序、丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制
- 安装需要:
- Java JDK
- Kafka安装包
- 优点:
- 客户端语言丰富,支持java、.net、php、ruby、python、go等多种语言
- 性能卓越,单机写入TPS约在百万条/秒,消息大小10个字节
- 提供完全分布式架构, 并有replica机制, 拥有较高的可用性和可靠性, 理论上支持消息无限堆积
- 支持批量操作
- 消费者采用Pull方式获取消息, 消息有序, 通过控制能够保证所有消息被消费且仅被消费一次
- 有优秀的第三方Kafka Web管理界面Kafka-Manager
- 在日志领域比较成熟,被多家公司和多个开源项目使用
- 缺点:
- Kafka单机超过64个队列/分区,Load会发生明显的飙高现象,队列越多,load越高,发送消息响应时间变长
- 使用短轮询方式,实时性取决于轮询间隔时间
- 消费失败不支持重试
- 支持消息顺序,但是一台代理宕机后,就会产生消息乱序
- 社区更新较慢
RabbitMQ
RabbitMQ 2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。
- 主要特性:
- 可靠性: 提供了多种技术可以让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证实和高可用性机制
- 灵活的路由: 消息在到达队列前是通过交换机进行路由的。RabbitMQ为典型的路由逻辑提供了多种内置交换机类型。如果你有更复杂的路由需求,可以将这些交换机组合起来使用,你甚至可以实现自己的交换机类型,并且当做RabbitMQ的插件来使用
- 消息集群:在相同局域网中的多个RabbitMQ服务器可以聚合在一起,作为一个独立的逻辑代理来使用
- 队列高可用:队列可以在集群中的机器上进行镜像,以确保在硬件问题下还保证消息安全
- 多种协议的支持:支持多种消息队列协议
- 服务器端用Erlang语言编写,支持只要是你能想到的所有编程语言
- 管理界面: RabbitMQ有一个易用的用户界面,使得用户可以监控和管理消息Broker的许多方面
- 跟踪机制:如果消息异常,RabbitMQ提供消息跟踪机制,使用者可以找出发生了什么
- 插件机制:提供了许多插件,来从多方面进行扩展,也可以编写自己的插件
- 安装需要:
- ErLang语言包
- RabbitMQ安装包
- 优点:
- 由于erlang语言的特性,mq 性能较好,高并发
- 健壮、稳定、易用、跨平台、支持多种语言、文档齐全
- 有消息确认机制和持久化机制,可靠性高
- 高度可定制的路由
- 管理界面较丰富,在互联网公司也有较大规模的应用
- 社区活跃度高
- 缺点:
- 尽管结合erlang语言本身的并发优势,性能较好,但是不利于做二次开发和维护
- 实现了代理架构,意味着消息在发送到客户端之前可以在中央节点上排队。此特性使得RabbitMQ易于使用和部署,但是使得其运行速度较慢,因为中央节点增加了延迟,消息封装后也比较大
- 需要学习比较复杂的接口和协议,学习和维护成本较高
对比:
更多对比参考:https://dbaplus.cn/news-159-2611-1.html
Kafka在于分布式架构,RabbitMQ基于AMQP协议来实现,RocketMQ/思路来源于kafka,改成了主从结构,在事务性可靠性方面做了优化。广泛来说,电商、金融等对事务性要求很高的,可以考虑RabbitMQ和RocketMQ,对性能要求高的可考虑Kafka。 本节参考:https://blog.csdn.net/stream_who/article/details/88184879
that's all,see also:
python – 获取RabbitMQ队列中的消息数 | python监控rabbitmq的消息队列数量 | Docker实战:Docker安装部署RabbitMQ | MQ - RabbitMQ - 架构及工作原理 | docker 安装rabbitMQ | 理解 RabbitMQ Exchange | RabbitMQ系列教程(六)RabbitMQ Exchange类型之headers Exchange | 消息队列 | python - pika模块的使用中,如何动态的删除一个 durable=True 的持久化队列?