当前位置:网站首页>嘘!异步事件这样用真的好么?

嘘!异步事件这样用真的好么?

2020-11-06 01:33:00 尹吉欢

故事背景

今年年初的时候写了一篇文章 《围观:基于事件机制的内部解耦之心路历程》。这篇文章主要讲的是用 ES 数据异构的场景。程序订阅 Mysql Binlog 的变更,然后程序内部使用 Spring Event 来分发具体的事件,因为一个表的数据变更可能会需要更新多个 ES 索引。

为了方便大家理解我把之前方案的图片复制过来了,如下:

上图的方案存在一个问题,就是我们今天文章要聊的内容。

这个问题就是当 MQ Consumer 收到消息后,就直接发布 Event 了,如果是同步的,没有问题。如果某个 EventListener 中处理失败了,那么这条消息将不会 ACK。

如果是异步发布 Event 的场景,发布完消息马上就 ACK 了。就算某个 EventListener 中处理失败了,MQ 也感知不到,不会进行消息的重新投递,这就是存在的问题。

解决方案

方案一

既然消息已经 ACK 了,那就不利用 MQ 的重试功能了,使用方自己重试是不是也可以呢?

可肯定是可以的,内部处理是否成功肯定是可以知道的,如果处理失败了可以默认重试,或者有一定策略的重试。实在不行还可以落库,保存记录。

这样的问题在于太烦了呀,每个使用的地方都要去做这件事情,而且对于未来接手你代码的程序小哥哥来说,这很有可能让小哥哥头发慢慢脱落啊。。。。

脱落不要紧,关键他还不知道要做这个处理,说不定哪天就背锅了,惨兮兮。。。。

方案二

要保证消息和业务处理的一致性,就不能立马进行 ACK 操作。而是要等业务处理完成后再决定是否要 ACK。

如果有处理失败的就不应该 ACK,这样就能复用 MQ 的重试机制了。

分析下来,这就是一个典型的异步转同步的场景。像 Dubbo 中也有这个场景,所以我们可以借鉴 Dubbo 中的实现思路。

创建一个 DefaultFuture 用于同步等待获取任务执行结果。然后在 MQ 消费的地方使用 DefaultFuture。

  
  1. @Service
  2. @RocketMQMessageListener(topic = "${rocketmq.topic.data_change}", consumerGroup = "${rocketmq.group.data_change_consumer}")
  3. public class DataChangeConsume implements RocketMQListener<DataChangeRequest> {
  4. @Autowired
  5. private ApplicationContext applicationContext;
  6. @Autowired
  7. private CustomApplicationContextAware customApplicationContextAware;
  8. @Override
  9. public void onMessage(DataChangeRequest dataChangeRequest) {
  10. log.info("received message {} , Thread {}", dataChangeRequest, Thread.currentThread().getName());
  11. DataChangeEvent event = new DataChangeEvent(this);
  12. event.setChangeType(dataChangeRequest.getChangeType());
  13. event.setTable(dataChangeRequest.getTable());
  14. event.setMessageId(dataChangeRequest.getMessageId());
  15. DefaultFuture defaultFuture = DefaultFuture.newFuture(dataChangeRequest, customApplicationContextAware.getTaskCount(), 6000 * 10);
  16. applicationContext.publishEvent(event);
  17. Boolean result = defaultFuture.get();
  18. log.info("MessageId {} 处理结果 {}", dataChangeRequest.getMessageId(), result);
  19. if (!result) {
  20. throw new RuntimeException("处理失败,不进行消息ACK,等待下次重试");
  21. }
  22. }
  23. }

newFuture() 会传入事件参数,超时时间,任务数量几个参数。任务数量是用于判断所有 EventListener 是否全部执行完成。

defaultFuture.get(); 这不就会阻塞,等待所有任务执行完成才会返回结果,如果所有业务都处理成功了,那么会返回 true,流程结束,消息自动 ACK。

如果返回了 false 证明有处理失败的或者超时的,就不需要 ACK 了,抛出异常等待重试。

  
  1. public Boolean get() {
  2. if (isDone()) {
  3. return true;
  4. }
  5. long start = System.currentTimeMillis();
  6. lock.lock();
  7. try {
  8. while (!isDone()) {
  9. done.await(timeout, TimeUnit.MILLISECONDS);
  10. // 有失败的任务反馈
  11. if (!isSuccessDone()) {
  12. return false;
  13. }
  14. // 全部执行成功
  15. if (isDone()) {
  16. return true;
  17. }
  18. // 超时
  19. if (System.currentTimeMillis() - start > timeout) {
  20. return false;
  21. }
  22. }
  23. } catch (InterruptedException e) {
  24. throw new RuntimeException(e);
  25. } finally {
  26. lock.unlock();
  27. }
  28. return true;
  29. }

isDone() 会判断反馈结果了的任务数量跟总数量是否一致,如果一致就说明全部执行完成了。

  
  1. public boolean isDone() {
  2. return feedbackResultCount.get() == taskCount;
  3. }

那么任务执行完了怎么反馈呢? 不可能让每个使用的方法去关心,所以我们定义了一个切面来做这件事情。

  
  1. @Aspect
  2. @Component
  3. public class EventListenerAspect {
  4. @Around(value = "@annotation(eventListener)")
  5. public Object aroundAdvice(ProceedingJoinPoint joinpoint, EventListener eventListener) throws Throwable {
  6. DataChangeEvent event = null;
  7. boolean executeResult = true;
  8. try {
  9. event = (DataChangeEvent)joinpoint.getArgs()[0];
  10. Object result = joinpoint.proceed();
  11. return result;
  12. } catch (Exception e) {
  13. executeResult = false;
  14. throw e;
  15. } finally {
  16. DefaultFuture.received(event.getMessageId(), executeResult);
  17. }
  18. }
  19. }

通过 DefaultFuture.received() 反馈执行结果。

  
  1. public static void received(String id, boolean result) {
  2. DefaultFuture future = FUTURES.get(id);
  3. if (future != null) {
  4. // 累加失败任务数量
  5. if (!result) {
  6. future.feedbackFailResultCount.incrementAndGet();
  7. }
  8. // 累加执行完成任务数量
  9. future.feedbackResultCount.incrementAndGet();
  10. if (future.isDone()) {
  11. FUTURES.remove(id);
  12. future.doReceived();
  13. }
  14. }
  15. }
  16. private void doReceived() {
  17. lock.lock();
  18. try {
  19. if (done != null) {
  20. // 唤醒阻塞的线程
  21. done.signal();
  22. }
  23. } finally {
  24. lock.unlock();
  25. }
  26. }

下面我们来总结整个流程:

  • 收到 MQ 消息,组装成 DefaultFuture,通过 get 方法获取执行结果,未执行完的时候此方法阻塞。
  • 通过切面切入加了 EventListener 的方法,判断是否有异常来判断任务的执行结果。
  • 通过 DefaultFuture.received() 反馈结果。
  • 反馈时计算是否全部完成,全部完成则唤醒阻塞的线程。DefaultFuture.get()就能获取到结果。
  • 是否要进行 ACK 操作。

需要注意的是每个 EventListener 内部消费的逻辑都要做幂等控制。

源码地址:https://github.com/yinjihuan/kitty-cloud/tree/master/kitty-cloud-mqconsume

关于作者:尹吉欢,简单的技术爱好者,《Spring Cloud 微服务-全栈技术与案例解析》, 《Spring Cloud 微服务 入门 实战与进阶》作者, 公众号 猿天地 发起人。个人微信 jihuan900,欢迎勾搭。

我整理了一份很全的学习资料,感兴趣的可以微信搜索 「猿天地」,回复关键字 「学习资料」获取我整理好了的Spring Cloud,Spring Cloud Alibaba,Sharding-JDBC分库分表,任务调度框架XXL-JOB,MongoDB,爬虫等相关资料。

版权声明
本文为[尹吉欢]所创,转载请带上原文链接,感谢
http://cxytiandi.com/blog/detail/36489