Apache Storm 是一个基于 ZK 协调的分布式任务实时调度系统,属于流式(实时)计算引擎的一类。在目前的大数据和人工智能背景下流式计算是公司大部分业务的刚性需求,能够实现在百十毫秒内完成对用户行为的计算并执行具体的策略,例如依据用户的行为对其实施风控等。
当下市面上已有很多流式计算引擎产品,但是 Storm 的出现基本上统一了这一领域,不过近几年也出现了一些新的产品可以撼动 Storm 的地位,比如 Apache Flink、Apache Spark-Streaming 等。不可否认的是,现阶段还是有很多公司的业务运行在 Storm 集群上,这样一个毫秒级延迟的分布式实时计算引擎还是有很多地方值得我们一起去探寻其设计与实现原理。