当前位置：主页 > 书籍配套资源 > Storm配套资源

《Storm分布式实时计算模式》源码

更新：2022-04-07
大小：3.4 MB
类别：Storm
作者：P.、Taylor、Goetz
出版：机械工业出版社
格式：PDF

资源介绍
相关推荐

大数据概念在各行业已然形成了热潮，犹胜当年的云计算，近期甚至被列入了国家重点发展规划。DataSift利用Twitter上的情感监控预测Facebook股价波动，Google预测世界杯比赛结果，大数据应用的生动案例每每会引发无限遐想：大数据能否对我们所处的行业或领域带来新气象、新思路？迈出尝试的第一步非常重要。

要从海量数据中提取加工对业务有用的信息，选取合适的技术将事半功倍，省去了重新造轮子的烦恼。对海量数据进行批处理运算，Hadoop依旧保持着无法撼动的地位。但在对实时性要求较高的应用场景中，Hadoop就显得力不从心。它需要将数据先落地存储到HDFS上，然后再通过MapReduce进行计算。这样的批处理运算流程使它很难将延时缩小到秒级。

Storm是基于数据流的实时处理系统，提供了大吞吐量的实时计算能力。每条数据到达系统时，立即在内存中进入处理流程，并在很短的时间内处理完成。实时性要求较高的数据分析场景，都可以尝试使用Storm作为技术解决方案。

我们已经决定利用大数据改善所在领域的工作，并选定Storm实时流式计算框架作为技术解决方案。这时候的问题是，如何将Storm和工作中的实际场景关联起来？这个开源项目的文档并不是非常丰富，源码中示例也很简单。类似的问题可能困扰过不少Storm用户。

我在看到本书英文版的介绍时，就感觉到，这正是我想要的，早有这本书能省去多少学习成本！本书并没有非常深入介绍Storm的内部实现，而是一本应用指南。其中最有价值的部分，是通过大量翔实的示例，使用Storm解决不同的实际应用场景，提出多种基于Storm的设计模式。读者完全可以参考书中示例和源码，来设计并实现自己的Storm应用。书中还简要介绍了Storm基本概念，以及大规模部署集群的方案，这些都是非常实用的内容。

作为Storm的一个忠实用户，能够承担本书的翻译工作实属荣幸。翻译的过程，也是深入学习加深了解的过程。学到作者丰富的Storm实践经验，是本次翻译的最大收获。希望这些经验也能够帮助读者少走弯路，快速高效地使用这个工具。

翻译过程中得到了很多人的帮助。首先感谢家人的包容和支持，困难时总有你们的鼓励。感谢腾讯安全平台部的同事们在学习工作中给予的帮助。感谢好友何双宁在翻译过程中提出的建议和探讨。感谢机械工业出版社编辑们的信任和支持。

非常高兴能将这本书分享给大家，也期望有兴趣的朋友一起探讨，共同进步。如果你有任何问题和建议，请联系我(appledzshr@live.cn)。