当前位置：主页 > 书籍配套资源 > Python配套资源

《预测分析：Python语言实现》源码

更新：2022-02-27
大小：25.18 MB
类别：Python
作者：约瑟夫?巴布科克
出版：机械工业出版社
格式：PDF

资源介绍
相关推荐

2016年初发生的一件事，让人们对于人工智能的迅速发展刮目相看，即由谷歌开发的人工智能机器人程序AlphaGo战胜了人类围棋世界冠军职业九段棋手李世石，最终比分为4∶1。在此之后，AlphaGo一路过关斩将，与世界上数十位围棋高手对战，竟然无一失败，可谓是战绩辉煌。
毫无疑问，在围棋领域，AlphaGo已经明显超越了一般人类的智能水平。它的设计和开发涉及了很多的核心技术，深度学习就是其中之一。所谓深度学习，就是指多层的人工神经网络以及对神经网络进行训练和优化的方法。前面一层神经网络把大量数据矩阵化之后作为输入，通过非线性激活方法计算权重，再产生另一个数据集合，以此作为输出，同时也作为后面一层神经网络的输入。这个过程就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接在一起，形成神经网络“大脑”，对数据进行精准复杂的处理，既使得处理速度得以提高，又使得处理的准确度和精确度也达到了一个非常高的水平。
深度学习和人工神经网络是典型的无监督学习算法之一，其他典型的无监督学习算法还包括分组和聚类，在这些算法当中，由于不需要事先有典型的输入和输出作为训练样本，因此具有极大的灵活性。此外还有分类和回归等有监督学习算法和半监督学习方法。这些机器学习算法在大数据处理方面有着各自的应用场景，如果应用得当，将会使大数据处理如虎添翼。

AlphaGo只是机器学习技术与大数据相结合的典型案例之一。移动互联网和物联网（IOT）的飞速发展，使人类社会累积数据的速度达到前所未有的程度，这里所谓的大数据包括几乎一切形式的结构化、半结构化以及非结构化的数据，例如网络日志、音频、视频、图片、地理位置信息等。因此，如何对这些数据进行高效的采集、存储、处理并从中发掘到有价值的信息，就是大数据分析处理需要解决的问题。具体来说就是时下比较热门的几个技术热点：物联网和工业物联网（IIoT），主要解决的是数据的采集问题；云计算，主要解决高效存储和计算问题；数据分析技术，主要解决如何有效对数据进行挖掘，并从中发现应用价值的问题。本书主要关注数据分析技术之一，即预测性分析技术，以及如何将分析结果以可视化的方式展现给利益相关者。当然，数据能够进行正确分析的前提是有高质量的数据，因此，本书也会适当地提及对于不同类型的数据如何进行清洗和过滤，从而为后期分析模型的构建打好基础。
说到大数据分析，不得不提及当前对大数据进行处理分析的编程语言，首屈一指的当属R了。作为MATLAB和SAS等昂贵而复杂的统计软件的免费替代品，简单易用的R迅速风靡全球，在金融街的表现尤为突出。但是R的优点也许也是其缺点，例如在建模技术上并不是很完善，处理海量数据时显得有些笨重，等等。而Python结合了R语言的快速性、处理复杂数据的能力以及更务实的语言特质，迅速地成为主流，尤其是近几年成长得很快。由于直观、易于学习，以及生态系统近年来急剧增长，Python在统计分析领域迅速占有一席之地。IPython notebook和NumPy可以用作快速进行数据分析和处理的一种轻便工具，而Python可以作为中等规模数据处理的强大工具。丰富的数据社区也是Python的优势，因为可供用户随时获取到大量的工具包和功能。另外，Python也可以与多种关系型数据库（例如MySQL、PostGreSQL等）和非关系型数据库（例如MongoDB、Hadoop等）进行无缝集成，再加上对于分布式计算框架（例如Spark）的支持，让基于Python构建的数据分析和预测系统可以很容易地扩展到大规模数据集上。因此，基于Python构建大数据的分析预测系统无疑是比较好的解决方案之一。

回到本书的主要内容上，本书先对数据分析系统的基本架构和主要处理流程进行了扼要介绍，然后从分类和无监督学习开始，逐一讲解每种机器学习算法的主要工作原理，并且在每章的最后一节给出详细的案例讨论，从而将理论很好地落实到实现中。通过对每一种具体学习算法理论部分的介绍，我们可以窥见本书作者Joseph Babcock坚实的理论功底；而落实到具体的Python实现上，我们又可以体会到Python的强大和简洁。因此，我觉得对数据分析、数据建模或者机器学习感兴趣的读者都可以读一读本书。但是译者个人觉得，读者最好具备一定的统计学知识和基本的Python编程经验，不然会稍显吃力。
值得一提的是，机器学习和人工智能已经写进了2017年的政府工作报告，因此从某种程度上说，已经上升到了国家战略层面。我们有理由相信，在可以预见的未来，基于机器学习和人工智能的数据处理和分析预测技术必将为人们的生活和工作带来极大的改变。因此，本书可以为那些对机器学习算法和预测分析技术感兴趣的人指出大致的方向。而对于那些早已投身其中的先行者来说，本书也不失为一个比较好的参考。