标签分类 热门分类
当前位置:首页 > 数据库电子书 > Python大数据电子书网盘下载
基于Python的大数据分析基础及实战 基于Python的大数据分析基础及实战
码小辫

码小辫 提供上传

资源
30
粉丝
48
喜欢
381
评论
4

    基于Python的大数据分析基础及实战 PDF 高质量版

    Python大数据电子书
    • 发布时间:

    给大家带来的一篇关于Python大数据相关的电子书资源,介绍了关于Python、大数据分析、实战方面的内容,本书是由水利水电出版社出版,格式为PDF,资源大小202 MB,余本国编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.1,更多相关的学习资源可以参阅 数据库电子书Python电子书、等栏目。

    基于Python的大数据分析基础及实战 PDF 下载

    下载地址:https://pan.baidu.com/s/1laSQIFrV8Zham-zh85jV_

    分享码:lma7

    基于Python的大数据分析基础及实战 pdf

    配套设施教程视频——教你如何学Python
    提炼出避坑技能招式——简要、高效率懂Python
    实战演练经典案例——轻轻松松、迅速玩Python
    解读 实践活动 实例 视頻 源码 源统计数据
    对于Python初学者量身订做,新手入门必需的真情之选

    《基于Python的大数据分析基础及实战》是1本详细介绍怎样用Python 3.6开展数据处理方法和剖析的学习指南。其主题思想包含:Python語言基本、数据处理方法、数据统计分析、大数据可视化,及其运用Python对数据库查询的实际操作、建造Python运用库的共享资源公布等。

    《基于Python的大数据分析基础及实战》分3个一部分:第1一部分为基本知识,第2一部分为实战演练实例,第3一部分为扩展与拓宽。这书主题鲜明,解读浅显易懂,特别适合本科毕业、硕士研究生,及其对Python語言很感兴趣或是愿意应用Python語言开展数据统计分析的广大读者。

    目录

    • 第1部分  基  础  篇
    • 第1章
    • Python语言基础   /2
    • 1.0  引子    /2
    • 1.1  工欲善其事,必先利其器(安装Python)   /3
    • 1.2  学跑得先学走(语法基础)    /9
    • 1.3  程序结构    /11
    • 1.3.1  Hello World!    /11
    • 1.3.2  运算符介绍    /12
    • 1.3.3  顺序结构    /14
    • 1.3.4  判断结构    /17
    • 1.3.5  循环结构    /18
    • 1.3.6  异常    /20
    • 1.4  函数    /24
    • 1.4.1  基本函数结构    /24
    • 1.4.2  参数结构    /25
    • 1.4.3  回调函数    /28
    • 1.4.4  函数的递归与嵌套    /28
    • 1.4.5  闭包    /31
    • 1.4.6  匿名函数lambda    /32
    • 1.4.7  关键字yield    /32
    • 1.5  数据结构    /35
    • 1.5.1  列表(list)   /35
    • 1.5.2  元组(tuple)   /38
    • 1.5.3  集合(set)   /39
    • 1.5.4  字典(dict)   /40
    • 1.5.5  集合的操作    /41
    • 1.5.6  学以致用    /45
    • 1.6  3个函数(map、filter、reduce)    /47
    • 1.6.1  遍历函数(map)   /47
    • 1.6.2  筛选函数(filter)   /48
    • 1.6.3  累计函数(reduce)   /48
    • 1.7  面向对象编程基础    /50
    • 1.7.1  类    /50
    • 1.7.2  类和实例    /51
    • 1.7.3  数据封装    /52
    • 1.7.4  私有变量与私有方法    /53
    • 本章小结   /54
    • 第2章
    • 数据处理   /60
    • 2.1  Anaconda简介    /60
    • 2.2  Numpy简介    /66
    • 2.3  关于Pandas    /68
    • 2.3.1  什么是Pandas    /68
    • 2.3.2  Pandas中的数据结构    /68
    • 2.4  数据准备    /68
    • 2.4.1  数据类型    /68
    • 2.4.2  数据结构    /69
    • 2.4.3  数据导入    /79
    • 2.4.4  数据导出    /86
    • 2.5  数据处理    /88
    • 2.5.1  数据清洗    /89
    • 2.5.2  数据抽取    /97
    • 2.5.3  插入记录    /114
    • 2.5.4  修改记录    /117
    • 2.5.5  交换行或列    /120
    • 2.5.6  排名索引    /122
    • 2.5.7  数据合并    /131
    • 2.5.8  数据计算    /137
    • 2.5.9  数据分组    /141
    • 2.5.10  日期处理    /143
    • 带你飞(数据处理案例)    /148
    • 本章小结    /160
    • 第3章
    • 数据分析   /165
    • 3.1  基本统计分析    /165
    • 3.2  分组分析    /169
    • 3.3  分布分析    /171
    • 3.4  交叉分析    /173
    • 3.5  结构分析    /174
    • 3.6  相关分析    /176
    • 小试牛刀(相关分析案例:电商数据分析)    /178
    • 本章小结   /180
    • 第4章
    • 数据可视化   /181
    • 4.1  使用Python对数据进行可视化处理    /181
    • 4.1.1  准备工作    /181
    • 4.1.2  Matplotlib绘图示例    /186
    • 4.1.3  Seabon中的图例    /198
    • 4.1.4  pandas的一些可视化功能    /212
    • 4.1.5  文本数据可视化    /217
    • 4.1.6  networkx网络图    /218
    • 4.1.7  folium绘制地图    /220
    • 4.2  Python图像处理基础    /221
    • 4.2.1  PIL图库    /221
    • 4.2.2  OpenCV图库    /224
    • 本章小结   /226
    • 第5章
    • 字符串处理与网络爬虫   /228
    • 5.1  字符串处理    /228
    • 5.1.1  字符串处理函数    /228
    • 5.1.2  正则表达式    /230
    • 5.1.3  编码处理    /237
    • 5.2  网络爬虫    /240
    • 5.2.1  获取网页源码    /240
    • 5.2.2  从源码中提取信息    /241
    • 5.2.3  数据存储    /246
    • 5.2.4  网络爬虫从这里开始    /248
    • 本章小结   /260
    •  
    • 第2部分  实战案例篇
    • 第6章
    • 词云   /262
    • 6.1  安装文件包    /263
    • 6.2  jieba功能用法    /264
    • 6.2.1  cut用法    /264
    • 6.2.2  词频与分词字典    /265
    • 6.3  文本词云图    /269
    • 6.4  背景轮廓词云图的制作    /271
    • 6.4.1  数据准备    /271
    • 6.4.2  分词    /272
    • 6.4.3  构建词云    /273
    • 本章小结   /278
    • 第7章
    • 航空客户分类   /279
    • 7.1  问题的提出    /279
    • 7.2  聚类分析相关概念    /280
    • 7.3  模型的建立    /281
    • 7.4  Python实现代码    /281
    • 7.5  分类结果展示与分析    /284
    • 本章小结   /287
    • 第8章
    • 《红楼梦》文本分析   /288
    • 8.1  准备工作    /289
    • 8.2  分词    /291
    • 8.2.1  读取数据    /291
    • 8.2.2  数据预处理    /293
    • 8.2.3  对红楼梦进行分词    /301
    • 8.2.4  制作词云    /303
    • 8.3  文本聚类分析    /312
    • 8.3.1  构建分词TF-IDF矩阵   /312
    • 8.3.2  使用TF-IDF矩阵对章节进行聚类    /314
    • 8.4  LDA主题模型    /322
    • 8.5  人物社交网络分析    /328
    • 本章小结   /334
    •  
    • 第3部分  拓展与延伸
    • 第9章
    • Python字符串格式化    /336
    • 9.1  使用%符号进行格式化   /336
    • 9.2  使用format()方法进行格式化    /339
    • 9.3  使用f方法进行格式化   /341
    • 本章小结   /342
    • 第10章
    • 在Python中操作MySQL数据库    /343
    • 10.1  对MySQL的连接与访问    /344
    • 10.2  对MySQL的增、删、改、查操作    /345
    • 10.2.1  查询操作    /345
    • 10.2.2  插入操作    /346
    • 10.2.3  更新操作    /347
    • 10.2.4  删除操作    /347
    • 10.3  创建数据库表    /348
    • 本章小结   /349
    • 第11章
    • fractal(分形)库的发布    /350
    • 11.1  用Python绘制分形   /351
    • 11.1.1  分形简介    /351
    • 11.1.2  先睹为快    /351
    • 11.1.3  绘制方法简介    /352
    • 11.2  第三方库发布到PyPi    /364
    • 本章小结   /369
    • 参考文献   /370

    上一篇:物联网开发与应用:基于ZigBee、Simplici TI、低功率蓝牙、Wi-Fi技术  下一篇:Scratch编程从入门到精通

    展开 +

    收起 -

    Python大数据 相关电子书
    关于Python大数据的学习笔记
    网友NO.192752

    python 计算数据偏差和峰度的方法

    numpy.set_printtoptions(edgeitems=5):值过多,显示前5个和后5个 偏度: 衡量随机分布的不均衡性,偏度=0,数值相对均匀的分布在两侧 峰度: 概率密度在均值处峰值高低的特征 python计算数据均值、标准差、偏度、峰度: import numpy as npfrom scipy import stats x = np.random.randn(10000)mu = np.mean(x, axis=0)sigma = np.std(x, axis=0)skew = stats.skew(x)kurtosis = stats.kurtosis(x) 以上这篇python 计算数据偏差和峰度的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

    网友NO.891647

    python按比例随机切分数据的实现

    在机器学习或者深度学习中,我们常常碰到一个问题是数据集的切分。比如在一个比赛中,举办方给我们的只是一个带标注的训练集和不带标注的测试集。其中训练集是用于训练,而测试集用于已训练模型上跑出一个结果,然后提交,然后举办方验证结果给出一个分数。但是我们在训练过程中,可能会出现过拟合等问题,会面临着算法和模型的选择,此时,验证集就显得很重要。通常,如果数据量充足,我们会从训练集中划分出一定比例的数据来作为验证集。 每次划分数据集都手动写一个脚本,重复性太高,因此将此简单的脚本放到自己的博客。代码如下: import randomdef split(full_list,shuffle=False,ratio=0.2): n_total = len(full_list) offset = int(n_total * ratio) if n_total==0 or offset1: return [],full_list if shuffle: random.shuffle(full_list) sublist_1 = full_list[:offset] sublist_2 = full_list[offset:] return sublist_1,sublist_2if __name__ == "__main__": li = range(5) sublist_1,sublist_2 = split(li,shuffle=True,ratio=0.2) print sublist_1,len(sublist_1) print sublist_2,len(sublist_2) 其中,main为测试代码。假如训练集给出的是一个文件,我们先将文件读到列表中,然后再调用split。 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持码农之家。 ……

    网友NO.249002

    python数据分析需要什么基础

    python数据分析需要什么基础? 1. SQL(数据库),我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,那么怎么从数据库取数据?如何建立两表、三表之间的关系?怎么取到自己想要的特定的数据?等等这些数据选择问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能; 2. 统计学基础,数据分析的前提要对数据有感知,数据如何收集?数据整体分布是怎样的?如果有时间维度的话随着时间的变化是怎样的?数据的平均值是什么?数据的最大值最小值指什么?数据相关与回归、时间序列分析和预测等等; 3.python数据分析肯定需要Python语言的基础,这一点是必备项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。 相关推荐:《Python教程》 以上就是python数据分析需要什么基础的详细内容,更多请关注码农之家其它相关文章! ……

    网友NO.777224

    Python 数据结构之旋转链表

    题目描述:给定一个链表,旋转链表,使得每个节点向右移动k个位置,其中k是一个非负数 样例:给出链表1-2-3-4-5-null和k=2;返回4-5-1-2-3-null 首先,观察一下这个题目要达到的目的,其实,换一种说法,可以这样来描述:给出一个k值,将链表从倒数第k个节点处起之后的部分移动到链表前面,就样例来说,其实是将4-5这一部分移动到整个链表前面,变成4-5-1-2-3-null。不过,需要注意的是,题中没有给出k的大小,当k比链表的长度还大的时候,我们就需要先用k对链表的长度求余,比如,如果k = 7,那么上面的例子还是将4-5移动到整个链表前面。 所以说,这个题的思路可以这样来总结: 1. 先求出整个链表的长度 2. 根据k值找到需要移动的部分链表的前驱(样例中的3) 3. 在前驱之后将链表断开,移动后半部分 代码如下: # Definition for singly-linked list. # class ListNode: # def __init__(self, x): # self.val = x # self.next = None class Solution: # @param head: the list # @param k: rotate to the right k places # @return: the list after rotation def rotateRight(self, head, k): if head is None: return head cur = head count = 1 # 计算链表长度 while cur.next: cur = cur.next count += 1 # 为节省代码量,这里是一个很有技巧的处理:用尾节点链接头结点 cur.next = head # 此处,k为cur从尾节点到要断开部分的前驱需走的……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明