当前位置:首页 > 程序设计 >
《从零开始学Python数据分析与挖掘》电子书封面

从零开始学Python数据分析与挖掘

  • 发布时间:2019年11月28日 14:38:32
  • 作者:刘顺祥
  • 大小:67.8 MB
  • 类别:数据挖掘电子书
  • 格式:PDF
  • 版本:扫描版
  • 评分:8.3

    从零开始学Python数据分析与挖掘 PDF 扫描版

      给大家带来的一篇关于数据挖掘相关的电子书资源,介绍了关于Python、数据分析、数据挖掘方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小67.8 MB,刘顺祥编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.9。

      内容介绍

      从零开始学Python数据分析与挖掘

      从零开始学Python数据分析与挖掘

      本书以Python 3版本作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

      目录

      • 第1章 数据分析与挖掘概述 1
      • 第2章 从收入的预测分析开始 10
      • 第3章 Python快速入门 29
      • 第4章 Python数值计算工具——Numpy 56
      • 第5章 Python数据处理工具——Pandas 76
      • 第6章 Python数据可视化 110
      • 第7章 线性回归预测模型 150
      • 第8章 岭回归与LASSO回归模型 174
      • 第9章 Logistic回归分类模型 190
      • 第10章 决策树与随机森林 208
      • 第11章 KNN模型的应用 233
      • 第12章 朴素贝叶斯模型 253
      • 第13章 SVM模型的应用 272
      • 第14章 GBDT模型的应用 296
      • 第15章 Kmeans聚类分析 326
      • 第16章 DBSCAN与层次聚类分析 345 

      学习笔记

      python微信好友数据分析详解

      基于微信开放的个人号接口python库itchat,实现对微信好友的获取,并对省份、性别、微信签名做数据分析。 效果: 直接上代码,建三个空文本文件stopwords.txt,newdit.txt、unionWords.txt,下载字体simhei.ttf或删除字体要求的代码,就可以直接运行。 #wxfriends.py 2018-07-09import itchatimport sysimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']#绘图时可以显示中文plt.rcParams['axes.unicode_minus']=False#绘图时可以显示中文import jiebaimport jieba.posseg as psegfrom scipy.misc import imreadfrom wordcloud import WordCloudfrom os import path#解决编码问题non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0xfffd) #获取好友信息def getFriends():……

      Python实现的大数据分析操作系统日志功能示例

      本文实例讲述了Python实现的大数据分析操作系统日志功能。分享给大家供大家参考,具体如下: 一 代码 1、大文件切分 import osimport os.pathimport timedef FileSplit(sourceFile, targetFolder): if not os.path.isfile(sourceFile): print(sourceFile, ' does not exist.') return if not os.path.isdir(targetFolder): os.mkdir(targetFolder) tempData = [] number = 1000 fileNum = 1 linesRead = 0 with open(sourceFile, 'r') as srcFile: dataLine = srcFile.readline().strip() while dataLine: for i in range(number): tempData.append(dataLine) dataLine = srcFile.readline() if not dataLine: break desFile = os.path.join(targetFolder, sourceFile[0:-4] + str(fileNum) + '.txt') with open(desFile, 'a+') as f: f.writelines(tempData) tempData = [] fileNum = fileNum + 1if __name_……

      详解Python数据分析--Pandas知识点

      本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘 1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. import pandas as pd df = pd.DataFrame({"ID": ["A1000","A1001","A1002", "A1002"], "departmentId": [60001,60001, 60001, 60001]}) df.drop_duplicates() 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观失误造成数据的缺失, 比如数据录入人员的疏漏; 2) 机械原因: 由于机械故障导致的数据收集或者数据保存失败从而造成数据的缺失. 2.2 缺失值的处理方式 缺失值……

      Python数据分析:手把手教你用Pandas生成可视化图表的教程

      大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事。但自从Python进入3.0时代以后,pandas的使用变得更加普及,它的身影经常见于市场分析、爬虫、金融分析以及科学计算中。 作为数据分析工具的集大成者,pandas作者曾说,pandas中的可视化功能比plt更加简便和功能强大。实际上,如果是对图表细节有极高要求,那么建议大家使用matplotlib通过底层图表模块进行编码。当然,我们大部分人在工作中是不会有这样变态的要求的,所以一句import pandas as pd就足够应付全部的可视化工作了。 下面,我们总结一下PD库的一些……

      以上就是本次介绍的数据挖掘电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:Unity3D游戏开发

      下一篇:NB-IoT物联网技术解析与案例详解

      展开 +

      收起 -

      • 《从零开始学Python数据分析与挖掘》PDF下载

      数据挖掘相关电子书
      基于Python的大数据分析基础及实战
      基于Python的大数据分析基础及实战 高质量版

      配套设施教程视频教你如何学Python 提炼出避坑技能招式简要、高效率懂Python 实战演练经典案例轻轻松松、迅速玩Python 解读实践活动实例视頻源码源统计数据 对于Python初学者量身订做,新手入

      立即下载
      Python生物信息学数据管理(含源码)
      Python生物信息学数据管理(含源码) 扫描完整版

      生物科学学校的Python课程内容教材内容,合适大学本科课堂教学或制造行业人员的Python短期培训班。这书案例借以处理分子生物学难题,根据程序编写手法的方式,包含尽量多的机构、剖析、

      立即下载
      Python+Spark2.0+Hadoop机器学习与大数据实战
      Python+Spark2.0+Hadoop机器学习与大数据实战 原书扫描版

      本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,浅显易懂的原理介绍加上Step by Step 实机操作、范例程序详细解说,实现降低机器学习与大数据技术

      立即下载
      Python和HDF5大数据应用
      Python和HDF5大数据应用 高质量中文版

      本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。适合有基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考,感兴趣的小伙伴们可以下载参考一下

      立即下载
      Python数据分析与数据化运营
      Python数据分析与数据化运营 扫描影印版

      这书內容从逻辑性上共分成两绝大多数,第壹一部分是相关数据统计分析类的主题风格,其次一部分是相关数字化经营的主题风格。第壹一部分的內容包含1/2/3/4章和附则,关键详细介绍了Pyt

      立即下载
      零起点Python大数据与量化交易
      零起点Python大数据与量化交易 高清版

      零起点Python大数据与量化交易 是国内较早关于Python大数据与量化交易的原创图书,配合zwPython开发平台和zwQuant开源量化软件学习,是一套完整的大数据分析、量化交易的学习教材,可直接用于

      立即下载
      Python数据科学指南
      Python数据科学指南 清晰扫描版

      本书是Python数据分析编程入门,详细介绍了Python在数据科学中的应用,60多个实用的开发技巧,帮你探索Python及其强大的数据科学能力

      立即下载
      Python3爬虫、数据清洗与可视化实战
      Python3爬虫、数据清洗与可视化实战 含源码版

      这是一套通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python读物。以Python爬虫技术应用实战为主,适合Python 初学者及高等院校的相关专业学生

      立即下载
      Python与数据挖掘
      Python与数据挖掘 高清版

      本书主要分为两大部分,基础篇和建模应用篇。基础篇介绍了有关Python开发环境的搭建、Python基础入门、函数、面向对象编程、实用模块和图表绘制等基础知识。建模应用篇主要介绍了目前在

      立即下载
      Python数据分析与数据化运营(第2版)
      Python数据分析与数据化运营(第2版) 立即下载
      读者留言
      控制器开发

      控制器开发 提供上传

      资源
      37
      粉丝
      13
      喜欢
      782
      评论
      19

      Copyright 2018-2020 xz577.com 码农之家

      本站所有电子书资源不再提供下载地址,只分享来路

      版权投诉 / 书籍推广 / 赞助:QQ:520161757