当前位置:首页 > 电子书 > 电子书下载 > 数据库 >
社交网站的数据挖掘与分析 社交网站的数据挖掘与分析
omodao1

omodao1 提供上传

资源
27
粉丝
13
喜欢
226
评论
17

    社交网站的数据挖掘与分析 PDF 完整第2版

    数据分析电子书
    • 发布时间:2019-09-19 17:05:05

    给大家带来的一篇关于数据分析相关的电子书资源,介绍了关于社交网站、数据挖掘、数据分析方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小51.9 MB,Mattbew A.Russell,师蓉编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.4。

  • 社交网站的数据挖掘与分析 PDF 下载
  • 下载地址:https://pan.baidu.com/s/1JDQa54yYxeVjLYT457ICD
  • 提取码:hpe4
  • 社交网站的数据挖掘与分析 PDF

    社交平台统计数据好似掩埋地底的“铅锌矿”,怎样运用这种统计数据来发觉什么人正根据社交媒体媒体开展联络?她们已经讨论哪些?或是她们在哪里?这书第2版对上个版內容开展了全方位升级和修定,它将表明回应这种难题的方式 与方法。你将学得怎样获得、剖析和归纳撒落于社交平台(包含Facebook、Twitter、LinkedIn、Google+、 GitHub、电子邮件、网址和搏客等)的统计数据,及其怎样根据数据可视化寻找你一直都在社交媒体全球中找寻的內容与你闻所未闻的有效信息内容。

    依靠IPython Notebook、自然语言工具包、NetworkX和别的科学计算专用工具发掘流行社交平台

    应用高級文本挖掘技术性(如聚类算法和TF-IDF)来获取人们語言统计数据中有使用价值的专业知识

    根据发觉GitHub人上人、计算机语言和编码工程项目间的亲密性,搭建兴趣爱好图普

    运用D3.js开展互动式数据可视化,充分运用HTML5和JavaScript工具包的灵便特点

    以“难题-解决方法-探讨”的方法详尽解读深入挖掘Twitter统计数据的实用技术,并出示编码实例

    社交网站的数据挖掘与分析(原书第2版)》的配套设施编码在公布的GitHub编码比对库开展维护保养,能够根据一站式服务虚拟机来浏览,你只必须方便使用实用的IPython Notebook,就能进到开心的互动式学习培训场景。

    目录

    • 《社交网站的数据挖掘与分析(原书第2版)》
    • 前言 1
    • 第一部分 社交网络导引
    • 序幕 13
    • 第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等 15
    • 1.1 概述 15
    • 1.2 Twitter风靡一时的原因 16
    • 1.3 探索Twitter API 18
    • 1.4 分析140字的推文 33
    • 1.5 本章小结 47
    • 1.6 推荐练习 48
    • 1.7 在线资源 48
    • 第2章 挖掘Facebook:分析粉丝页面、查看好友关系等 50
    • 2.1 概述 51
    • 2.2 探索Facebook的社交图谱API 51
    • 2.3 分析社交图谱联系 62
    • 2.4 本章小结 85
    • 2.5 推荐练习 86
    • 2.6 在线资源 86
    • 第3章 挖掘LinkedIn:分组职位、聚类同行等 88
    • 3.1 概述 89
    • 3.2 探索LinkedIn API 89
    • 3.3 数据聚类速成 94
    • 3.4 本章小结 124
    • 3.5 推荐练习 125
    • 3.6 在线资源 126
    • 第4章 挖掘Google+:计算文档相似度、提取搭配等 127
    • 4.1 概述 128
    • 4.2 探索Google+ API 128
    • 4.3 TF-IDF简介 138
    • 4.4 用TF-IDF查询人类语言数据 145
    • 4.5 本章小结 164
    • 4.6 推荐练习 165
    • 4.7 在线资源 165
    • 第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等 167
    • 5.1 概述 168
    • 5.2 抓取、解析、爬取网页 168
    • 5.3 通过解码语法来探索语义 174
    • 5.4 以实体为中心的分析:范式转换 192
    • 5.5 人类语言数据处理分析的质量 200
    • 5.6 本章小结 203
    • 5.7 推荐练习 203
    • 5.8 在线资源 204
    • 第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等 206
    • 6.1 概述 207
    • 6.2 获取和处理邮件语料库 207
    • 6.3 分析Enron语料库 225
    • 6.4 探索和可视化时序趋势 241
    • 6.5 分析你自己的邮件数据 244
    • 6.6 本章小结 250
    • 6.7 推荐练习 251
    • 6.8 在线资源 251
    • 第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等 253
    • 7.1 概述 254
    • 7.2 探索GitHub的API 254
    • 7.3 使用属性图为数据建模 260
    • 7.4 分析GitHub兴趣图谱 264
    • 7.5 本章小结 286
    • 7.6 推荐练习 287
    • 7.7 在线资源 287
    • 第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等 289
    • 8.1 概述 290
    • 8.2 微格式:易于实现的元数据 290
    • 8.3 从语义标记过渡到语义网:一个小插曲 304
    • 8.4 语义网:发展中的变革 304
    • 8.5 本章小结 310
    • 8.6 推荐的练习 311
    • 8.7 在线资源 311
    • 第二部分 Twitter实用指南
    • 第9章 Twitter实用指南 317
    • 9.1 访问Twitter的API(开发目的) 318
    • 9.2 使用OAuth访问Twitter的API(产品目的) 319
    • 9.3 探索流行话题 323
    • 9.4 查找推文 324
    • 9.5 构造方便的函数调用 325
    • 9.6 使用文本文件存储JSON数据 326
    • 9.7 使用MongoDB存储和访问JSON数据 327
    • 9.8 使用信息流API对Twitter数据管道抽样 329
    • 9.9 采集时序数据 330
    • 9.10 提取推文实体 332
    • 9.11 特定的推文范围内查找最流行的推文 333
    • 9.12 特定的推文范围内查找最流行的推文实体 335
    • 9.13 对频率分析制表 336
    • 9.14 查找转推了状态的用户 337
    • 9.15 提取转推的属性 339
    • 9.16 创建健壮的Twitter请求 340
    • 9.17 获取用户个人资料信息 343
    • 9.18 从任意的文本中提取推文实体 344
    • 9.19 获得用户所有的好友和关注者 345
    • 9.20 分析用户的好友和关注者 347
    • 9.21 获取用户的推文 348
    • 9.22 爬取好友关系图 350
    • 9.23 分析推文内容 351
    • 9.24 提取链接目标摘要 353
    • 9.25 分析用户收藏的推文 356
    • 9.26 本章小结 357
    • 9.27 推荐练习 358

    9.28 在线资源 359
    第三部分 附录
    附录A 关于本书虚拟机体验的信息 363
    附录B OAuth入门 364
    附录C Python和IPython Notebook的使用技巧 368

    上一篇:凤凰项目:一个IT运维的传奇故事

    下一篇:Java 8基础应用与开发

    展开 +

    收起 -

     
    数据分析 相关内容
    量化投资:数据挖掘技术与实践
    量化投资:数据挖掘技术与实践 MATLAB影印版

    全书内容分为三篇。第一篇(基础篇)主要介绍数据挖掘与量化投资的关系,以及数据挖掘的概念、实现过程、主要内容、主要工具等内容。感兴趣的可以下载学习

    立即下载
    基于R语言数据挖掘的统计与分析
    基于R语言数据挖掘的统计与分析 影印完整版

    R语言的功能越来越丰富,越来越多的人对R语言产生了兴趣。本书是为了让对R语言有兴趣的读者能更加了解R语言,了解大数据时代的数据挖掘等,感兴趣的可以下载学习

    立即下载
    从零开始学Python数据分析与挖掘
    从零开始学Python数据分析与挖掘 影印版

    本书以Python 3版本作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。

    立即下载
    数据挖掘:概念与技术
    数据挖掘:概念与技术 影印第3版

    这书详细全方位地叙述大数据挖掘的定义、方式 、技术性和*研究进展。这书对前两版干了全方位修定,提升和再次机构了全书的技术性內容,重中之重阐述了数据预处理、经常方式发掘、归类

    立即下载
    数据挖掘:R语言实战
    数据挖掘:R语言实战 影印版

    本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的

    立即下载
    大数据搜索与挖掘及可视化管理方案
    大数据搜索与挖掘及可视化管理方案 完整第3版

    本书的分布式大数据搜索、日志挖掘、可视化、集群监控与管理等方案是基于Elastic Stack 5而提出的,它能有效应对海量大数据所带来的分布式数据存储与处理、全文检索、日志挖掘、可视化、集

    立即下载
    HAWQ数据仓库与数据挖掘实战
    HAWQ数据仓库与数据挖掘实战 清晰完整版

    Apache HAWQ是一个SQL-on-Hadoop产品,适合用于Hadoop平台上快速构建数据仓库系统,本书从技术解析、实战演练与数据挖掘三个方面讲解,欢迎下载

    立即下载
    学习笔记
    网友NO.323704

    Python基本数据结构之字典类型dict用法分析

    本文实例讲述了Python基本数据结构之字典类型dict用法。分享给大家供大家参考,具体如下: 词典类型 dict 字典由键(key)和对应值(value)成对组成。字典也被称作关联数组或哈希表。 dict 赋值 dict 整体放在花括号{}中,每个键与值用冒号隔开(:),每对用逗号分割; d = {'one':1, 'two':2, 'three':3} 键必须独一无二,但值则不必;值可取任何数据类型,如字符串,数或元组;若创建时同一个键被赋值两次,后一个值会被记住; 键必须不可变,所以可以用数,字符串或元组充当,用列表就不行 用 dict() 强制转换,可接受以下形式,参见下例 a = dict(one=1, two=2, three=3)b = {'one': 1, 'two': 2, 'three': 3}c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))d = dict([('two', 2), ('one', 1), ('three', 3)])e = dict({'three': 3, 'one': 1, 'two': 2})print(a == b == c == d == e) dict 操作 词典类型适用于对应键的取值,十分实用;对于dict的访问、修改、增加、删除等操作需要熟练掌握 以下列出了常用的用法,详细请参考: 访问值、修改值 dict_name['key_name'] 可直接访问值,可直接更改该值 d = {'Name': 'Zara', 'Age': 7, 'Class': 'First'};print(d['Name'],d['Age'],d['Class']) # 访问键值访问 dict_name['key_name']print("%s's age is %d, class is: %s." %(d['Name'], d['Age'],d['Class'])) # 字符串输出# print(d['name']) # 无该键值,会报错,注意大小写……

    网友NO.201913

    python数据分析有什么用

    数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 案例 (推荐学习:Python视频教程) Suncorp-Metway使用数据分析实现智慧营销 Suncorp-Metway是澳大利亚一家提供普通保险、银行业、寿险和理财服务的多元化金融服务集团, 旗下拥有5个业务部门,管理着14类商品,由公司及共享服务部门提供支持,其在澳大利亚和新西兰的运营业务与900多万名客户有合作关系。 该公司过去十年间的合并与收购,使客户群增长了200%,这极大增加了客户群数据管理的复杂性,如果解决不好,必将对公司利润产生负面影响.为此,IBM公司为其提供了一套解决方案,组件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service谀IBM Unica。 采用该方案后,Suncorp-Metway公司至少在以下三项业务方面取得显著成效: 1、显著增加了市场份额,但没有增加营销开支; 2、每年大约能够节省1000万美元的集成与相关成本; 3、避免向同一户家庭重复邮寄相同信函并且消除冗余系统,从而同时降低直接邮寄与运营成本。 由此可见,Suncorp-Metway公司通过该方案将此前多个孤立来源的数据集成起来,实现智慧营销,对控制成本,增加利润……

    网友NO.703820

    Mysql 数据库死锁过程分析(select for update)

    近期有一个业务需求,多台机器需要同时从Mysql一个表里查询数据并做后续业务逻辑,为了防止多台机器同时拿到一样的数据,每台机器需要在获取时锁住获取数据的数据段,保证多台机器不拿到相同的数据。 我们Mysql的存储引擎是innodb,支持行锁。解决同时拿数据的方法有很多,为了更加简单,不增加其他表和服务的情况下,我们考虑采用select... for update的方式,这样X锁锁住查询的数据段,表里其他数据没有锁,其他业务逻辑还是可以操作。 这样一台服务器比如select .. for update limit 0,30时,其他服务器执行同样sql语句会自动等待释放锁,等待前一台服务器锁释放后,该台服务器就能查询下一个30条数据。如果要求更智能,oracle支持for update skip locked跳过锁区域,这样能不等待马上查询没有被锁住的下一个30条记录。 下面说下mysql for update导致的死锁。 经过分析,mysql的innodb存储引擎实务锁虽然是锁行,但它内部是锁索引的,根据where条件和select的值是否只有主键或非主键索引来判断怎么锁,比如只有主键,则锁主键索引,如果只有非主键,则锁非主键索引,如果主键非主键都有,则内部会按照顺序锁。但同样的select .. for update语句怎么就死锁了呢?同样的sql语句查询条件和结果顺序都一致,按理不会导致一个锁了主键索引,……

    网友NO.232160

    django框架model orM使用字典作为参数,保存数据的方法分析

    本文实例讲述了django框架model orM使用字典作为参数,保存数据的方法。分享给大家供大家参考,具体如下: 假设有一个字典,里面已经有了所有相关信息,现在想利用这个字典作为参数,跟django model 结合,用很少的代码量保存数据,有什么简便方法,比如有如下定义的model: from django.db import modelsclass MyModel(models.Model): title=models.CharField(max_length=250) body= models.CharField(max_length=1000) .... 有一个字典: data_dict = { 'title' : 'awesome title', 'body' : 'great body of text',} 如果按照常规的做法,可能采用如下方式去保存数据: mymodel = MyModel()mymodel.title = data_dict['title']mymodel.bdy = data_dict['body']mymodel.save() 或者这样 mymodel = MyModel(title=data_dict['title'],body=data_dict['body'])mymodel.save() 其实是一样的,从dict里面去取得数据。 其实还有更简单的方法,直接传入这个dict数据,但前提是: 字典数据里面的key 字段一定要与model中定义的field 对应,否则就会报错.但事实上在封装dict数据的时候,完全可以对应的。用如下方法保存 mymodel = MyModel(**data_dict)mymodel.save() 如果还有一些其他的扩展字段,也是可以加在里面的,但注意. **data_dict 必须放在最后: mymodel =MyModel(extra='hello', extra2='world', **data_dict)mymodel .save() 还可以这样做: MyModel.objects.create(**data_dict) 这样就只是实现了django m……

    电子书 编程教程 PC软件下载 安卓软件下载

    Copyright 2018-2020 xz577.com 码农之家

    本站所有电子书资源不再提供下载地址,只分享来路

    免责声明:网站所有作品均由会员网上搜集共同更新,仅供读者预览及学习交流使用,下载后请24小时内删除

    版权投诉 / 书籍推广 / 赞助:QQ:520161757