当前位置:主页 > 计算机电子书 > 计算机理论 > Web数据分析下载
Web数据分析关键技术及解决方案

Web数据分析关键技术及解决方案 PDF 完整高质量版

  • 更新:2019-11-04
  • 大小:32 MB
  • 类别:Web数据分析
  • 作者:范春晓
  • 出版:北京邮电大学出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

Web数据分析关键技术及解决方案 PDF

Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》集中化探讨Web统计数据自动剖析的关键技术——Web统计数据自动获得、特点提取、表述模型及Web发掘等有关基础理论和方式,在这个基础上,剖析了几类典型性的Web数据分析要求,明确提出并详细介绍了具备目的性的解决方案及方式。关键解决方案包含:根据Web公共性舆论自动剖析及预警信息计划方案、根据词义的Web信息内容自动聚合物方式、多源电子商务大数据挖掘等。

《Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》选择当今Web数据分析的热点话题,小结了实际上学科建设的科研成果,基础理论与实际上实例紧密结合,合适高等院校电子信息技术、电脑等有关技术专业的老师、学员及科学研究工作人员阅读文章。

目录

  • 章 Web大数据挖掘概述
  • 1.1 大数据与网络大数据
  • 1.2 Web大数据应用及特点
  • 1.2.1 Web大数据
  • 1.2.2 Web大数据特点
  • 1.3 Web挖掘及Web挖掘类型
  • 1.3.1 Web挖掘及Web挖掘类型
  • 1.3.2 Web内容挖掘
  • 1.3.3 Web结构挖掘
  • 1.3.4 Web使用挖掘
  • 1.4 Web挖掘过程
  • 1.4.1 Web内容挖掘过程
  • 1.4.2 Web结构挖掘过程
  • 1.4.3 Web使用挖掘过程
  • 参考文献
  • 第2章 Web数据挖掘基础
  • 2.1 Web信息程序获取方式
  • 2.1.1 网络爬虫
  • 2.1.2 其他Web信息程序获取方式
  • 2.2 Web信息数据抽取
  • 2.2.1 Web网页信息抽取
  • 2.2.2 自然语言文本结构化信息抽取
  • 2.3 Web信息文本模型的文本特征表示
  • 2.3.1 文本模型与文本特征
  • 2.3.2 VSM向量空间模型
  • 2.3.3 布尔模型
  • 2.3.4 概率主题模型
  • 2.4 模式发现常用方法
  • 2.4.1 统计分析
  • 2.4.2 关联分析
  • 2.4.3 分类分析
  • 2.4.4 聚类分析
  • 参考文献
  • 第3章 Web内容及结构挖掘应用案例1:基于Web公共舆情自动分析及预警
  • 3.1 概述
  • 3.1.1 基于Web的公共舆情
  • 3.1.2 网络舆情研究现状
  • 3.2 基于Web意见的舆情分析预测模型
  • 3.2.1 舆情分析预测模型概述
  • 3.2.2 热点舆情发现模型研究
  • 3.2.3 热点舆情发展趋势预测模型
  • 3.3 基于意见挖掘的热点舆情发现模型
  • 3.3.1 改进的热点舆情发现模型
  • 3.3.2 基于Web意见挖掘的报道特征表示
  • 3.4 来源加权的舆情分析模型
  • 3.4.1 舆情来源量化分析指标
  • 3.4.2 Page-Rank算法拓展
  • 3.4.3 构建来源加权的舆情分析模型
  • 3.5 热点舆情识别
  • 3.5.1 话题热度特征描述
  • 3.5.2 话题热度计算函数
  • 3.6 实验及评估
  • 3.6.1 网络新闻数据的抓取
  • 3.6.2 中文分词及文本表示
  • 3.6.3 模型改进效果分析
  • 3.7 C5.0和BP神经网络结合的舆情预测模型
  • 3.7.1 基于C5.0的意见分类
  • 3.7.2 基于BP神经网络预测模型
  • 3.7.3 实验及评估
  • 3.8 小结
  • 参考文献
  • 第4章 Web内容挖掘应用案例2:基于语义的Web信息自动聚合系统的关键技术研究
  • 4.1 信息聚合及相关技术
  • 4.1.1 信息聚合
  • 4.1.2 信息聚合问题研究现状
  • 4.1.3 简易信息聚合技术RSS
  • 4.1.4 数字签名算法Simhash
  • 4.2 一种基于主题的Web信息自动聚合方案
  • 4.2.1 方案架构
  • 4.2.2 信息获取
  • 4.2.3 信息预处理
  • 4.2.4 按主题聚合
  • 4.3 基于标点符号及标签相似度的正文抽取方法
  • 4.3.1 网页类型及结构
  • 4.3.2 常用网页正文抽取方法分析
  • 4.3.3 基于标点分布的网页正文抽取算法
  • 4.3.4 基于标签相似度的多正文网页抽取技术
  • 4.3.5 算法设计及实验
  • 4.4 基于潜在语义的Web信息聚合
  • 4.4.1 概率主题模型与潜在语义分析模型
  • 4.4.2 LDA模型
  • 4.4.3 面向Web信息的LDA模型改进方法
  • 4.4.4 实验结果分析
  • 4.5 本章小结
  • 参考文献
  • 第5章 分布式多源电商数据挖掘
  • 5.1 电子商务及电商数据分析
  • 5.2 电商数据分析挖掘
  • 5.2.1 引言
  • 5.2.2 电商数据定义
  • 5.2.3 电商数据采集
  • 5.2.4 数据分析挖掘
  • 5.3 多源电商数据融合
  • 5.3.1 引言
  • 5.3.2 数据融合
  • 5.3.3 多源电商数据的特点
  • 5.3.4 多数据源电商数据融合总体解决方案
  • 5.3.5 多数据源电商数据融合方案
  • 5.3.6 多数据源电商数据融合的具体实现
  • 5.3.7 实验结果与分析
  • 5.4 分布式电商数据分析挖掘系统
  • 5.4.1 引言
  • 5.4.2 基于Hadoop的分布式电商数据分析挖掘系统
  • 5.4.3 基于Hadoop平台的层次聚类
  • 5.4.4 电商数据的层次聚类分析
  • 参考文献

资源下载

资源下载地址1:https://pan.baidu.com/s/161dUv-sNK77BTjNX_1y_lQ

相关资源

网友留言