新媒体数据挖掘:基于R语言

新媒体数据挖掘:基于R语言 PDF 影印中文版

  • 大小:86 MB
  • 类型:R语言
  • 格式:PDF
  • 热度:902
  • 作者:王小峰
  • 更新:2019-06-10 09:55:07
vip 立即下载( 86 MB )
关注公众号免费下载
版权投诉 / 资源反馈(本资源由用户 江阳文 投稿)

新媒体数据挖掘:基于R语言 内容精选 下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。 1、聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclust, agnes, diana 基于模型的方法: mclust 基于密度的方法: dbscan 基于画图的方法: plotcluster, plot.hclust 基于验证的方法: cluster.stats 2、分类 常用的包: rpart,party,randomForest,rpartOrdinal,tree,marginTree, maptree,survival 决策树: rpart, ctree 随机森林: cforest, randomForest 回归, Logistic回归, Poisson回归: glm, predict, residuals 生存分析: survfit, survdiff, coxph 3、关联规则与频繁项集 arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则 DRM:回归和分类数据的重复关联模型 APRIORI算法,广度RST算法:apriori, drm ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat 4、序列模式 常用的包: arulesSequences SPADE算法: cSPADE 5、时间序列 常用的包: timsac 时间序列构建函数: ts 成分分解: decomp, decompose, stl, tsr 6、统计 常用的包: Base R, nlme 方差分析: aov, anova 密度分析: density 假设检验: t.test, prop.test, anova, aov 线性混合模型:lme 主成分分析和因子分析:princomp 7、图表 条形图: barplot 饼图: pie 散点图: dotchart 直方图: hist 密度图: densityplot 蜡烛图, 箱形图 boxplot QQ (quantile-quantile) 图: qqnorm, qqplot, qqline Bi-variate plot: coplot 树: rpart Parallel coordinates: parallel, paracoor, parcoord 热图, contour: contour, filled.contour 其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot, assocplot, mosaicplot 保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png 8、数据操作 缺失值:na.omit 变量标准化:scale 变量转置:t 抽样:sample 堆栈:stack, unstack 其他:aggregate, merge, reshape 9、与数据挖掘软件Weka做接口 RWeka: 通过这个接口,可以在R中使用Weka的所有算法。 内容介绍 计算传播领域尤其是新媒体数据挖掘方向一直缺乏系统的教材,《新媒体数据挖掘基于R语言》旨在为计算传播和计算社会科学领域的读者提供学习R编程语言和开发平台的捷径,希望能够填补这方面的空白。让学习层次变得更宏观,让学习过程变得更轻松,让学习所获变得更通用是《新媒体数据挖掘基于R语言》的编写理念与特色。《新媒体数据挖掘基于R语言》首先剖析了社会科学研究范式的革新,介绍了R语言的作用和特点;然后系统讲解了编程语言的通用学习方法和R语言的基本组成;最后展开实战应用,包括网络数据采集、文本挖掘和情感分析、社会网络分析、社交编程平台协作等非常有趣且有意义的内容。 《新媒体数据挖掘基于R语言》 适合作为计算传播和计算社会科学领域相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。《新媒体数据挖掘基于R语言》还适合作为计算传播学和计算社会科学科研人员的自学书籍 目录 第1章 为什么学习R语言 1 1.1 R是什么 2 1.1.1 R是一款优秀的现代科研软件 2 1.1.2 R的优势与不足 3 1.1.3 R和Python的区别 3 1.2 计算社会科学的兴起以计算传播学为例 4 1.2.1 什么是计算社会科学 4 1.2.2 计算传播学的起源和概念 7 1.3 R在计算传播学中的典型应用 9 1.3.1 用R进行文本分析初探 9 1.3.2 互联网在线数据收集 10 1.3.3 社会网络分析 12 1.4 总结与提高 13 1.5 习题 14 第2章 R语言开发环境 15 2.1 R的获取、安装和基本使用 16 2.1.1 RGui的下载与安装 16 2.1.2 RGui的使用介绍 19 2.1.3 示例:使用R Commander实现统计功能 21 2.1.4 R的内置数据集和扩展功能包 26 2.1.5 R的帮助系统 27 2.1.6 R的工作空间和工作目录 27 2.2 R的IDE开发环境RStudio 27 2.2.1 RStudio的下载和安装 28 2.2.2 RStudio的最简标准操作 28 2.2.3 RStudio的工作界面 31 2.2.4 RStudio的用户自定义配置 32 2.3 示例:我的第一个R项目网页爬虫 32 2.3.1 组织项目需求 33 2.3.2 新建项目环境 33 2.3.3 编写应用程序代码并运行 34 2.3.4 执行代码并根据实际结果修改和再次运行 35 2.4 总结与提高 37 2.5 习题 38 第3章 R语言基础数据 39 3.1 无障碍学习编程语言的两个诀窍 40 3.1.1 从哲学的角度了解编程语言 40 3.1.2 从语言学的角度学习编程语言语法 41 3.2 R的基本数据类型(数值、字符、逻辑) 42 3.2.1 基本数据类型 42 3.2.2 数据类型的两个属性:模式和长度 43 3.2.3 两个特殊常量 44 3.3 R的复合数据类型 45 3.3.1 向量 46 3.3.2 矩

相关资源

  • 《WebAssembly标准入门》随书资料

    《WebAssembly标准入门》随书资料

    内容简介 WebAssembly是一种新兴的网页虚拟机标准,它的设计目标包括高可移植性、高安全性、高效率(包括载入效率和运行效率)、尽可能小的程序体积。柴树杉,丁尔男著的《WebAssembly标准入门》详尽介绍了WebAssembly程序在JavaScript环境下的使用方法、WebAssembly汇编语言和二进制格式,给出了大量简单易懂的示例,同时以C/C++和Go语言开发环境为例,介绍了如何使用其他不错语言开发WebAssembly模块。 本书适合从事高性能Web前端开发、跨语言Web应用开发的技

    大小:303.17 KBWebAssembly配套资源

  • 《Java网络编程基础(第2版)》源代码

    《Java网络编程基础(第2版)》源代码

    内容介绍 本书是为Java学习者在了解Java编程的基础知识之后,进一步学习Java网络编程而编写的教材。全书共4章,第1章通过使用MySQL讲述JDBC数据库应用编程,内容紧密围绕综合实例Java考试管理系统来展开;第2章讲述C/S网络编程及应用,通过综合实例C/S考试系统着重讲述C/S模式下的Java网络应用,这个实例与第1章的Java考试管理系统相结合,实现了一个完整的实用项目;第3章讲述JSP及JavaBean网站编程,并通过综合实例电子商务网站框架讲述基于Web的电子商

    大小:599.92 KBJava编程配套资源

  • SpringBoot全教程

    Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置,从而使开发人员不再需要定义样板化的配置。通过这种方式,Spring Boot致力于在蓬勃发展的快速应用开发领域(rapid application development)成为领导者。 为什么使用Spring Boot?很简单,我仅仅只需要非常少的几个配置就可以迅速方便的搭建起来一套 Web 项目或者是构建一个微服务! 本文档主要介绍了Spring B

    大小:20.6 MBSpringBoot

  • TiDB 技术架构及演进规划

    TiDB 技术架构及演进规划

    PingCAP 是国内第一家开源的新型分布式 NewSQL 数据库公司,秉承开源是基础软件的 未来这一理念, PingCAP 持续扩大社区影响力,致力于前沿技术领域的创新实现。其独 立研发项目 TiDB 灵感来自于 Google Spanner/F1,具备「分布式强一致性事务、在线弹 性水平扩展、故障自恢复的高可用、跨数据中心多活」等核心 NewSQL 特性,是大数据时 代理想的数据库集群和云数据库解决方案。 数据库发展史简介 2013 年以后2008 年至 2013 年2008 年以前 背景:应用为广泛

    大小:19.9 MBTiDB

  • 多媒体技术与应用

    多媒体技术与应用 课后答案

    《多媒体技术与应用》系统而全面地介绍了多媒体技术及其应用领域的基本概念、基本原理、关键技术及近期新发展,理论与实践结合紧密,论述简明清晰。《多媒体技术与应用》共10章,主要内容包括多媒体技术概述、多媒体计算机系统、音频处理技术、图像处理技术、动画制作技术、视频处理技术、多媒体数据压缩技术、网络多媒体技术与应用以及多媒体应用系统的设计与开发等。《多媒体技术与应用》融思想性、科学性与知识性于一体,内容新颖

    大小:58.4 KB多媒体课后答案

  • 人工智能原理与应用

    人工智能原理与应用 课后答案

    《人工智能原理与应用》是2004年2月高等教育出版社出版的图书,作者是张仰森。 《人工智能原理与应用》是作者依据自己的教学实践,学习、吸纳前辈经验,归纳、提炼、创新而形成的具有特色的教材。书中比较系统地介绍了人工智能的基本原理、方法和应用技术。全书共分两篇,包括十章内容。第一篇为原理篇,主要论述知识表示、知识获取以及知识运用三大问题,包括人工智能的基本概念及其发展状况、知识表示方法、确定性推理方法、不确定性

    大小:3.53 MB人工智能课后答案

  • 《S7-200西门子PLC基础教程》教案

    《S7-200西门子PLC基础教程》教案

    内容简介 本书以能力培养为目标,力求突出PLC技术的实用性,从实际应用角度出发组织教材内容。 本书共分9章,以S7-200系列PLC为例,介绍了PLC的结构及编程软件的使用、PLC的基本指令、PLC程序设计方法、顺序控制设计方法中梯形图的编程方法、PLC的应用指令、PLC应用系统的设计、PLC在逻辑控制系统中的应用举例、可编程序控制器网络及通信等内容。 本书可作为高职高专机电类专业教材,也可供相关人员参考使用。 目录 第1章 PLC概述 1.1 PLC的产生、发展

    大小:3.36 MBPLC教程配套资源

  • 华为C++培训资料(word完整版)

    华为内部的C++培训资料,详细说明了C++的企业编程实用技巧和掌握的知识点,是c++程序员想要进一步进行实际开发工作绝好的参考文档,不是菜鸟入门类的简单语法介绍。 C++语言中级教材讲授C++语言的运用技术,包括:类、对象之间的关系、对象的存储与布局、运算符重载、智能指针、仿函数、泛型编程,C++模式设计基本思想。

    大小:1.1 MBC++资料

下载地址

相关声明:

学习笔记