当前位置:首页 > 热门标签 > 大数据

大数据

本标签包含:44篇文章

本专题中精选大数据相关文档、视频、软件、源码等资源以及技术教程文章,更多相关内容陆续增加,建议收藏本栏目,本站整理包含大数据的内容共计44个,剩余601个等待更新。

零起点Python足彩大数据与机器学习实盘分析 查看详情
大数据与机器学习:实践方法与行业案例

(1)从数据信息、基本服务平台、统计分析方法、应用领域4个层面,义情景化方法解读数据信息从获得、预备处理、发掘、模型、依据解析与呈现到系统软件运用的步骤,及其深度学习的关键

查看详情
用户网络行为画像:大数据中的用户网络行为画像分析与内容推荐应用

这书分成从上到下三篇,共13章,上篇为客户画像专业知识工程项目基本,包含定性分析模型、肖像测算、储存及各种各样升级维护保养等管理方法实际操作;续篇为运用经典案例,包含Netfli

查看详情
白话大数据与机器学习 查看详情
大数据分析Excel Power BI全方位应用

随著电脑技术的发展,资料存储量呈现倍增成长,以资料採矿为核心的Business Intelligence(BI)显然成为IT和其他行业的必争之地,同时市场潮流Big Data让巨量资料分析变得更重要,商业智慧也顺理成

查看详情
决战大数据:驾驭未来商业的利器 查看详情
大数据的互联网思维

《大数据的互联网思维》 是国内第一本将互联网思维应用到大数据领域的专著,记录了笔者在大数据时代的一些感想、心得。 本书共分10章,其中第1章阐述了大数据发展的现状,以及大数据发

查看详情
大数据处理之道 查看详情
大数据治理与安全:从理论到开源实践 查看详情
大数据技术原理与应用:概念、存储、处理、分析与应用

大数据作为继云计算、物联网之后IT行业又一颠覆性的技术,备受关注。大数据处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业,都融入了

查看详情
大数据算法

大数据算法 是国内系统介绍大数据算法设计与分析技术的教材,内容丰富,结构合理,旨在讲述和解决大数据处理和应用中相关算法设计与分析的理论和方法,切实培养读者设计、分析与应用

查看详情
数据科学与大数据分析

本书是数据科学与大数据技术专业参考教材,EMC数据科学认证参考书,通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术

查看详情
征信与大数据

本书剖析国外成熟的知名征信机构的发展历程,商业模式和未来趋势,提取对中国征信业建设的启示和有益的经验,希望能够给混乱而有蓬勃发展的中国市场化征信提供借鉴,感兴趣的可以下载

查看详情
大数据技术原理与应用

内容简介 (1) 概念篇:介绍当前紧密关联的IT领域技术云计算、大数据和物联网。 (2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据

查看详情
删除:大数据取舍之道

《删除》讲述了遗忘的美德,为读者展现了大数据时代的取舍之道。 《删除》从大数据时代信息取舍的目的和方法分别诠释了被遗忘的权利。维克托首先回溯了人类追寻记忆的过程,之后提出

查看详情
大数据分析:R基础及应用

在大数据时代,R以其强大的数据分析挖掘、可视化绘图等功能,越来越受到社会各个领域的青睐。现在,R的计算引擎、性能、程序包都得到了提升,其中R与大数据分析平台Hadoop的结合,实现

查看详情
Mesos:大数据资源调度与大规模容器运行最佳实践 查看详情
大数据治理

大数据治理匠心独运,揭开了大数据的迷人景致,为我们应对大数据领域的挑战,提供了必要的智力成果。感兴趣的可以了解一下

查看详情
DT时代

DT不仅仅是技术的提升,而是思想的革命。本书首次提出块数据的数量、速度、多样、价值和数聚的五V空间理论,将对大数据的认知推进到新的高度,感兴趣的可以了解一下

查看详情
赢在大数据:中国大数据发展蓝皮书

大数据早已由1个定义变为这种小工具和攻坚,与社会生活时刻相随,促进着企业转型升级。它已经逐步形成这种观念文化,危害人们的行为习惯和办事方法,由工作经验式拍脑壳管理决策变化

查看详情
大数据搜索与挖掘及可视化管理方案

本书的分布式大数据搜索、日志挖掘、可视化、集群监控与管理等方案是基于Elastic Stack 5而提出的,它能有效应对海量大数据所带来的分布式数据存储与处理、全文检索、日志挖掘、可视化、集

查看详情
大数据架构师指南

如果你是一名IT工程师,首席技术官(CTO)希望 你在一周内提交一份公司未来IT系统基础架构的初步 建议;如果你是一位IT营销人员,客户需要你在一周 内向他汇报未来大数据系统的大致技术方向

查看详情
深入理解大数据:大数据处理与编程实践

深入理解大数据:大数据处理与编程实践 在总结多年来MapReduce并行处理技术课程教学经验和成果的基础上,与业界著名企业Intel公司的大数据技术和产品开发团队和资深工程师联合,以学术界的

查看详情
数据算法:Hadoop/Spark大数据处理技巧

数据算法:Hadoop/Spark大数据处理技巧 介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概

查看详情
零基础学大数据算法

本书是通俗易懂的大数据算法教程。通篇采用师生对话的形式,旨在用通俗的语言、轻松的气氛,帮助读者理解大数据计算领域中的基础算法和思想。

查看详情
244
首页 1 2 下一页 末页
大数据 笔记精选
网友NO.902287

Python实现的大数据分析操作系统日志功能示例

本文实例讲述了Python实现的大数据分析操作系统日志功能。分享给大家供大家参考,具体如下: 一 代码 1、大文件切分 import osimport os.pathimport timedef FileSplit(sourceFile, targetFolder): if not os.path.isfile(sourceFile): print(sourceFile, ' does not exist.') return if not os.path.isdir(targetFolder): os.mkdir(targetFolder) tempData = [] number = 1000 fileNum = 1 linesRead = 0 with open(sourceFile, 'r') as srcFile: dataLine = srcFile.readline().strip() while dataLine: for i in range(number): tempData.append(dataLine) dataLine = srcFile.readline() if not dataLine: break desFile = os.path.join(targetFolder, sourceFile[0:-4] + str(fileNum) + '.txt') with open(desFile, 'a+') as f: f.writelines(tempData) tempData = [] fileNum = fileNum + 1if __name__ == '__main__': #sourceFile = input('Input the source file to split:') #targetFolder = input('Input the target folder you want to place the split files:') sourceFile = 'test.txt' targetFolder = 'test……

网友NO.508669

mysql中max_allowed_packet参数的配置方法(避免大数据写入或者更新失败)

MySQL根据配置文件会限制Server接受的数据包大小。有时候大的插入和更新会受 max_allowed_packet 参数限制,导致写入或者更新失败。 查看目前配置: show VARIABLES like '%max_allowed_packet%'; 显示的结果为: +--------------------+---------+ | Variable_name | Value | +--------------------+---------+ | max_allowed_packet | 1048576 | +--------------------+---------+ 以上说明目前的配置是:1M 修改方法 1、修改配置文件 可以编辑my.cnf来修改(windows下my.ini),在[mysqld]段或者mysql的server配置段进行修改。 max_allowed_packet = 20M 如果找不到my.cnf可以通过 mysql --help | grep my.cnf 去寻找my.cnf文件。 linux下该文件在/etc/下。 2、在mysql命令行中修改 在mysql 命令行中运行: set global max_allowed_packet = 2*1024*1024*10 然后退出命令行,重启mysql服务,再进入。 show VARIABLES like '%max_allowed_packet%'; 查看下max_allowed_packet是否编辑成功 注意:……

网友NO.710494

MySQL 大数据量快速插入方法和语句优化分享

锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如: Connection 1 does 1000 inserts Connections 2, 3, and 4 do 1 insert Connection 5 does 1000 inserts 如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。 INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。 INSERT装载数据比LOAD DATA INFILE要慢得多,即使是使用上述的策略。 为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。 INSERT语法 INSERT [LOW_PRIORITY | DEL……

网友NO.518406

python分块读取大数据,避免内存不足的方法

如下所示: def read_data(file_name): ''' file_name:文件地址 ''' inputfile = open(file_name, 'rb') #可打开含有中文的地址 data = pd.read_csv(inputfile, iterator=True) loop = True chunkSize = 1000 #一千行一块 chunks = [] while loop: try: chunk = dcs.get_chunk(chunkSize) chunks.append(chunk) except StopIteration: loop = False print("Iteration is stopped.") data = pd.concat(chunks, ignore_index=True) #print(train.head()) return data 以上这篇python分块读取大数据,避免内存不足的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

网友NO.253604

easyui datagrid 大数据加载效率慢,优化解决方法(推荐)

在使用easyui datagrid途中发现加载数据的效率真的不是一般的差。经测试IE8加载300条数据就感觉明显的慢了,加载2000条数据就另人崩溃用时差不多60秒,就算在google浏览器测试结果也快不了几秒。 平时听闻easyui datagrid效率底下,自己测试才发现真是使人无法忍受。 笔者只好百度,google解决方法,发现一篇文章说改 //1.3.3版本是这样的,其它版本也是这句代码 $(_1e0).html(_1e4.join("")); 改为: $(_1e0)[0].innerHTML = _1e4.join(""); 笔者找了类似的地方修改,测试后结果还是一样。没有任何效果,可能是跟作者的版本不同,我的是1.3版,作者是的1.33版。 忙了半天,只好自己续步调试追踪。经过努力终于找到了导致慢的真正凶手。真正造成慢的代码如下: for (var i = 0; i trs2.length; i++) {var tr1 = $(trs1[i]);var tr2 = $(trs2[i]);tr1.css("height", "");tr2.css("height", "");var _43f = Math.max(tr1.hei……

网友NO.901813

phpexcel导入excel处理大数据(实例讲解)

先下载对应phpExcel 的包就行了https://github.com/PHPOffice/PHPExcel 下载完成 把那个Classes 这个文件夹里面的 文件跟文件夹拿出来就好了。 直接写到PHPExcel 这个文件里面的。调用很简单。引入phpExcel 这个类传递对应的excel 文件的路径就好了 现在上传到指定的目录,然后加载上传的excel文件读取这里读取是的时候不转换数组了。注意:是Sheet可以多个读取,php上传值要设置大,上传超时要设置长。 header('Content-type: text/html; charset=utf-8'); //设置页面编码require_once 'phpexcel.class.php'; //引入文件require_once 'PHPExcel/IOFactory.php'; //引入文件require_once 'PHPExcel/Reader/Excel2007.php'; //引入文件$uploadfile = $_FILES['select_file']['tmp_name']; //获取上传文件$auid = $_SESSION['auid'];$date = date('Ymd');$rand = rand(1,9999);$_month=str_replace('-','',$date);$file_name = str_pad($auid, 4, 0, STR_PAD_LEFT).$date.str_pad($rand, 4, 0, STR_PAD_……

Copyright 2018-2020 xz577.com 码农之家

本站所有电子书资源不再提供下载地址,只分享来路

免责声明:网站所有作品均由会员网上搜集共同更新,仅供读者预览及学习交流使用,下载后请24小时内删除

版权投诉 / 书籍推广 / 赞助:QQ:520161757