当前位置:首页 > 热门标签 > 大数据

大数据

本标签包含:68篇文章

本专题中精选大数据相关文档、视频、软件、源码等资源以及技术教程文章,更多相关内容陆续增加,建议收藏本栏目,本站整理包含大数据的内容共计68个,剩余537个等待更新。

大数据平台基础架构指南

当今不无互联网大数据具体技术模块的书藉,但却非常少有从数据管理平台整体建设和产品形态的宏观经济多角度下手来诠释的。一本书重点介绍大数据开发平台服务搭建的整体构思和解决方

查看详情
大数据:技术与应用实践指南

大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。 本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念

查看详情
Splunk大数据分析

Splunk是一种典型的大数据处理工具,能够高效地按时序对数据进行存储、索引、访问,已广泛应用在多个领域。本书是介绍如何实时处理大数据并从中获得商业价值的一本实用指南。本书通过

查看详情
写给大家看的大数据

大数据是当前信息科技领域最为炙手可热的话题之一。《写给大家看的大数据》简单而系统地介绍了大数据体系涉及的各方面知识,涵盖大数据的基本概念、大数据的技术基础、大数据管理、

查看详情
大数据时代的算法:机器学习、人工智能及其典型实例

《 大数据时代的算法:机器学习、人工智能及其典型实例 》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习

查看详情
大数据系统构建

随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对

查看详情
大数据营销:定位客户

今天,我们的一切行为都在产生数据,而且数量巨大。每次浏览网页、搜索或者用智能手机上网,几乎都会增加数十亿字节之多的数据,而且这个增量还在扩大。如此庞大的数据可以帮助我们

查看详情
大数据处理系统:Hadoop源代码情景分析

Hadoop是目前采用最广、最重要的一种开源的大数据处理平台,读懂Hadoop的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。毛德操著的《大数据处理系统(Had

查看详情
大数据技术前沿

本选题以科普的方式系统地阐述了大数据前沿技术与研究进展,对技术的来源、结论、对比、用途以及开源软件进行了深入浅出的描述,并不过多地涉及数学符号及基础原理。以大数据可视化

查看详情
区块链与大数据:打造智能经济

近年来,大数据在迅猛发展的同时也充斥着概念的炒作,面临着诸多困境。那么,有什么方法能够促使大数据突破困境,获得更高层次的发展呢?这就是本书的核心思想及价值所在。 区块链与

查看详情
大数据安全

本书以大数据安全为对象展开研究,对大数据安全的现状、技术、存在问题和解决策略进行了梳理,从安全视角讨论和分析大数据,对已经发生的安全事件,作为案例进行详细讲解,以起到一

查看详情
Hadoop+Spark大数据巨量分析与机器学习整合开发实战

《Hadoop Spark大数据巨量分析与机器学习整合开发实战》 从浅显易懂的大数据和机器学习原理介绍和说明入手,讲述大数据和机器学习的基本概念,如:分类、分析、训练、建模、预测、机器学

查看详情
大数据架构商业之路:从业务需求到技术方案

目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代

查看详情
Spark大数据处理: 原理、算法与实例

Spark大数据处理: 原理、算法与实例 以时下流行的Hadoop所存在的缺陷为出发点,深入浅出地介绍了下一代大数据处理核心技术Spark的优势和必要性,并以简洁的指引步骤展示了如何在10分钟内建

查看详情
为数据而生:大数据创新实践

在大数据概念如此流行的今天,为什么要读这本书?中国大数据领军人、大数据创新与实践一线专家、百万级畅销书《大数据时代》中文版译者周涛,耗时三年,将海量真实案例披沙拣金呈现

查看详情
大数据智能 查看详情
架构大数据:大数据技术及算法解析 查看详情
大数据科学 查看详情
物联网之云:云平台搭建与大数据处理

本书为“物联网工程实战丛书”第4卷。本书阐述了云计算的基本概念、工作原理和信息处理流程,详细讲述了云计算的数学基础及大数据处理方法,并给出了云计算和雾计算的项目研发流程,

查看详情
实战大数据

大数据专家、《大数据时代作者》维克托迈尔-舍恩伯格与《数据之巅》作者涂子沛力荐,资深专家破解政府与企业数据化转型之道,绘制数据时代智能组织转型升级路线图。 企业如何具体运用

查看详情
大数据智能:互联网时代的机器学习和自然语言处理技术

本书是一本介绍大数据智能分析的科普书籍, 旨在让更多的人了解和学习互联网时代的机器学习和自 然语言处理技术,以期让大数据技术更好地为我们的生产和生活服务。 全书包括大数据智能基础和大数据智能应用两个部分,共 8 章。大数据智能基础部分有三章:第 1 章 以深度学习为例介绍大数据智能的计算框架;第 2 章以知识图谱为例介绍大数据智能的知识库;第 3 章介 绍大数据背后的计算处理系统。 大数据智能应用部分有 5 章: 第 4 章介绍智能

查看详情
赢在大数据

赢在大数据:金融/电信/媒体/医疗/旅游/数据市场行业大数据应用典型案例 (赢在大数据系列丛书) Kindle电子书

查看详情
零起点Python足彩大数据与机器学习实盘分析 查看详情
大数据与机器学习:实践方法与行业案例

(1)从数据信息、基本服务平台、统计分析方法、应用领域4个层面,义情景化方法解读数据信息从获得、预备处理、发掘、模型、依据解析与呈现到系统软件运用的步骤,及其深度学习的关键

查看详情
用户网络行为画像:大数据中的用户网络行为画像分析与内容推荐应用

这书分成从上到下三篇,共13章,上篇为客户画像专业知识工程项目基本,包含定性分析模型、肖像测算、储存及各种各样升级维护保养等管理方法实际操作;续篇为运用经典案例,包含Netfli

查看详情
368
首页 1 2 3 下一页 末页
大数据 笔记精选
网友NO.486008

python分块读取大数据,避免内存不足的方法

如下所示: def read_data(file_name): ''' file_name:文件地址 ''' inputfile = open(file_name, 'rb') #可打开含有中文的地址 data = pd.read_csv(inputfile, iterator=True) loop = True chunkSize = 1000 #一千行一块 chunks = [] while loop: try: chunk = dcs.get_chunk(chunkSize) chunks.append(chunk) except StopIteration: loop = False print("Iteration is stopped.") data = pd.concat(chunks, ignore_index=True) #print(train.head()) return data 以上这篇python分块读取大数据,避免内存不足的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

网友NO.232243

大数据用什么语言?

大数据是这近年来一直比较火的一个词语,让很多人都情不自禁走入大数据的学习中。可是你知道大数据用什么语言吗? 1、Python语言 十多年来,Python在学术界当中一直很流行,尤其是在自然语言处理(NLP)等领域。因而,如果你有一个需要NLP处理的项目,就会面临数量多得让人眼花缭乱的选择,包括经典的NTLK、使用GenSim的主题建模,或者超快、准确的spaCy。同样,说到神经网络,Python同样游刃有余,有Theano和Tensorflow;随后还有面向机器学习的scikit-learn,以及面向数据分析的NumPy和Pandas。 还有Juypter/iPython――这种基于Web的笔记本服务器框架让你可以使用一种可共享的日志格式,将代码、图形以及几乎任何对象混合起来。这一直是Python的杀手级功能之一,不过这年头,这个概念证明大有用途,以至于出现在了奉行读取-读取-输出-循环(REPL)概念的……

网友NO.207845

MySQL 大数据量快速插入方法和语句优化分享

锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如: Connection 1 does 1000 inserts Connections 2, 3, and 4 do 1 insert Connection 5 does 1000 inserts 如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。 INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。 INSERT装载数据比LOAD DATA INFILE要慢得多,即使是使用上述的策略。 为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。 INSERT语法 INSERT [LOW_PRIORITY | DEL……

网友NO.129801

vue大数据表格卡顿问题的完美解决方案

前言 vue渲染小数据挺快,大数据vue开始出现卡顿现象,本文讲给大家详细介绍关于vue大数据表格卡顿问题的解决方法 点我在线体验Demo(请用电脑查看) 亲测苹果电脑,chrome浏览器无卡顿现象,其它浏览器并未测试,如遇到卡顿请备注系统和浏览器,方便我后续优化,谢谢 先看一下效果,一共1000 X 100 = 10W个单元格基本感受不到卡顿,而且每个单元格点击可以编辑,支持固定头和固定列 项目源代码地址 Github(本地下载) 解决问题核心点:横向滚动加载,竖向滚动加载 项目背景 笔者最近在做广告排期功能,需要进行点位预占,大的合同可能需要对多个资源排期,周期可能到几年这样,然后我们的页面交互是这样 横向每个月30个单元格,最多的3年,36个月,每行36*30=1080个单元格 竖向100个资源,总共约️10W个单元格,然后每个单元格里面会有一个输入框,一个……

网友NO.861281

mysql 超大数据/表管理技巧

如果你对长篇大论没有兴趣,也可以直接看看结果,或许你对结果感兴趣。在实际应用中经过存储、优化可以做到在超过9千万数据中的查询响应速度控制在1到20毫秒。看上去是个不错的成绩,不过优化这条路没有终点,当我们的系统有超过几百人、上千人同时使用时,仍然会显的力不从心。 目录: 分区存储 优化查询 改进分区 模糊搜索 持续改进的方案 正文: 分区存储 对于超大的数据来说,分区存储是一个不错的选择,或者说这是一个必选项。对于本例来说,数据记录来源不同,首先可以根据来源来划分这些数据。但是仅仅这样还不够,因为每个来源的分区的数据都可能超过千万。这对数据的存储和查询还是太大了。MySQL5.x以后已经比较好的支持了数据分区以及子分区。因此数据就采用分区+子分区来存储。 下面是基本的数据结构定义: CREATE TAB……

网友NO.747967

python金融大数据分析有用吗

《Python金融大数据分析 》是人民邮电出版社2015年12月出版的中译图书,作者[德]伊夫·希尔皮斯科,译者姚军。 《Python金融大数据分析》,唯一一本详细讲解使用Python分析处理金融大数据的专业图书;金融应用开发领域从业人员必读。适合对使用Python进行大数据分析、处理感兴趣的金融行业开发人员阅读。 (推荐学习:Python视频教程) 内容介绍 Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的首选编程语言。 《Python金融大数据分析》提供了使用Python进行数据分析,以及开发相关应用程序的技巧和工具。 《Python金融大数据分析》总计分为3部分,共19章。 第1部分介绍了Python在金融学中的应用,其内容涵盖了Python用于金融行业的原因……

Copyright 2018-2020 www.xz577.com 码农之家

版权投诉 / 书籍推广 / 赞助:520161757@qq.com