
Hive编程指南 PDF 高质量版
- 大小:6.12 MB
- 类型:Hive编程
- 格式:PDF
- 热度:517
- 作者:Edward、Capriolo
- 更新:2019-11-07 21:59:06

为找资料的网友们整理了Hive编程相关的资料,介绍了关于Hive编程、Hive指南方面,格式为PDF,资源大小6.12 MB,目前在Hive编程类资源综合评分为:7.3分。
《 Hive编程指南 》是一本ApacheHive的编程指南,致力于详细介绍怎么使用Hive的SQL方式 HiveQL来归纳、查寻和剖析储存在Hadoop分布式文件系统上的大数据结合。本书根据很多的案例,最先详细介绍如何在客户自然环境下安裝和配备Hive,并对Hadoop和MapReduce开展详细论述,*终演试Hive如何在Hadoop生态体系开展工作中。 《Hive编程指南》合适对大数据很感兴趣的发烧友及其已经应用Hadoop系统软件的数据库管理员阅读文章应用。 目录 dy 章 基础知识 1.1 Hadoop和MapReduce综述 1.2 Hadoop生态系统中的Hive 1.2.1 Pig 1.2.2 HBase 1.2.3 Cascading、Crunch及其他 1.3 Java和Hive:词频统计算法 1.4 后续事情 第2章 基础操作 2.1 安装预先配置好的虚拟机 2.2 安装详细步骤 2.2.1 装Java 2.2.2 安装Hadoop 2.2.3 本地模式、伪分布式模式和分布式模式 2.2.4 测试Hadoop 2.2.5 安装Hive 2.3 Hive内部是什么 2.4 启动Hive 2.5 配置Hadoop环境 2.5.1 本地模式配置 2.5.2 分布式模式和伪分布式模式配置 2.5.3 使用JDBC连接元数据 2.6 Hive命令 2.7 命令行界面 2.7.1 CLI 选项 2.7.2 变量和属性 2.7.3 Hive中一次使用命令 2.7.4 从文件中执行Hive查询 2.7.5 hiverc文件 2.7.6 使用Hive CLI的更多介绍 2.7.7 查看操作命令历史 2.7.8 执行shell命令 2.7.9 在Hive内使用Hadoop的dfs命令 2.7.10 Hive脚本中如何进行注释 2.7.11 显示字段名称 第3章 数据类型和文件格式 3.1 基本数据类型 3.2 集合数据类型 3.3 文本文件数据编码 3.4 读时模式 第4章 HiveQL:数据定义 4.1 Hive中的数据库 4.2 修改数据库 4.3 创建表 4.3.1 管理表 4.3.2 外部表 4.4 分区表、管理表 4.4.1 外部分区表 4.4.2 自定义表的存储格式 4.5 删除表 4.6 修改表 4.6.1 表重命名 4.6.2 增加、修改和删除表分区 4.6.3 修改列信息 4.6.4 增加列 4.6.5 删除或者替换列 4.6.6 修改表属性 4.6.7 修改存储属性 4.6.8 众多的修改表语句 第5章 HiveQL:数据操作 5.1 向管理表中装载数据 5.2 通过查询语句向表中插入数据 5.3 单个查询语句中创建表并加载数据 5.4 导出数据 第6章 HiveQL:查询 6.1 SELECTFROM语句 6.1.1 使用正则表达式来指定列 6.1.2 使用列值进行计算 6.1.3 算术运算符 6.1.4 使用函数 6.1.5 LIMIT语句 6.1.6 列别名 6.1.7 嵌套SELECT语句 6.1.8 CASEWHENTHEN 句式 6.1.9 什么情况下Hive可以避免进行MapReduce 6.2 WHERE语句 6.2.1 谓词操作符 6.2.2 关于浮点数比较 6.2.3 LIKE和RLIKE 6.3 GROUP BY 语句 6.4 JOIN语句 6.4.1 INNER JOIN 6.4.2 JOIN优化 6.4.3 LEFT OUTER JOIN 6.4.4 OUTER JOIN 6.4.5 RIGHT OUTER JOIN 6.4.6 FULL OUTER JOIN 6.4.7 LEFT SEMI-JOIN 6.4.8 笛卡尔积JOIN 6.4.9 map-side JOIN 6.5 ORDER BY和SORT BY 6.6 含有SORT BY 的DISTRIBUTE BY 6.7 CLUSTER BY 6.8 类型转换 6.9 抽样查询 6.9.1 数据块抽样 6.9.2 分桶表的输入裁剪 6.10 UNION ALL 第7章 HiveQL:视图 7.1 使用视图来降低查询复杂度 7.2 使用视图来限制基于条件过滤的数据 7.3 动态分区中的视图和map类型 7.4 视图零零碎碎相关的事情 第8章 HiveQL:索引 8.1 创建索引 8.2 重建索引 8.3 显示索引 8.4 删除索引 8.5 实现一个定制化的索引处理器 第9章 模式设计 9.1 按天划分的表 9.2 关于分区 9.3 wei一键和标准化 9.4 同一份数据多种处理 9.5 对于每个表的分区 9.6 分桶表数据存储 9.7 为表增加列 9.8 使用列存储表 9.8.1 重复数据 9.8.2 多列 9.9 (几乎)总是使用压缩 dy 0章 调优 10.1 使用EXPLAIN 10.2 EXPLAIN EXTENDED 10.3 限制调整 10.4 JOIN优化 10.5 本地模式 10.6 并行执行 10.7 严格模式 10.8 调整mapper和reducer个数 10.9 JVM重用 10.10 索引 10.11 动态分区调整 10.12 推测执行 10.13 单个MapReduce中多个GROUP BY 10.14 虚拟列 dy 1章 其他文件格式和压缩方法 11.1 确定安装编解码器 11.2 选择一种压缩编/解码器 11.3 开启中间压缩 11.4 终输出结果压缩 11.5 sequence file存储格式 11.6 使用压缩实践 11.7 存档分区 11.8 压缩:包扎 dy 2章 开发 12.1 修改Log4J属性 12.2 连接Java调试器到Hive 12.3 从源码编译Hive 12.3.1 执行Hive测试用例 12.3.2 执行hook 12.4 配置Hive和Eclipse 12.5 Maven工程中使用Hive 12.6 Hive中使用hive_test进行单元测试 12.7 新增的插件开发工具箱(PDK) dy 3章 函数 13.1 发现和描述函数 13.2 调用函数 13.3 标准函数 13.4 聚合函数 13.5 表生成函数 13.6 一个通过日期计算其星座的UDF 13.7 UDF与GenericUDF 13.8 不变函数 13.9 用户自定义聚合函数 13.10 用户自定义表生成函数 13.10.1 可以产生多行数据的UDTF 13.10.2 可以产生具有多个字段的单行数据的UDTF 13.10.3 可以模拟复杂数据类型的UDTF 13.11 在 UDF中访问分布式缓存 13.12 以函数的方式使用注解 13.12.1 定数性(deterministic)标注 13.12.2 状态性(
相关资源
-
《全国计算机等级考试教程:二级MS Office高级应用》配套资源
编辑推荐 我们的优势有: 1.一本配有无纸化考试模拟软件的教程 (1)模拟软件 真考试题+真考环境,带您提前进考场。 (2)视频讲堂 多媒体视频讲解,辅导名师手把手教学。 (3)配套素材 PPT课件+例题源文件+课后习题答案与解析,支持读者全方位学习。 2.一本一学就会的教程 将复杂问题简单化,将理论知识通俗化,零基础考生通过无忧。 3.一本衔接考试的教程 考试要点就是讲解重点,所有习题、例题源自考试真题。 4.配套资源获取方式 扫描图书封
大小:493.17 MB计算机等级考试配套资源
-
《Revit MEP 2020中文版 管线综合设计从入门到精通》配套资源
★书名:Revit MEP 2020中文版 管线综合设计从入门到精通 ★书号:978-7-115-54122-2 ★简介:本书详细讲述了Revit MEP 2020的基本知识和在工程设计中的应用,面向初学者。全书分为14章,包括Revit 2020简介、绘图环境设置、基本绘图工具、族、模型布局、建筑模型、暖通空调设计、电气设计、给水排水设计、碰撞检查和工程量统计以及餐厅管线综合案例等内容。本书以Revit MEP 2020 中文版软件为基础进行讲解,本书的目的不仅是使读者学习软件的操作技能,更追求
大小:532.9 MBRevit MEP配套资源
-
现代电子技术基础:模拟部分 课后答案
《现代电子技术基础:模拟部分》是2005年北京航天航空大学出版社出版的图书。《现代电子技术基础:模拟部分》对传统教学内容进行了较大幅度的更新,引入了电流模式电路、模拟可编程器件、电子设计自动化等内容。 《现代电子技术基础:模拟部分》:国防科工委重点教材建设计划十五规划教材。为适应现代电子技术的飞速发展,《现代电子技术基础:模拟部分》共分10章,内容包括:半导体器件基础、放大器基础、集成运算放大器与模拟乘法器、信号
大小:275 KB电子技术课后答案
-
Mybatis在Mapper.xml文件中的转义字符处理方式
大小:82 KBMybatis
-
《AutoCAD 2020中文版从入门到精通》源文件
编辑推荐 《AutoCAD 2020中文版从入门到精通》内容新颖,以AutoCAD 2020中文版为基础,全面介绍AutoCAD软件从基础操作到实际项目设计的全部技巧; 《AutoCAD 2020中文版从入门到精通》案例经典,大量实用的工程项目的典型案例,助力读者提高实战技能,动手会才是真学会; 《AutoCAD 2020中文版从入门到精通》资源丰富,全部实例配套源文件; 《AutoCAD 2020中文版从入门到精通》附赠AutoCAD官方认证考试大纲和样题,常用图库源文件资源应有尽有,即学即用; 《
大小:5 GBAutoCAD配套资源
-
Python背记手册+python语法合集
这套教程包含了Python背记手册以及python语法,Python背记手册是《Python从入门到精通》的随书附赠资料,喜欢的朋友可下载试试! 本书从新手视角去往,根据浅显易懂的語言、多种多样的案例,详解了应用Python开展软件开发应当把握的各层面技术性。 目录 第1章走进Pht.h 第2章Python语言基础 第3章运算符与表达式 第4章流程控制语句 第5章列表与元组 第6章字典与集合 第7章 字符串 第8章Python 中使用正则表达式 第9章函数 第10章面向对象程序设计 第11章模块
大小:20.2 MBPython手册
-
计算机通信与网络 课后答案
本书系统地介绍了计算机通信与网络的基本概念和基本理论与技术。内容包括: 计算机网络的基本概念、发展历史、体系结构、数据通信技术基础,以及物理层、数据链路层、网络层、传输层、应用层等层次的基本概念与功能,同时还包含了计算机网络新技术、网络管理和网络安全等相关的内容。各章后附有练习题,并附有习题解答和电子教案等教学辅助材料。 本书从实际应用出发,注重基本概念,突出重点,叙述清楚,深入浅出,论述详尽,通过较
大小:15.2 MB计算机课后答案
-
《Visual FoxPro 6.0 数据库技术与应用(第2版)》教案,源代码
编辑推荐 精心设计案例,实践任务驱动教学;教学内容难度适中,实现易教易学目标;提供立体化教学素材:课件、实例源代码、操作视频。 内容简介 本书以Visual FoxPro 6.0为软件平台,全面介绍了数据库系统的概念、使用、管理和开发。内容以两条主线贯穿全书,一是Visual FoxPro的知识体系结构;二是综合案例,体现案例教学的特点。本书内容涵盖了《全国计算机等级考试大纲》中Visual FoxPro程序设计部分。 全书主要内容包括数据库基础知识、数据库与
大小:3.33 MBVisual FoxPro配套资源
下载地址
相关声明: