数据集成原理

数据集成原理 PDF 高清版

  • 大小:62.7 MB
  • 类型:数据集成
  • 格式:PDF
  • 出版:机械工业出版社
  • 作者:多恩,哈勒维
  • 更新:2020-07-16 08:55:12
vip 立即下载( 62.7 MB )
关注公众号免费下载
版权投诉 / 资源反馈(本资源由用户 瞿竹雨 投稿)

为找资料的网友们整理了数据集成相关的资料,由机械工业出版社出版,作者是多恩,哈勒维,介绍了关于数据集成、数据原理方面,格式为PDF,资源大小62.7 MB,目前在数据集成类资源综合评分为:9.9分。

书籍介绍

《计算机科学丛书:数据集成原理》主要讨论数据集成技术,共分为三部分。第一部分主要关注数据集成领域的基本知识,如查询表达式、数据源描述、异构数据与模式的匹配、模式操作、查询应答、Web数据抽取以及集成数据的存储。第二部分主要关注扩展的数据表示,扩展的数据表示可以获得标准关系数据模型无法表示的一些特性,如层次型(XML)、基于知识表示的本体构建、不确定性以及数据溯源。第三部分介绍解决特定集成问题的创新架构,主要包括多样的Web数据源集成、基于关键字搜索的结构化数据集成、对等数据集成和支持协同的集成等。最后介绍了数据集成技术的主要研究方向。

目录

  • 出版者的话
  • 中文版序
  • 译者序
  • 前言
  • 第1章 绪论
  • 1.1 什么是数据集成
  • 1.2 数据集成面临的挑战
  • 1.2.1 系统原因
  • 1.2.2 逻辑原因
  • 1.2.3 社会和管理原因
  • 1.2.4 设定预期
  • 1.3 数据集成架构
  • 1.3.1 数据集成系统的组成部分
  • 1.3.2 数据集成实例
  • 1.4 全书概览
  • 参考文献注释
  • 第一部分 数据集成技术基础
  • 第2章 查询表达式及运算
  • 2.1 数据库概念回顾
  • 2.1.1 数据模型
  • 2.1.2 完整性约束
  • 2.1.3 查询和应答
  • 2.1.4 合取查询
  • 2.1.5 datalog查询
  • 2.2 查询展开
  • 2.3 查询包含与等价
  • 2.3.1 形式化定义
  • 2.3.2 合取查询的包含
  • 2.3.3 合取查询的并集
  • 2.3.4 带有比较谓词的合取查询
  • 2.3.5 带有否定的合取查询
  • 2.3.6 包语义、分组和聚集
  • 2.4 基于视图计算查询
  • 2.4.1 问题定义
  • 2.4.2 视图与查询计算的相关性
  • 2.4.3 查询重写的可能长度
  • 2.4.4 桶算法和MiniCon算法
  • 2.4.5 逻辑方法:逆规则算法
  • 2.4.6 算法比较
  • 2.4.7 基于视图的查询应答
  • 参考文献注释
  • 第3章 数据源描述
  • 3.1 概述和必要条件
  • 3.2 模式映射语言
  • 3.2.1 模式映射语言规则
  • 3.2.2 全局视图
  • 3.2.3 局部视图
  • 3.2.4 全局-局部视图
  • 3.2.5 元组生成依赖
  • 3.3 访问模式限制
  • 3.3.1 构建访问模式限制
  • 3.3.2 生成可执行计划
  • 3.4 中介模式上的完整性约束
  • 3.4.1 带有完整性约束的LAV
  • 3.4.2 带有完整性约束的GAV
  • 3.5 结果完备性
  • 3.5.1 局部完备性
  • 3.5.2 结果完备性检测
  • 3.6 数据级的异构性
  • 3.6.1 标度差异性
  • 3.6.2 相同实体的多重表示
  • 参考文献注释
  • 第4章 字符串匹配
  • 4.1 问题描述
  • 4.2 相似度度量
  • 4.2.1 基于序列的相似度度量
  • 4.2.2 基于集合的相似度度量
  • 4.2.3 混合相似度度量
  • 4.2.4 语音相似度度量
  • 4.3 可扩展的字符串匹配
  • 4.3.1 字符串上的倒排索引
  • 4.3.2 大小过滤
  • 4.3.3 前缀过滤
  • 4.3.4 位置过滤
  • 4.3.5 边界过滤
  • 4.3.6 其他相似度度量方法的可扩展技术
  • 参考文献注释
  • 第5章 模式匹配与模式映射
  • 5.1 问题定义
  • 5.1.1 语义映射
  • 5.1.2 语义匹配
  • 5.1.3 模式匹配与模式映射
  • 5.2 模式匹配和模式映射的挑战
  • 5.3 匹配和映射系统概述
  • 5.3.1 模式匹配系统
  • 5.3.2 模式映射系统
  • 5.4 匹配器
  • 5.4.1 名字匹配器
  • 5.4.2 实例匹配器
  • 5.5 组合匹配预测
  • 5.6 施加域完整性约束
  • 5.6.1 域完整性约束
  • 5.6.2 搜索匹配组合空间
  • 5.7 匹配选择器
  • 5.8 匹配重用
  • 5.8.1 学习匹配
  • 5.8.2 学习器
  • 5.8.3 训练元学习器
  • 5.9 多对多匹配
  • 5.10 由匹配到映射
  • 参考文献注释
  • 第6章 通用模式操作
  • 6.1 模型管理操作
  • 6.2 合并操作
  • 6.3 模型生成操作
  • 6.4 逆映射操作
  • 6.5 模型管理系统
  • 参考文献注释
  • 第7章 数据匹配
  • 7.1 问题定义
  • 7.2 规则匹配
  • 7.3 学习匹配
  • 7.4 聚类匹配
  • 7.5 概率匹配
  • 7.5.1 贝叶斯网络
  • 7.5.2 基于朴素贝叶斯的数据匹配
  • 7.5.3 特征相关性
  • 7.5.4 文本中的实体指代匹配
  • 7.6 协同匹配
  • 7.6.1 基于聚类的协同匹配
  • 7.6.2 协同匹配文档中的实体指代
  • 7.7 数据匹配的可扩展性
  • 7.7.1 规则匹配扩展
  • 7.7.2 其他匹配方法的扩展
  • 参考文献注释
  • 第8章 查询处理
  • 8.1 背景:DBMS查询处理
  • 8.1.1 选择查询执行计划
  • 8.1.2 执行查询计划
  • 8.2 背景:分布式查询处理
  • 8.2.1 数据放置和转移
  • 8.2.2 两阶段连接
  • 8.3 数据集成查询处理
  • 8.4 生成初始查询计划
  • 8.5 互联网数据的查询执行
  • 8.5.1 多线程、流水线、数据流架构
  • 8.5.2 有自治数据源的接口
  • 8.5.3 故障处理
  • 8.6 自适应查询处理
  • 8.7 事件驱动自适应策略
  • 8.7.1 数据源故障和延迟处理
  • 8.7.2 处理流水线操作结束时突发的基数问题
  • 8.8 性能驱动的自适应策略
  • 8.8.1 Eddy:基于队列的计划选择
  • 8.8.2 校正查询处理:基于代价的重新优化
  • 参考文献注释
  • 第9章 包装器
  • 9.1 引言
  • 9.1.1 包装器的构建
  • 9.1.2 包装器构建面临的挑战
  • 9.1.3 构建方法的分类
  • 9.2 手动的包装器构建
  • 9.3 基于学习的包装器构建
  • 9.3.1 HLRT包装器
  • 9.3.2 Stalker包装器
  • 9.4 无模式的包装器学习
  • 9.4.1 建模数据源模式TS和抽取程序EW
  • 9.4.2 推导数据模式TS和抽取程序EW
  • 9.5 交互的包装器构建
  • 9.5.1 使用Stalker交互标记页面
  • 9.5.2 使用Poly识别正确的抽取规则
  • 9.5.3 用Lixto创建抽取规则
  • 参考文献注释
  • 第10章 数据仓库与缓存
  • 10.1 数据仓库
  • 10.1.1 数据仓库设计
  • 10.1.2 ETL:抽取/转换/加载
  • 10.2 数据交换:描述性仓库
  • 10.2.1 数据交换设置
  • 10.2.2 数据交换解
  • 10.2.3 通用解
  • 10.2.4 核心通用解
  • 10.2.5 查询物化信息库
  • 10.3 缓存及部分物化
  • 10.4 本地、外部数据的直接分析
  • 参考文献注释
  • 第二部分 扩展数据表示集成
  • 第11章 XML
  • 11.1 数据模型
  • 11.2 XML结构和模式定义
  • 11.2.1 文档类型定义
  • 11.2.2 XML模式
  • 11.3 查询语言
  • 11.3.1 先驱:DOM和SAX
  • 11.3.2 XPath:XML查询原语
  • 11.3.3 XQuery:XML查询能力
  • 11.4 XML查询处理
  • 11.4.1 XML路径匹配
  • 11.4.2 XML输出
  • 11.4.3 XML查询优化
  • 11.5 XML模式映射
  • 11.5.1 嵌套映射
  • 11.5.2 带嵌套映射的查询重写
  • 参考文献注释
  • 第12章 本体和知识表示
  • 12.1 数据集成中的知识表示举例
  • 12.2 描述逻辑
  • 12.2.1 描述逻辑的语法
  • 12.2.2 描述逻辑的语义
  • 12.2.3 描述逻辑的推理
  • 12.2.4 描述逻辑和数据库推理的比较
  • 12.3 语义Web
  • 12.3.1 资源描述框架
  • 12.3.2 RDF模式
  • 12.3.3 Web本体语言
  • 12.3.4 RDF查询:SPARQL语言
  • 参考文献注释
  • 第13章 不确定性数据集成
  • 13.1 不确定性表示
  • 13.1.1 概率数据表示
  • 13.1.2 从不确定性到概率
  • 13.2 不确定模式映射建模
  • 13.2.1 概率映射
  • 13.2.2 概率映射的语义
  • 13.2.3 表语义
  • 13.2.4 元组语义
  • 13.3 不确定性和数据溯源
  • 参考文献注释
  • 第14章 数据溯源
  • 14.1 溯源的两种表示方法
  • 14.1.1 使用数据标注表示溯源
  • 14.1.2 使用数据关系图表示溯源
  • 14.1.3 两种表示方法的可交换性
  • 14.2 数据溯源的应用
  • 14.3 溯源半环
  • 14.3.1 半环形式化模型
  • 14.3.2 半环模型的应用
  • 14.4 溯源的存储
  • 参考文献注释
  • 第三部分 新型集成系统
  • 第15章 Web数据集成
  • 15.1 Web数据的用途
  • 15.2 深层网络
  • 15.2.1 垂直搜索
  • 15.2.2 深层网络浅层化
  • 15.3 主题门户网站
  • 15.4 Web数据的轻量级集成
  • 15.4.1 发现Web中的结构化数据
  • 15.4.2 导入数据
  • 15.4.3 合并多个数据集
  • 15.4.4 重用他人工作成果
  • 15.5 “即付即用”数据管理
  • 参考文献注释
  • 第16章 关键字搜索:按需集成
  • 16.1 结构化数据中的关键字搜索
  • 16.1.1 数据图
  • 16.1.2 关键字匹配和评分模型
  • 16.2 结果排名计算
  • 16.2.1 图扩展算法
  • 16.2.2 基于阈值的合并
  • 16.3 数据集成中的关键字搜索
  • 16.3.1 以可扩展的方式自动地构建边
  • 16.3.2 可扩展的查询应答
  • 16.3.3 通过学习算法调整边和节点的权重
  • 参考文献注释
  • 第17章 对等数据集成
  • 17.1 对等节点和映射
  • 17.2 映射的语义
  • 17.3 PDMS查询应答的复杂性
  • 17.3.1 有环PDMS
  • 17.3.2 对等映射中的比较谓词
  • 17.4 查询重写算法
  • 17.5 组合映射
  • 17.6 采用松散映射进行对等数据管理
  • 17.6.1 基于相似度的映射
  • 17.6.2 映射表
  • 参考文献注释
  • 第18章 支持协同的集成
  • 18.1 协同因何而不同
  • 18.2 处理校正和反馈
  • 18.2.1 直接向下传播的用户更新
  • 18.2.2 回溯传播的反馈或更新
  • 18.3 协同标注与表达
  • 18.3.1 映射作为标注:轨迹
  • 18.3.2 评论和讨论作为标注
  • 18.4 动态数据:协同数据共享
  • 18.4.1 基本架构
  • 18.4.2 映射更新与物化实例
  • 18.4.3 冲突协调
  • 参考文献注释
  • 第19章 数据集成的未来
  • 19.1 不确定性、溯源和清理
  • 19.2 众包和“人计算”
  • 19.3 构建大规模结构化Web数据库
  • 19.4 轻量级集成
  • 19.5 集成数据可视化
  • 19.6 社交媒体集成
  • 19.7 基于集群和云的并行处理与缓存
  • 参考文献
  • 索引

以上就是本次关于书籍资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。

数据集成相关资源

  • 面向对象程序设计教程(第2版)

    面向对象程序设计教程(第2版) 课后答案

    本书是《面向对象程序设计教程(C++语言描述)》(简称主教材)一书的配套辅助教材,其内容包括3部分: 第1部分是主教材中的全部习题和参考解答; 第2部分是主教材中全部实验题和参考解答; 第3部分是课程设计指导,该部分首先介绍课程设计的目标,然后通过几个综合实例,循序渐进地启发学生完成设计。 本书可作为高等院校计算机及相关专业学习面向对象程序设计和C++语言程序设计的辅助教材,也可供自学者或教师参考。 目录 第1部分习题和

    大小:977 KB面向对象课后答案

  • C语言大学教程(第8版)

    本书是全球畅销的C语言教程之一。全书系统地介绍了4种当今流行的程序设计方法面向过程、基于对象、面向对象以及泛型编程,内容全面、生动、易懂,作者由浅入深地介绍了结构化编程及软件工程的基本概念,从简单的概念到*终的完整的语言描述,清晰、准确、透彻、详细地讲解了C语言,尤其注重程序设计思想和方法的介绍。相对于上一版,这一版在内容方面新增加了C安全程序设计、更上一层楼练习集,更新了C 和面向对象程序设计、基于Allegro的

    大小:132 MBC语言

  • 《中文版CorelDRAW X7基础培训教程(移动学习版)》素材,PPT

    《中文版CorelDRAW X7基础培训教程(移动学习版)》素材,PPT

    内容介绍 CorelDRAW 是用户需求量大、深受个人和企业青睐的矢量图制作软件之一,被广泛应用于 广告设计、排版等领域。本书针对 CorelDRAW X7 软件,讲解 CorelDRAW 各个工具和功能的使 用方法:首先对 CorelDRAW 图形设计基础知识进行详细介绍;然后分别介绍图形的绘制、编辑、轮廓设置与颜色填充,以及对象编辑、交互式特效运用、文本处理、表格应用、位图处理等 知识;*后将CorelDRAW 操作与平面设计相结合,通过案例的制作对全书知识进行综合应用。其中

    大小:2 GBCorelDRAW配套资源

  • 《Adobe Photoshop CC经典教程(彩色版)》配套资源

    《Adobe Photoshop CC经典教程(彩色版)》配套资源

    编辑推荐 Adobe公司推出的权威经典教程。 畅销全球20年的著名品牌图书。 在全世界以27种语言火爆发行。 国内逾300家学校用作培训教材。 由Adobe专家撰写的经典教程。 以实例引导的正规学习用书。 让每位Adobe Photoshop用户有机会学习Adobe专家的使用技巧。 提供完整教学资源:素材文件、复习题及答案。 学习如何校正、修饰和修复数码照片;创建合成图像;准备用于打印和Web的图像;使用动作来自行执行任务,其中包括基于判断标准来运行的条件动作;编

    大小:725.27 MBPhotoshop配套资源

  • 《黑客攻防从入门到精通(黑客与反黑客工具篇)第2版》配书资源

    《黑客攻防从入门到精通(黑客与反黑客工具篇)第2版》配书资源

    本书从攻防两个不同的角度出发,在讲解黑客攻击手段的同时,介绍相应的防范方法,图文并茂地再现网络入侵与防御的全过程。本书内容涵盖黑客必备小工具、扫描与嗅探工具、注入工具、密码攻防工具、病毒攻防工具、木马攻防工具、网游与网吧攻防工具、黑客入侵检测工具、清理入侵痕迹工具、网络代理与追踪工具、局域网黑客工具、远程控制工具、QQ聊天工具、系统和数据的备份与恢复工具、系统安全防护工具、手机软件的安全防护等,由浅入

    大小:24.7 MB黑客攻防配套资源

资源下载

相关声明:

数据集成学习笔记

11小时1分钟前回答

SpringBoot集成多数据源解析

一,前面我们介绍了springboot的快速启动,大家肯定对springboot也有所了解,下面我们来介绍一下springboot怎么集成多数据源。 在有的项目开发中需要在一个项目中访问多个数据源或者两个项目之间通信(实质上是互相访问对方的数据库),在这里,我们介绍一下在一个项目中如何集成多个数据源(即访问多个不同的数据库),因为在项目中有时会有这种需求,比如在一个大型项目……

13小时42分钟前回答

Spring boot 集成 Druid 数据源过程详解

Druid是阿里开源的一个JDBC应用组件,其中包括三部分: DruidDriver:代理Driver,能够提供基于Filter-Chain模式的插件体系。 DruidDataSource:高效可管理的数据库连接池。 SQLParser:实用SQL语法分析 官方文档:https://github.com/alibaba/druid/wiki 依赖 pom.xml Druid Spring Boot Starter是阿里官方提供的Spring Boot插件,用于在Spring Boot项目中集成Druid数据库连接池和监控 !-- druid --dependency groupIdcom.alibaba/grou……