数据湖架构

企业采购书卡请拔打028-83157469,团购书目请拨打19113427458(法定工作日9:00-17:00)

定  价 :
¥ 49.00
文 轩 价 :
¥32.30 (6.6折)
库  存 :
库存紧张
作  者 :
[美] Bill Inmon 恩门吴文磊
所属分类 :
图书 > 行业职业 > 计算机 > 数据库
促销活动 :
❤老客户回馈,积分换礼券,购书更实惠
❤图书订单大陆地区包邮(新疆西藏运费每单20元)
详情 >>
购买数量 :
- + 此商品已售出 21
立即购买
服  务 :
由"文轩网"直接销售和发货,并提供售后服务
正品低价| 闪电发货|货到付款| 高效退换货
  • 作 者: [美] Bill Inmon 恩门吴文磊
  • 出版社: 人民邮电出版社
  • 出版时间:2017-04-01
  • 开 本:其他
  • 页 数:145
  • 印刷时间:2017-04-01
  • 字 数:123000.000
  • 装 帧:简装
  • 语  种:中文
  • 版 次:1
  • 印 次:1
  • I S B N:9787115451736

目录

章  数据的湖泊  1 1.1  大数据来了  1 1.2  数据湖来了  2 1.3  “单向”的数据湖  3 1.4  小结  6 第2章  改造数据湖  7 2.1  元数据  7 2.2  整合图谱  8 2.3  数据科学家  11 2.4  通用性  12 2.5  小结  13 第3章  数据湖内部  14 3.1  模拟信号数据  15 3.2  应用程序数据  17 3.3  文本数据  18 3.4  另一个视角  20 3.5  小结  21 第4章  数据池  22 4.1  数据修整  23 4.2  初始数据池  23 4.3  模拟信号数据池  24 4.4  应用程序数据池  25 4.5  文本数据池  25 4.6  将数据直接传入数据池  26 4.7  归档数据池  26 4.8  小结  27 第5章  数据池的通用结构  28 5.1  数据池描述  29 5.2  数据池目标  30 5.3  数据池数据  30 5.4  数据池元数据  31 5.5  数据池元过程  32 5.6  数据转换标准  33 5.7  小结  34 第6章  模拟信号数据池  35 6.1  模拟信号数据问题  35 6.2  数据描述  36 6.3  捕获初始数据、转换初始数据  37 6.4  转换/调整 初始模拟信号数据  38 6.5  数据切除  40 6.6  聚类数据  41 6.7  数据关系  42 6.8  未来使用的可能性  44 6.9  异常值  45 6.10  临时性的特定分析  47 6.11  小结  47 第7章  应用程序数据池  49 7.1  数据的基因  49 7.2  数据描述  50 7.3  标准数据库格式  51 7.4  数据的基本组织  52 7.5  数据的整合  52 7.6  数据模型  53 7.6  整合的必要性  54 7.7  从一个应用指向到下一个应用  56 7.8  交并应用  57 7.9  应用程序数据池内的数据子集  58 7.10  小结  58 第8章  文本数据池  60 8.1  文本消歧  62 8.2  传入数据池的文本  62 8.3  文本消歧的输出  63 8.4  固有的复杂性  64 8.5  文本消歧的功能  66 8.6  分类与本体  66 8.7  文本与语境的价值  68 8.8  对文本追根溯源  69 8.9  消歧的机制  69 8.10  分析数据库  70 8.11  将结果可视化  71 8.12  小结  73 第9章  数据池间的对比  74 9.1  数据池的相似性  74 9.2  数据池间的差异性  75 9.3  数据最终状态的关系型格式  75 9.4  技术间差异  76 9.5  数据池中数据的总预期容量  76 9.6  数据池间的数据移动  77 9.7  在多个数据池进行分析  78 9.8  使用元数据来关联不同数据池内的数据  78 9.9  假如……?  79 9.10  小结  80 0章  利用基础架构  82 10.1  “单向”数据湖  83 10.2  改造数据湖  83 10.3  转换技术  84 10.4  一些分析问题  84 10.5  查询文本数据  87 10.6  真实的分析  88 10.7  小结  89 1章  搜索与分析  90 11.1  供应商所散布的困惑  95 11.2  小结  96 2章  数据池中的业务价值  97 12.1  模拟信号数据池中的业务价值  97 12.2  应用程序数据池中的业务价值  99 12.3  文本数据池中的业务价值  100 12.4  记录中的业务价值比例  101 12.5  小结  102 3章  一些额外话题  104 13.1  高层系统级别文档  104 13.2  详细的数据池级别文档  105 13.3  什么样的数据会流入数据湖/数据池  105 13.4  分析在何处发生  107 13.5  数据的年龄  110 13.6  数据的安全  110 13.7  小结  111 4章  分析与整合工具  112 14.1  可视化  112 14.2  搜索与修正  113 14.3  文本消歧  114 14.4  统计分析  114 14.5  经典的ETL处理  115 14.6  小结  116 5章  归档数据池  117 15.1  数据的移除标准  118 15.2  结构性改动  118 15.3  小结  119 术语表  120 参考资料  124

作者简介

Bill Inmon是“数据仓库之父”,他著有57本书,并以9种语言在优选出版。Bill近期的创举是建立了叫做“文本消歧”的技术,这项技术能以叙述性格式读取初始文本,并能够将文本置于常规的数据库中,以便使用标准的分析技术进行分析处理,从而为大数据/非结构化数据创造独特的业务价值。Bill曾被《计算机世界杂志(ComputerWorld)》评选为“历目前对计算机行业影响zuida的十个人之一”。Bill住在美国科罗拉多州的堡石城(Castle Rock)。关于文本消歧的更多资料,请访问 www.forestrimtech.com。

主编推荐

众多公司花费了大量的时间和金钱获取数据,并将大量的数据保存在一个叫做数据湖的数据容器中。但是,其中又能有多少公司把数据从数据湖中取回并加以利用呢?事实上,很少有公司能把数据湖当成信息的金矿来使用。多数公司zui终得到的仅仅是一个垃圾场。 本书将会告诉你如何去构建一个有用的数据湖,从而让数据科学家与数据分析师能够面对业务挑战并发现新的商机。 通过阅读本书,你将能够学习如何: ?构建数据湖并模拟数据; ?应用数据及基于文本的数据池,从而将业务价值zuida化; ?理解原始数据池的角色定位; ?掌握使用归档数据池的时机; ?利用4大核心组件:元数据、业务的整合对应,语境及元过程信息。 本书的作者曾经让我们放眼于数据仓库的架构与成效,如今他又将我们带入到数据湖架构的新高度。

内容简介

随着大数据的蓬勃发展,不少机构开始将源源不断的数据流导入到一个叫“数据湖”的设备中去。 数据湖架构 是“数据仓库”之父撰写的全新著作,是帮助读者认识数据湖架构,并把数据湖打造成公司资产的指导手册。数据湖架构 共15章,分别涉及数据湖简介、数据池据湖内部结构、数据池及其结构、各种类型的数据池等技术话题,目的在于讲解如何构建有用的数据湖,以便数据科学家和数据分析师能够解决商业挑战并找出新的商业机会。 数据湖架构 适合数据管理者、学生、系统开发人员、架构师、程序员以及zui终用户阅读。

价格说明

定价:为出版社全国统一定价;

文轩价:为商品的销售价,是您最终决定是否购买商品的依据;受系统缓存影响,最终价格以商品放入购物车后显示的价格为准;

关于新广告法声明

新广告法规定所有页面信息中不得出现绝对化用词和功能性用词。

本店非常支持新广告法,但为了不影响消费者正常购买,页面明显区域本店已在排查修改,对于不明显区域也将会逐步排查并修改,我们此郑重声明:本店所有页面上的绝对化用词与功能性用词在此声明全部失效,不作为赔付理由。涉及“教育部声明”中的商品,均不代表教育部指定、推荐的具体版本,仅代表该商品的内容为指定、推荐书目。因极限用词引起的任何形式的商品赔付,本店不接收且不妥协。希望消费者理解并欢迎联系客服帮助完善,也请职业打假人士高抬贵手。