数据处理与知识发现 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

数据处理与知识发现电子书下载地址
内容简介:
本书系统地介绍了数据预处理、数据仓库和数据挖掘的原理、方法及应用技术, 以及采用Mahout 对相应的挖掘算法进行实际练习。本书共有11 章, 分为两大部分。第1 ~7 章为理论部分。第1 章为绪论, 介绍了数据挖掘与知识发现领域中的一些基本理论、研究方法等, 也简单介绍了Hadoop 生态系统中的Mahout; 第2 ~7 章按知识发现的过程, 介绍数据预处理的方法和技术、数据仓库的构建与OLAP 技术、数据挖掘原理及算法(包括关联规则挖掘、聚类分析方法、分类规则挖掘)、常见的数据挖掘工具与产品。第8 ~11 章为实验部分, 采用Mahout 对数据挖掘各类算法进行实际练习。
本书应用性较强, 与实践相结合, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势。
本书既便于教师课堂讲授, 又便于自学者阅读, 可作为高等院校高年级学生“数据挖掘技术” “数据仓库与数据挖掘” “数据处理与智能决策”等课程的教材。
书籍目录:
目录
前 言
上篇 理论部分
第1 章 绪论 2
1. 1 KDD 与数据挖掘 2
1. 1. 1 KDD 的定义 2
1. 1. 2 KDD 过程与数据挖掘 3
1. 2 数据挖掘的对象 4
1. 3 数据挖掘的任务 8
1. 4 Mahout 简介 12
1. 4. 1 Mahout 12
1. 4. 2 Mahout 算法库 13
1. 4. 3 Mahout 应用 16
1. 5 小结 17
1. 6 习题 17
第2 章 数据预处理 18
2. 1 数据概述 18
2. 1. 1 属性与度量 19
2. 1. 2 数据集的类型 23
2. 2 数据预处理 27
2. 2. 1 数据预处理概述 28
2. 2. 2 数据清理 30
2. 2. 3 数据集成 34
2. 2. 4 数据变换 38
2. 2. 5 数据归约 40
2. 2. 6 离散化与概念分层 48
2. 3 小结 52
2. 4 习题 53
第3 章 数据仓库 55
3. 1 数据仓库概述 55
3. 1. 1 从数据库到数据仓库 55
3. 1. 2 数据仓库 56
3. 1. 3 数据仓库系统结构 59
3. 1. 4 数据仓库中的名词 59
3. 2 数据仓库的ETL 60
3. 2. 1 ETL 的基本概念 60
3. 2. 2 ETL 的工具 60
3. 3 元数据与外部数据 62
3. 3. 1 元数据的定义 62
3. 3. 2 元数据的存储与管理 63
3. 3. 3 外部数据 64
3. 4 数据仓库模型及数据仓库的建立 65
3. 4. 1 多维数据模型 65
3. 4. 2 多维数据模型的建立 67
3. 5 联机分析处理OLAP 技术 73
3. 5. 1 OLAP 概述 73
3. 5. 2 OLAP 与数据仓库 75
3. 5. 3 OLAP 的模型 77
3. 5. 4 OLAP 的基本操作 79
3. 6 数据仓库实例 80
3. 6. 1 数据仓库的创建 81
3. 6. 2 数据的提取、转换和加载 83
3. 7 小结 83
3. 8 习题 83
第4 章 关联规则挖掘 84
4. 1 问题定义 85
4. 1. 1 购物篮分析 85
4. 1. 2 基本术语 85
4. 2 频繁项集的产生 87
4. 2. 1 先验原理 88
4. 2. 2 Apriori 算法的频繁项集产生 90
4. 3 规则产生 94
4. 3. 1 基于置信度的剪枝 94
4. 3. 2 Apriori 算法中规则的产生 94
4. 4 FP-growth 算法 95
4. 5 多层关联规则和多维关联规则 99
4. 5. 1 多层关联规则 99
4. 5. 2 多维关联规则 102
4. 6 非二元属性的关联规则 103
4. 7 关联规则的评估 104
4. 8 序列模式挖掘算法 106
4. 8. 1 序列模式的概念 106
4. 8. 2 Apriori 类算法———AprioriAll
算法 109
4. 9 小结 114
4. 10 习题 115
第5 章 聚类分析方法 118
5. 1 聚类分析概述 118
5. 1. 1 聚类的定义 118
5. 1. 2 聚类算法的要求 119
5. 1. 3 聚类算法的分类 120
5. 1. 4 相似性的测度 121
5. 2 基于划分的聚类算法 126
5. 2. 1 基于质心的(Centroid-based)
划分方法———基本K-means
聚类算法 126
5. 2. 2 K-means 聚类算法的拓展 128
5. 2. 3 基于中心的(Medoid-based)
划分方法———PAM 算法 130
5. 3 层次聚类算法 133
5. 3. 1 AGNES 算法 136
5. 3. 3 改进算法———BIRCH 算法 137
5. 3. 4 改进算法———CURE 算法 141
5. 4 基于密度的聚类算法 143
5. 5 聚类算法评价 147
5. 6 离群点挖掘 149
5. 6. 1 相关问题概述 149
5. 6. 2 基于距离的方法 150
5. 6. 3 基于相对密度的方法 154
5. 7 小结 158
5. 8 习题 158
第6 章 分类规则挖掘 160
6. 1 分类问题概述 160
6. 2 近邻分类法 162
6. 2. 1 KNN 算法原理 162
6. 2. 2 KNN 算法的特点及改进 165
6. 2. 3 基于应用平台的KNN 算法应用
实例 166
6. 3 决策树分类方法 167
6. 3. 1 决策树概述 167
6. 3. 2 信息论 171
6. 3. 3 ID3 算法 172
6. 3. 4 算法改进: C4. 5 算法 176
6. 4 贝叶斯分类方法 180
6. 4. 1 贝叶斯定理 181
6. 4. 2 朴素贝叶斯分类器 183
6. 4. 3 朴素贝叶斯分类方法的改进 185
6. 5 神经网络算法 188
6. 5. 1 前馈神经网络概述 188
6. 5. 2 学习前馈神经网络 189
6. 5. 3 BP 神经网络模型与学习算法 191
6. 6 回归分析 193
6. 7 小结 196
6. 8 习题 197
第7 章 数据挖掘工具与产品 198
7. 1 评价数据挖掘产品的标准 198
7. 2 数据挖掘工具简介 200
7. 3 数据挖掘的可视化 203
7. 3. 1 数据挖掘可视化的过程与方法 203
7. 3. 2 数据挖掘可视化的分类 204
7. 3. 3 数据挖掘可视化的工具 206
7. 4 Weka 207
7. 4. 1 Weka Explorer 208
7. 4. 2 Weka Experimenter 216
7. 4. 3 KnowledgeFlow 219
7. 5 小结 221
7. 6 习题 221
下篇 实验部分
第8 章 Mahout 入门 224
8. 1 Mahout 安装前的准备 224
8. 1. 1 安装JDK 224
8. 1. 2 安装Hadoop 227
8. 2 Mahout 的安装 237
8. 3 测试安装 238
8. 4 小结 239
第9 章 使用Mahout 实践关联规则
算法 240
9. 1 FP 树关联规则算法 240
9. 1. 1 Mahout 中Parallel Frequent Pattern
Mining 算法的实现原理 240
9. 1. 2 Mahout 的Parallel F
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
前言
前言
现在的社会是一个高速发展的社会, 科技发达, 信息畅通, 人们之间的交流越来越密切, 生活也越来越方便, 大数据就是这个高科技时代的产物, 并且将会以更多、更复杂、更多样化的方式持续增长。大数据的复杂化和格式多样化, 决定了应用服务平台中针对大数据的服务场景和类型的多样化, 从而要求应用服务平台必须融合大数据技术来应对, 传统的数据存储和分析技术已无法满足应用的需求。
目前行业中使用广泛的大数据平台是基于Apache 开源社区版本的Hadoop 生态体系,阿里巴巴、腾讯、百度、脸书(Facebook) 等国内外各大互联网公司的系统基本都采用Hadoop生态系统, 来完成数据存储和处理。事实上, 在未来2 ~3 年预计有超过50% 的大数据项目会在Hadoop 框架下运行。
在大数据时代, 大学生应具备一定的大数据处理能力。本书围绕大数据背景下的数据处理和知识发现问题, 从基本概念入手, 由浅入深、循序渐进地介绍了数据处理与知识发现过程中的数据预处理技术、数据仓库技术、数据挖掘的基本方法, 并在后使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势。
目前, 数据处理与知识发现及应用方法逐渐成为各高校信息类和管理类本科专业的必修内容。本书作为立足于本科教学的教材, 具有如下特色:
(1) 在逻辑安排上循序渐进, 由浅入深, 便于读者系统学习。
(2) 内容丰富, 信息量大, 融入了大量本领域的新知识和新方法。
(3) 作为教材, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用Mahout 实践各种挖掘算法, 符合大数据的发展趋势。
(4) 图文并茂, 形式生动, 可读性强。
本书的编写得到了武汉民办高校合作联盟、武昌首义学院信息科学与工程学院和机械工业出版社的大力支持和帮助, 在此深表谢意!
由于编者水平有限, 书中难免会出现不足之处, 欢迎读者批评指证。如果您有更多的宝贵意见, 欢迎发邮件至邮箱xuqin@ wsyu. edu. cn。
编 者
网站评分
书籍多样性:8分
书籍信息完全性:7分
网站更新速度:9分
使用便利性:5分
书籍清晰度:7分
书籍格式兼容性:7分
是否包含广告:6分
加载速度:6分
安全性:3分
稳定性:4分
搜索功能:6分
下载便捷性:5分
下载点评
- 好评(542+)
- 简单(218+)
- 排版满分(163+)
- 不亏(227+)
- 实惠(156+)
- 全格式(543+)
- 字体合适(673+)
- 少量广告(577+)
下载评价
- 网友 沈***松:
挺好的,不错
- 网友 曾***文:
五星好评哦
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 养***秋:
我是新来的考古学家
- 网友 温***欣:
可以可以可以
- 网友 寿***芳:
可以在线转化哦
- 网友 孔***旋:
很好。顶一个希望越来越好,一直支持。
- 网友 冯***卉:
听说内置一千多万的书籍,不知道真假的
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 后***之:
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
喜欢"数据处理与知识发现"的人也看了
考研英语大纲词汇全新权解 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
Visual FoxPro程序设计习题·实验·应用案例/高等学校教材财经管理与计算机应用 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
【3岁以上适读】小泥人 绘本硬壳精装蒲蒲兰图画书系列伊东宽儿童图画书3-4-6岁幼儿园经典育儿教育彩色铜版纸图画书 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
第三极 五洲传播出版社 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
城市房屋拆迁100问 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
《紫砂壶鉴藏全书》 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
蓝瓶物语 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
商业伦理 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
企业法税融合实务指南 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
2020-2022年版高考历史一模卷合订本+答案 领先一步文化课强化训练上海市高中高三学期末质量抽查试卷精编 高考历史一模合订本 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 建筑设计与室内设计草图表现 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 生物医学工程学概论 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 书虫美绘版第1级1内含5本书附光盘牛津初一初二绿玉王冠坎特伯雷故事集木乃伊的诅咒漂亮女孩快乐王子书虫系列英语阅读外研社包邮正版 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 法语交际口语渐进 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 志欧米茄投资购买指南//世界名表品收藏鉴赏品鉴手表腕表收藏品鉴大全书籍名表制作工艺历史工艺之美 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 矫健走兽-快乐亲子折纸 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 保卫萝卜萌漫画 谁是明日之星 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 读书的革命 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 瘦身,重启人生 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
- 新编初中文言文助读杨振中 七八九年级文言文启蒙教材东方出版中心789语文教材同步配套扩展阅读初中文言文助读中考辅导复习一本全 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载
书籍真实打分
故事情节:5分
人物塑造:4分
主题深度:8分
文字风格:4分
语言运用:6分
文笔流畅:5分
思想传递:6分
知识深度:8分
知识广度:5分
实用性:4分
章节划分:5分
结构布局:5分
新颖与独特:7分
情感共鸣:6分
引人入胜:8分
现实相关:6分
沉浸感:4分
事实准确性:8分
文化贡献:9分