数据挖掘:概念与技术(英文版·第3版)
作者 : (美)Jiawei Han伊利诺伊大学厄巴纳-尚佩恩分校 (加)Micheline Kamber西蒙-弗雷泽大学 (加)Jian Pei西蒙-弗雷泽大学 著
丛书名 : 经典原版书库
出版日期 : 2012-02-24
ISBN : 978-7-111-37431-2
定价 : 118.00元
教辅资源下载
扩展信息
语种 : 英文
页数 : 732
开本 : 16
原书名 : Data Mining: Concepts and Techniques, Third Edition
原出版社: Elsevier
属性分类: 教材
包含CD :
绝版 :
图书简介

本书从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。

图书特色

当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那这本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。
我们生活在数据洪流的时代。本书向我们展示了如何从这样海量的数据中找到有用知识的方法和技术。最新的第3版显著扩充了数据预处理、挖掘频繁模式、分类和聚类这几个核心章节的内容;还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。本书将是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材。
—— Gregory Piatetsky-Shapiro, KDnuggets的总裁
Jiawei、Micheline和Jian的教材全景式地讨论了数据挖掘的所有相关方法,从聚类和分类的经典主题,到数据库方法(关联规则、数据立方体),到更新和更高级的主题(SVD/PCA、小波、支持向量机),等等。总的说来,这是一本既讲述经典数据挖掘方法又涵盖大量当代数据挖掘技术的优秀著作,既是教学相长的优秀教材,又对专业人员具有很高的参考价值。
—— 摘自卡内基-梅隆大学Christos Faloutsos教授为本书所作序言
本书特点
引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。
全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。
数据挖掘领域最具里程碑意义的经典著作
完整全面阐述该领域的重要知识和技术创新

上架指导

计算机\数据挖掘

封底文字

数据挖掘领域最具里程碑意义的经典著作
完整全面阐述该领域的重要知识和技术创新

我们生活在数据洪流的时代。本书向我们展示了如何从这样海量的数据中找到有用知识的方法和技术。最新的第3版显著扩充了数据预处理、挖掘频繁模式、分类和聚类这几个核心章节的内容;还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。本书将是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材。   ——Gregory Piatetsky-Shapiro, KDnuggets的总裁
Jiawei、Micheline和Jian的教材全景式地讨论了数据挖掘的所有相关方法,从聚类和分类的经典主题,到数据库方法(关联规则、数据立方体),到更新和更高级的主题(SVD/PCA,小波,支持向量机),等等。总的说来,这是一本既讲述经典数据挖掘方法又涵盖大量当代数据挖掘技术的优秀著作,既是教学相长的优秀教材,又对专业人员具有很高的参考价值。 
——摘自卡内基-梅隆大学Christos Faloutsos教授为本书所作序言,

当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供最佳算法,并对怎样运用技术到实际工作中给出了经过实践检验的实用型规则。如果你希望自己能熟练掌握和运用当今最有力的数据挖掘技术,那这本书正是你需要阅读和学习的宝贵资源。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都必读的一本书。
本书特点
●引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
●讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。
  ● 全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。

图书目录

Foreword to Second Edition
Preface
Acknowledgments
About the Authors

Chapter1 Introduction
Why Data Mining
Moving toward the Information Age
Data Mining as the Evolution of Information Technology
What Is Data Mining
What Kinds of Data Can Be Mined
Database Data
Data Warehouses
Transactional Data
Other Kinds of Data
What Kinds of Patterns Can Be Mined
Class/Concept Description: Characterization and Discrimination
Mining Frequent Patterns, Associations, and Correlations
Classification and Regression for Predictive Analysis
Cluster Analysis
Outlier Analysis
Are All Patterns Interesting
Which Technologies Are Used
Statistics
Machine Learning
Database Systems and Data Warehouses
Information Retrieval
Which Kinds of Applications Are Targeted
Business Intelligence
Web Search Engines
Major Issues in Data Mining
Mining Methodology
User Interaction
Efificiency and Scalability
Diversity of Database Types
Data Mining and Society
Summary
Exercises
Bibliographic Notes

Chapter 2 Getting to Know Your Data
Data Objects and Attribute Types
What Is an Attribute
Nominal Attributes
Binary Attributes
Ordinal Attributes
Numeric Attributes
Discrete versus Continuous Attributes
Basic Statistical Descriptions of Data
Measuring the Central Tendency: Mean, Median, and Mode
Measuring the Dispersion of Data: Range, Quartiles, Variance,
Standard Deviation, and Interquartile Range
Graphic Displays of Basic Statistical Descriptions of Data
Data Visualization
PixeI-Oriented Visualization Techniques
Geometric Projection Visualization Techniques
Icon-Based Visualization Techniques
Hierarchical Visualization Techniques
Visualizing Complex Data and Relations
Measuring Data Similarity and Dissimilarity
Data Matrix versus Dissimilarity Matrix
Proximity Measures for Nominal Attributes
Proximity Measures for Binary Attributes
Dissimilarity of Numeric Data: Minkowski Distance
Proximity Measures for Ordinal Attributes
Dissimilarity for Attributes of Mixed Types
Cosine Similarity
Summary
Exercises
Bibliographic Notes
……
Chapter 3 Data Preprocessing
Chapter 4 Data Warehousing and Online Analytical Processin
Chapter 5 Data Cube Technology
Chapter 6 Mining Frequent Patterns, Associations, and Correlations: Basic Concepts and Methods
Chapter 7 Advanced Pattern Mining
Chapter 8 Classification: Basic Concepts
Chapter 9 Classification: Advanced Methods
Chapter 10 Cluster Analysis: Basic Concepts and I~ethods
Chapter 11 Advanced Cluster Analysis
Chapter 12 Outlier Detection
Chapter 13 Data Mining Trends and Research Frontiers
Bibliography
Index

教学资源推荐
作者: Philip M. Lewis, Arthur Bernstein, Michael Kifer
作者: [英]托马斯 M. 康诺利(Thomas M. Connolly) 卡洛琳 E. 贝格(Carolyn E. Begg)著
作者: 熊建强,吴保珍,黄文斌
参考读物推荐
作者: 金培权,赵旭剑 编著
作者: 何勇 陈晓峰 著
作者: Robert J.Muller蓍