教学资源 – 图书教辅

扩展信息

语种 : 英文

页数 : 770

开本 : 16开

原书名 : Data Mining: Concepts and Techniques

原出版社: Elsevier

属性分类: 教材

包含CD : 无

绝版 : 无

图书简介

本书第2版更新和改进了原本已十分丰富和全面的第1版内容，并增添了新的重要课题，例如挖掘流数据、挖掘社群网络和挖掘空间、多媒体和其他复杂数据。本书将是一本适用于数据挖掘和知识发现课程的优秀教材。
　　　　　　　　　　　　　　　　　　　　　　－－Gregory Piatetsky-Shapiro, KDnuggets的总裁
　　本书第2版最完整、最全面地讲述了数据挖掘领域的重要知识和技术创新。相比内容已经相当全面的第1版，第2版展示了该领域的最新研究成果，例如挖掘流、时序数据和序列数据以及挖掘空间、多媒体、文本和Web数据。本书是数据挖掘和知识发现领域内所有教师、研究人员、开发人员和用户都必读的一本书。
　　　　　　　　　　　　　　　　　　　　　　－－Hans-Peter Kriegel, 德国慕尼黑大学

　　我们产生和收集数据的能力正在快速增长。除了大多数商业、科学和政府事务的日益计算机化会产生数据之外，数码相机、发布工具和条码的广泛应用也会产生数据。在数据收集方面，扫描的文本和图像平台、卫星遥感系统和国际互联网已经使我们的生活被巨大的数据量所包围。这种爆炸性的数据增长促使我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
　　本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著，是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展，重点关注其可行性、有用性、有效性和可伸缩性问题。但是，自第1版出版之后，数据挖掘领域的研究又取得了很大的进展，开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强，增加了多个章节讲述最新的数据挖掘方法，以便能够挖掘出复杂类型的数据，包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。
　　本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材，特别适合作为研究生的专业课教材，同时也可供从事数据挖掘研究和应用开发工作的相关人员作为必备的参考书。

本书主要特点
　　●全面实用地论述了从实际业务数据中抽取出的读者需要知道的概念和技术。
　　●更新并结合了来自读者的反馈、数据挖掘领域的技术变化以及统计和机器学习方面的更多资料。
　　●包含了许多算法和实现示例，全部以易于理解的伪代码编写，适用于实际的大规模数据挖掘项目。

图书特色

无

封底文字

无

作者简介

Jiawei Han,Micheline Kamber：Jiawei Han:　　伊利诺伊大学厄巴纳-尚佩恩分校计算机科学系教授。由于在数据挖掘和数据库系统领域卓有成效的研究工作，他曾多次获得各种荣誉和奖励，其中包括2004年ACM SIGKDD颁发的创新奖。同时，他还是《ACM Transactions on Knowledge Discovery from Data》杂志的主编，以及《IEEE Transactions on Knowledge and Data Engineering》和《Data Mining and Knowledge Discovery》杂志的编委会成员。
Micheline Kamber: Micheline Kamber 拥有加拿大康考迪亚大学计算机科学硕士学位，现在加拿大西蒙-弗雷泽大学从事博士后研究工作。

推荐序

无

图书目录

1 Introduction
1.1 What Motivated Data Mining Why Is It Important 1.2 So, What Is Data Mining 1.3 Data Mining--On What Kind of Data 1.4 Data Mining Functionalities What Kinds of Patterns Can Be Mined 1.5 Are All of the Patterns Interesting 1.6 Classification of Data Mining Systems 1.7 Data Mining Task Primitives 1.8 Integration of a Data Mining System with a Database or Data Warehouse System 1.9 Major Issues in Data Mining 1.10 Summary 1.11 Exercises 1.12 Bibliographic Notes

2 Data Preprocessing
2.1 Why Preprocess the Data 2.2 Descriptive Data Summarization 2.3 Data Cleaning 2.4 Data Integration and Transformation 2.5 Data Reduction 2.6 Data Discretization and Concept Hierarchy Generation 2.7 Summary 2.8 Exercises 2.9 Bibliographic Notes

3 Data Warehouse and OLAP Technology: An Overview
3.1 What Is a Data Warehouse 3.2 A Multidimensional Data Model 3.3 Data Warehouse Architecture 3.4 Data Warehouse Implementation 3.5 From Data Warehousing to Data Mining 3.6 Summary 3.7 Exercises 3.8 Bibliographic Notes

4 Data Cube Computation and Data Generalization 115
4.1 Efficient Methods for Data Cube Computation 4.2 Further Development of Data Cube and OLAP Technology 4.3 Attribute-Oriented Induction An Alternative Method for Data Generalization and Concept De- scription 4.4 Summary 4.5 Exercises 4.6 Bibliographic Notes

5 Mining Frequent Patterns, Associations, and Correlations 165
5.1 Basic Concepts and a Road Map 5.2 Efficient and Scalable Frequent Itemset Mining Methods 5.3 Mining Various Kinds of Association Rules 5.4 From Association Mining to Correlation Analysis 5.5 Constraint-Based Association Mining 5.6 Summary 5.7 Exercises 5.8 Bibliographic Notes

6 Classification and Prediction 207
6.1 What Is Classification What Is Prediction 6.2 Issues Regarding Classification and Prediction 6.3 Classification by Decision Tree Induction 6.4 Bayesian Classification 6.5 Rule-Based Classification 6.6 Classification by Backpropagation 6.7 Support Vector Machines 6.8 Associative Classification: Classification by Association Rule Analysis 6.9 Lazy Learners (or Learning from Your Neighbors) 6.10 Other Classification Methods 6.11 Prediction 6.12 Accuracy and Error Measures 6.13 Evaluating the Accuracy of a Classifier or Predictor 6.14 Ensemble Methods Increasing the Accuracy 6.15 Model Selection 6.16 Summary 6.17 Exercises 6.18 Bibliographic Notes

7 Cluster Analysis 281
7.1 What Is Cluster Analysis 7.2 Types of Data in Cluster Analysis 7.3 A Categorization of Major Clustering Methods 7.4 Partitioning Methods 7.5 Hierarchical Methods 7.6 Density-Based Methods 7.7 Grid-Based Methods 7.8 Model-Based Clustering Methods 7.9 Clustering High-Dimensional Data 7.10 Constraint-Based Cluster Analysis 7.11 Outlier Analysis 7.12 Summary 7.13 Exercises 7.14 Bibliographic Notes

8 Mining Stream, Time-Series, and Sequence Data
8.1 Mining Data Streams 8.2 Mining Time-Series Data 8.3 Mining Sequence Patterns in Transactional Databases 8.4 Mining Sequence Patterns in Biological Data 8.5 Summary 8.6 Exercises 8.7 Bibliographic Notes

9 Graph Mining, Social Network Analysis, and Multi-Relational Data Mining
9.1 Graph Mining 9.2 Social Network Analysis 9.3 Multi-Relational Data Mining 9.4 Summary 9.5 Exercises 9.6 Bibliographic Notes

10 Mining Object, Spatial, Multimedia, Text, and Web Data
10.1 Multidimensional Analysis and Descriptive Mining of Complex Data Objects 10.2 Spatial Data Mining 10.3 Multimedia Data Mining 10.4 Text Mining 10.5 Mining the World Wide Web 10.6 Summary 10.7 Exercises 10.8 Bibliographic Notes

11 Applications and Trends in Data Mining
11.1 Data Mining Applications 11.2 Data Mining System Products and Research Prototypes 11.3 Additional Themes on Data Mining 11.4 Social Impacts of Data Mining 11.5 Trends in Data Mining 11.6 Summary 11.7 Exercises 11.8 Bibliographic Notes