商务智能:数据分析的管理视角(原书第3版)
作者 : [美]拉姆什·沙尔达(Ramesh Sharda),杜尔森·德伦(Dursun Delen),埃弗雷姆·特班(Efraim Turban) 等著
译者 : 赵卫东 译
出版日期 : 2015-03-26
ISBN : 978-7-111-49439-3
定价 : 69.00元
教辅资源下载
扩展信息
语种 : 简体中文
页数 : 335
开本 : 16
原书名 : Business Intelligence: A Managerial Perspective On Analytics
原出版社: Pearson Education Asia
属性分类: 教材
包含CD :
绝版 :
图书简介

本书介绍了商务智能、分析和决策支持的基本概念,数据仓库的基本理论,商务报告、可视化分析和商务性能管理,数据挖掘、文本、web和社会化分析、大数据及其分析、商务分析趋势等方面的知识。

图书特色

本书侧重于商务智能和为企业决策提供支持的业务分析。书中不仅介绍了传统的商务智能基本理论和应用,还介绍了当前商务智能涉及的新技术和新趋势,如社交网络、云计算、数据分析生态系统以及法律、隐私和道德问题等。
本书可以作为管理科学、电子商务和企业管理等专业的MBA、研究生以及本科生商务智能、决策支持系统等课程的教材,也可以作为管理信息系统、商务数据分析等课程的辅助教材,还适合从事企业信息管理、业务分析的人士阅读。

本书特色:
管理导向:本书主要从管理视角详细介绍商务智能的应用和实施,同时非常重视商务智能技术层面的应用,尤其是最新出现的一些新领域、新应用。
真实案例:通过大量全球大公司、小企业、政府机构和非营利组织的真实案例来生动形象地阐述相关概念和理论。
集成系统:本书强调支持企业和众多用户的系统,而不是孤立的基于互联网的商务智能系统。
热点研究:本书分别从理论和应用角度对无线射频识别、云计算、社交网络、Web2.0、大数据等进行了阐述。

作者简介:
拉姆什·沙尔达(Ramesh Sharda) 博士,商业主管项目主任,信息系统研究所所长,康菲石油公司技术管理主席,俄克拉荷马州立大学斯皮尔斯商学院管理科学与信息系统的杰出贡献教授,信息系统协会决策支持系统和知识管理专业组(SIGDSS)的共同创办人,服务于多个编辑委员会。他的研究方向包括决策支持系统、商务分析、信息过载管理技术。
杜尔森·德伦(Dursun Delen) 博士,俄克拉荷马州立大学斯皮尔斯商学院管理科学与信息系统教授,创新医疗系统研究中心主任,业务分析教授。他的研究方向包括数据和文本挖掘、业务分析、决策支持系统、知识管理、商务智能和企业建模。
埃弗雷姆·特班(Efraim Turban) 博士,夏威夷大学太平洋信息系统管理研究院访问学者,曾经就职于多所大学,包括香港城市大学、里海大学、佛罗里达国际大学、加利福尼亚州立大学长滩分校、东伊利诺伊大学以及南加利福尼亚大学。他还是世界各地许多公司的咨询师。他的研究方向包括基于Web的决策支持系统、社会化电子商务和协同决策。

图书前言

分析已经成为当今时代的技术驱动器。许多公司,比如IBM、Oracle和Microsoft,正在创建基于分析的新部门,以帮助公司更加灵活有效地进行商业运作。决策者正在使用更加计算机化的工具来支持他们的工作。甚至消费者也在直接或间接地使用分析工具帮助做日常活动的决策,例如购物、健康护理和娱乐。商务智能(Business Intelligence,BI)领域正在朝着实时数据流的创新应用发展,这些数据在过去都没有被捕获过,且没有一种有效的方法对数据进行分析。新的应用转向了日常健康护理、运动、娱乐、供应链管理、公共设施和几乎所有可以想象的行业。
除了传统的决策支持应用外,第3版利用案例、产品、服务和练习,以及基于网络的问题讨论将读者的视角扩展到不同的分析类型中。我们重点讨论了网络智能和网络分析,这些内容与电子商务及其他网络应用领域的商务智能和业务分析(Business Analytics,BA)是并列的。本书由一个独立网站(pearsonhighered.com/sharda)和dssbibook.com上的一个非独立站点提供支持。我们也在网站的一个专区提供了许多软件指导书的链接。
本书旨在向读者介绍统称为分析的技术。本书介绍了这些技术的基本原理、系统构建和使用的方式。我们按照EEE方法来组织这些主题:展示(Exposure)、体验(Experience)、探索(Explore)。本书主要展示了不同分析技术及其应用,旨在使学生了解其他组织怎样运用分析技术做决策或获得竞争力,并从中收获知识。我们相信展示可以用分析做些什么和怎样做是学习分析的关键。在描述这些技术时,我们也介绍了一些软件工具,帮助学生体验这些技术。虽然每一章都给出了具体的建议,但是学生和教师可以结合不同的软件工具使用本书。本书对应的网站包括具体的软件指导,但是学生仍然能够通过不同的方法体验这些技术。最后,我们希望这样的展示和体验能够激励读者探索这些技术在他们所在领域的潜能。为了促成这样的探索,我们在书中提供了练习,指导读者加入Teradata大学网络和其他包含团队练习的网站。我们也重点介绍了在网站中新的创新应用。
第3版的大量工作集中在3个部分:改编、内容更新和重点更清晰。除了这些修改工作外,我们仍然保留了综合性和用户友好性,使本书在市场上占据领先地位。最后,我们提供了其他书籍没有的准确、及时的素材。下面我们将具体说明第3版中的变化。
第3版增加了什么内容
为了改善质量,第3版对内容进行了大规模改编,将本书的重点放到分析上。本版主要围绕着三种类型的分析组织全书,并且增加了许多新内容,删除了一些过时的内容。下面列出了几个主要的变化:
新的组织结构 本书介绍了INFORMS提出的三种类型的分析:描述性(descriptive)分析预测性(predictive)分析和规范性(prescriptive)分析。第1章首先介绍商务智能和分析,第2章对数据仓库和数据集成进行概述。第3章包括描述性分析或报表分析,重点讨论可视化和商业性能评估。第4章介绍有关预测性分析的内容。第5章将分析领域扩展至文本、Web和社交媒体。第6章介绍大数据和分析。第7章对业务分析未来的趋势和主题进行讨论,例如基于位置的智能、移动计算、基于云的分析和隐私/道德问题。第7章还对分析生态系统进行了概述,帮助读者了解所有不同的方法。
新的章节 本书增加了以下章节:
第5章涉及许多流行话题,包括文本挖掘、Web分析和社交分析,几乎是全新的一章(95%是新内容)。
第6章介绍大数据和分析,涵盖了大数据技术的主要组成和特征。本章也是全新的一章(99%是新内容)。
第7章分析了几个正在改变或将要改变的分析技术的新现象,包括基于位置的分析应用、面向消费者的分析应用、移动平台、基于云的分析和隐私/道德问题。在第7章的结尾,对分析生态系统进行了讨论(90%是新内容)。
精简的内容 为了使本书更加精简,我们只保留了最常用的内容。我们也几乎删除了所有网上的内容,使用网站提供更新的内容和链接。此外,也减少了每章参考文献的数量。
更新的作者团队 在第2版作者(Turban、Sharda、Delen和King)编写的精彩内容的基础上,第3版主要由Ramesh Sharda和Dursun Delen进行修订。Ramesh Sharda和Dursun Delen在业界和学术界都拥有丰富的决策支持系统和分析方面的工作经验。
为幻灯片配置的新图 虽然印刷版保留了上一版的原图并且增加了许多新图,但是我们重画了许多图,这些彩色图可以在图片库中得到。
实时更新网站 本书提供了一个网站(dssbibook.com),该网站包括书中提到的新闻故事、软件和YouTube视频的链接。
修订和更新的内容 几乎所有的章节都更换了新的开篇小插曲和章末应用案例,这些内容都是根据最新的故事和事件编写的。此外,我们更新了本书的应用案例,包括一些特定技术/模型应用的最新案例。我们也删除了一些较老的产品链接和参考文献。最后,大部分章节都有新的练习、网络任务和讨论问题。
第3版前几章的主要变化如下所述。
第1章介绍INFORMS提出的3种类型的分析:描述性分析、预测性分析和规范性分析。正如前面提到的,我们利用这种分类对本书进行重组。第1章有60%的内容是新的。
第2章
更新了30%的内容(包含案例在内)。
新的开篇案例。
几乎全新的案例。
一个历史性的数据仓库视角。
更好地覆盖了多维建模(星形模式和雪花模式)。
更好地覆盖了数据仓库未来的发展。
第3章
更新了60%的内容,尤其是在可视化分析和报表部分。
几乎全新的案例。
第4章
更新了25%的内容。
几乎全新的案例。
第5~7章几乎是全新的章节。
我们对第2版也做了一些增强型改进,并更新了内容,总结如下:
到Teradata大学网络(TUN)的链接 大部分章节包括了到TUN的新链接(teradata- universitynetwork.com)。
书名 书名和重点内容已经明显改变。
软件支持 TUN网站提供了免费的软件支持以及免费的数据挖掘和其他软件的链接。此外,该网站也提供了使用类似软件的练习。
补充包:www.peasonhighered.com/sharda
为了增强教学和学习经验,我们提供了一个广泛且灵活的技术支持包。本书网站www.pearsonhighered.com/sharda提供了以下内容:
教师手册 教师手册包含了整个课程和每一章的学习目标、章末问题和练习的答案以及教学建议。教师手册可以在pearsonhighered.com/sharda的教学区中找到。
试题文件和TestGen软件 试题文件包含了详细的是非题、多选题、填空题和问答题。其中,问题按照难度排序,答案可以按照书中的页码查找。考试文件可以用Microsoft Word和TestGen打开,考试生成软件可以在www.pearsonhighered.com/irc上获得。考试生成软件与PC/MAC兼容,也可以装载试题文件中的所有问题。在软件中可以人工或随机查看考试问题,通过拖曳或删除、添加或改变需要的问题来创建一次考试。TestGen软件可以在BlackBoard、WebCT、Moodle、D2L和Angel中进行转化使用。这些版本可以在pearsonhighered.com/sharda中找到。TestGen在Respondus和www.respondus.com中也可以找到。
PPT 演示了书中的关键问题和概念,教师可以从pearsonhighered.com/sharda下载。
致谢
自从本书第1版出版以来,有许多人提出了意见和建议,也有许多学生参与了章节、软件和问题的测验,并辅助我们收集材料。想要列出所有参与该项目的人是很难的,我们在这里感谢所有的人。值得特别提出的是,他们中有些人做出了卓越贡献。
第一,我们感谢所有为第1~3版正式评审做出贡献的人,他们是:
Ann Aksut,中部皮德特社区学院
Bay Arinze,德雷塞尔大学
Ranjit Bose,新墨西哥大学
Marty Crossland,中美拿撒勒大学
Kurt Engemann,爱纳大学
Badie Farah,东密歇根大学
Gary Farrar,哥伦比亚大学
Jerry Fjermestad,新泽西理工学院
Christie M. Fuller,路易斯安那理工大学
Martin Crossman,布里奇沃特州立学院
Jahangir Karimi,美国科罗拉多大学丹佛学院
Huei Lee,东密歇根大学
Natalie Nazarenko,纽约州立大学弗雷多尼亚分校
Asil Oztekin,马萨诸塞大学卢维尔分校
Kala Chand Seal,洛约拉马利蒙特大学
Roger Wilson,费尔蒙特州立大学
Vincent Yu,密苏里科技大学
Fan Zhao,佛罗里达海湾海岸大学
同时,我们感谢为第3版图书和其他决策支持系统书籍——《Business Intelligence and Analytics:Systems for Decision Support》第10版(培生教育,2013)正式评审付出努力的人。
第二,许多人为本书的材料和支持素材做出了贡献。Teradata(天睿公司)的Susan Baxley和David Schrader帮助我们收集了新的TUN内容并获得许可。《OR/MS Today》的编辑Peter Horner允许我们从《OR/MS Today》和《Analytics Magazine》中总结应用案例。我们也感谢INFORMS允许我们引用《Interfaces》中的内容。这里,我们特别感谢来自俄克拉荷马州立大学的Natraj Ponna、Daniel Asamoah、Kartik Dasika、Clara Gregory和Amy Wallace的协助。
第三,我们感谢Dave King(JDA软件公司)。对上一版内容做出主要贡献的还有同著者:J. Aronson(佐治亚大学)负责数据仓库一章;Mike Goul(亚利桑那州立大学)主要负责第1章;T. P. Liang(中国台湾中山大学)主要负责神经网络内容。Judy Lang曾与我们一起合作,参与编辑,并在第1版出版的整个过程中为我们提供指导。
第四,感谢与我们合作的生产商,他们向我们提供了开发软件或演示软件:Acxiom公司(小岩城,阿肯色州)、California Scientific Software公司(内华达城,加利福尼亚州)、Cary Harwin of Catalyst Development公司(尤卡谷,加利福尼亚州)、Demandtec公司(圣卡罗,加利福尼亚州)、DS Group股份有限公司(格林尼治,康涅狄格州)、Greygory Piatesky-Shapiro of KDNuggets.com公司(盖恩斯维尔,佛罗里达州)、Gary Lynn of NeuroDimension股份有限公司(盖恩斯维尔市,佛罗里达州)、Palisade Software(纽菲德,纽约州)、Promised Land Technologies公司(纽黑文市,康涅狄格州)、Salford Systems(拉由拉布,加利福尼亚州)、Sense Networks(纽约,纽约州)、Gary Miner of StatSoft股份有限公司(塔尔萨,俄克拉荷马州)、Ward Systems Group股份有限公司(弗雷德里克,马里兰州)、Idea Fisher Systems股份有限公司(欧文,加利福尼亚州)和Wordtech Systems公司(奥林达,加利福尼亚州)。
第五,我们感谢Teradata大学网络,特别是项目经理Susan Baxley和TUN创始人Hugh Watson。我们还感谢Michael Goul、Barb Wixom和Mary Gros,是他们鼓励我们将该书与TUN联合,并为我们提供了大量素材。
第六,我们对培生团队给予表彰:责任编辑Bob Horan安排了这个项目;培生教育的Tom Benfatti编写了内容,Integra软件服务公司的George和员工将手稿变成书。
在此,我们感谢所有这些人和企业,没有他们的帮助,本书就不可能完成。

上架指导

计算机\商务智能

封底文字

本书侧重于商务智能和为企业决策提供支持的业务分析。书中不仅介绍了传统的商务智能基本理论和应用,还介绍了当前商务智能涉及的新技术和新趋势,如社交网络、云计算、数据分析生态系统以及法律、隐私和道德问题等。
本书可以作为管理科学、电子商务和企业管理等专业的MBA、研究生以及本科生商务智能、决策支持系统等课程的教材,也可以作为管理信息系统、商务数据分析等课程的辅助教材。还适合从事企业信息管理、业务分析的人士阅读。
本书特色
管理导向:本书主要从管理视角详细介绍商务智能的应用和实施,同时非常重视商务智能技术层面的应用,尤其是最新出现的一些新领域、新应用。
真实案例:通过大量全球大公司、小企业、政府机构和非营利组织的真实案例来生动形象地阐述相关概念和理论。
集成系统:本书强调支持企业和众多用户的系统,而不是孤立的基于互联网的商务智能系统。
热点研究:本书分别从理论和应用角度对无线射频识别、云计算、社交网络、Web2.0、大数据等进行了阐述。

作者简介

[美]拉姆什·沙尔达(Ramesh Sharda),杜尔森·德伦(Dursun Delen),埃弗雷姆·特班(Efraim Turban) 等著:Ramesh Sharda 博士,商业主管项目的主任,信息系统研究所所长,康菲石油公司技术管理主席,俄克拉荷马州立大学斯皮尔斯商学院管理科学与信息系统的杰出贡献教授,信息系统协会决策支持系统和知识管理专业组(SIGDSS)的共同创办人,服务于多个编辑委员会。他的研究方向包括决策支持系统、商务分析、信息过载管理技术。
Dursun Delen 博士,俄克拉荷马州立大学斯皮尔斯商学院管理科学与信息系统的教授,创新医疗系统研究中心的主任,业务分析教授。他的研究方向包括数据和文本挖掘、业务分析、决策支持系统、知识管理、商务智能和企业建模。
Efraim Turban 博士,夏威夷大学太平洋信息系统管理研究院的访问学者,曾经就职于多所大学,包括香港城市大学、里海大学、佛罗里达国际大学、加利福尼亚州立大学长滩分校、东伊利诺伊大学以及南加利福尼亚大学。他还是世界各地许多公司的咨询师。他的研究方向包括基于Web的决策支持系统、社会化电子商务和协同决策。

译者简介

赵卫东 译:暂无简介

译者序

企业信息化历经几十年的发展,已经由最初的提高效率逐渐向改善业务决策质量的智能商务方向发展。实践证明,商务智能对于增强企业各个层级的决策水平起到了重要的作用。这种新的决策支持技术能帮助企业了解过去的业务情况,实时把握现在的业务进展,并预测未来的业务发展趋势,从而对企业起到开源节流的作用。商务智能已经被越来越多的企业重视并实施,成功的案例层出不穷。
最近几年,商务智能得到了迅速的发展,移动应用、云计算、物联网和大数据技术等也驱动了商务智能在应用的深度和广度上拓展。商务智能从最初应用在零售、金融、电信、制造等行业逐渐拓展到更多的行业,从最初的销售数据分析逐渐拓展到企业价值链上的各种活动。各种规模的企业,无论是传统企业还是网商,都可以找到商务智能应用的领域。商务智能最初主要用于报表、数据仓库和多维分析。现在数据挖掘也由于机器学习等技术的实用化走出了实验室,出现了更多的成功应用。
大数据分析更是推波助澜,引领商务智能向纵深方向前进,增强了业务分析的广阔前景和商业模式创新。对大量数据的实时流处理,对Web上的文本、图像、声音和视频等各种非结构化海量数据的处理,都是大数据时代的要求。可视化分析、移动终端的普及也有助于商务智能应用走向平民化。
到目前为止,市场上出现了很多有关商务智能的书籍,这些书大致分为两种。第一种主要介绍商务智能技术,涉及报表制作、数据仓库设计、多维分析以及数据挖掘技术的全部或专注部分技术的探讨,这类书比较适合商务智能开发人员使用。第二种介绍商务智能的基本理念和应用,淡化了繁琐的技术细节,比较适合初学者和业务管理人员参考。本书就属于后一种,其突出的优点如下所述。
第一,本书综合介绍了商务智能领域的基本内容,尤其是最新出现的一些新发展领域、新应用,可以拓展读者的视野。对刚接触商务智能领域的初学者来说,可以在较短的时间内领略商务智能的基本内容和应用情况,引发对商务智能的兴趣和应用热情。
第二,案例丰富、新颖。与第2版比较,第3版更换了大部分配套的案例,这样,一方面可以与内容的更新对应,另一方面也可以与读者分享商务智能的最新应用动态。
第三,在内容的组织上与其他书籍不同,本书不是简单地把内容分为基础理论和应用部分,或者按照商务智能技术方法安排,而是按照商务智能在商务分析中的3种作用(即描述性分析、预测性分析和规范性分析)安排章节,而且把应用的内容穿插到基本理论介绍之后,这种结构使读者更容易全面理解。
第四,每章的最后补充了一些有用的资料和练习,使读者在阅读之余可以进一步了解相关的内容。此部分内容是经常更新的,这也是本书值得称道的地方。
本书没有拘泥于复杂的商务智能技术介绍,非常适合没有数据分析基础的管理人员、业务人员阅读,他们可以从中体会商务智能的价值,以便在实践中借鉴和推广。由于书中内容的系统性和新颖性,本书也非常适合作为商学院、管理学院本科生、研究生和MBA商务智能、决策支持系统等课程的教材。
本书第3版前4章更新的内容较多,在翻译过程中译者参考了第2版的译文并做了一些调整,这里对第2版的译者秦秋莉、姚家弈和王英等老师表示感谢。由于译者水平有限,书中难免存在翻译不当之处,请读者批评指正。在本书翻译过程中,刘海涛、吴冉、李衡浩和岳鸣涛等同学也做了很多的校对工作,特表示感谢。

赵卫东
2014年10月于复旦大学

图书目录

出版者的话
译者序
前言
作者简介
第1章 商务智能、数据分析和决策支持概述  1
1.1 开篇小插曲:Magpie Sensing公司使用分析技术高效而安全地管理疫苗供应链1
1.2 变化的商业环境和计算机决策支持3
1.3 商务智能架构4
1.3.1 BI的定义5
1.3.2 BI的简史5
1.3.3 BI的架构5
1.3.4 BI的起源和驱动力6
1.3.5 BI中的多媒体练习8
1.4 智能产生、使用与商务智能治理8
1.4.1 智能产生和使用的循环过程8
1.4.2 智能与窃取9
1.5 事务处理与分析处理9
1.6 成功的BI实施10
1.6.1 典型的BI用户群体10
1.6.2 合理规划与业务战略的统一11
1.6.3 实时的、随需应变的BI是
可以实现的11
1.6.4 开发或收购BI系统12
1.6.5 理由和成本 —收益分析12
1.6.6 安全和隐私保护12
1.6.7 系统和应用的集成12
1.7 数据分析概述13
1.7.1 描述性分析14
1.7.2 预测性分析15
1.7.3 规范性分析16
1.7.4 应用于不同领域的数据分析19
1.7.5 数据分析还是数据科学19
1.8 大数据分析简介20
1.9 本书的安排21
1.10 资源、链接和Teradata大学网络连接22
1.10.1 资源和链接 22
1.10.2 供应商、产品和演示22
1.10.3 期刊22
1.10.4 Teradata大学网络连接23
1.10.5 本书的网站 23
本章要点23
关键词23
问题讨论23
练习24
章末应用案例25
参考文献26
第2章 数据仓库28
2.1 开篇小插曲:卡普里岛赌场利用企业数据仓库获胜28
2.2 数据仓库的定义和概念30
2.2.1 什么是数据仓库30
2.2.2 数据仓库历史透视30
2.2.3 数据仓库的特点32
2.2.4 数据集市33
2.2.5 操作数据存储33
2.2.6 企业数据仓库33
2.2 元数据35
2.3 数据仓库流程概述36
2.4 数据仓库架构38
2.4.1 可选的数据仓库架构40
2.4.2 哪种架构最好42
2.5 数据集成以及提取、转换和加载过程43
2.5.1 数据集成44
2.5.2 提取、转换和加载46
2.6 数据仓库的开发47
2.6.1 数据仓库开发方法50
2.6.2 数据仓库开发的其他思考53
2.6.3 数据仓库中的数据表示53
2.6.4 数据仓库中的数据分析54
2.6.5 OLAP和OLTP54
2.6.6 OLAP操作55
2.7 数据仓库的实施问题57
2.8 实时数据仓库60
2.9 数据仓库管理、安全问题和未来趋势64
2.10 资源、链接和Teradata大学网络连接68
2.10.1 资源和链接68
2.10.2 案例68
2.10.3 供应商、产品和演示68
2.10.4 期刊68
2.10.5 其他参考文献69
2.10.6 Teradata大学网络连接69
本章要点69
关键词69
问题讨论70
练习70
章末应用案例72
参考文献74
第3章 业务报表、可视化分析与企业
绩效管理77
3.1 开篇小插曲: 自助服务的报表环境为企业用户节省上百万美元77
3.2 业务报表的定义和概念80
3.2.1 什么是业务报表81
3.2.2 业务报表系统的组件84
3.3 数据与信息可视化85
3.4 不同类型的图表89
3.4.1 基本图表89
3.4.2 专用图表90
3.5 数据可视化与可视化分析的出现92
3.5.1 可视化分析93
3.5.2 高性能可视化分析环境95
3.6 绩效仪表盘97
3.6.1 仪表盘设计98
3.6.2 在仪表盘中寻找什么100
3.6.3 仪表盘设计的最佳实践101
3.6.4 根据行业标准建立 KPI 基准101
3.6.5 利用上下文元数据封装仪表盘度量101
3.6.6 通过可用性专家检验仪表盘设计101
3.6.7 在仪表盘中指定警报和异常的优先级101
3.6.8 使用用户评论丰富的仪表盘102
3.6.9 在3个不同层次展示信息102
3.6.10 使用仪表盘设计准则选择正确的可视化方式102
3.6.11 提供指导性分析102
3.7 企业绩效管理102
3.8 绩效度量105
3.8.1 关键绩效指标106
3.8.2 绩效度量系统107
3.9 平衡记分卡107
3.9.1 4个视角107
3.9.2 平衡在BSC中的意义108
3.9.3 仪表盘与平衡记分卡109
3.10 作为绩效度量系统的六西格玛109
3.10.1 DMAIC绩效模型110
3.10.2 平衡记分卡与六西格玛110
3.10.3 有效的绩效度量111
本章要点113
关键词114
问题讨论114
练习115
章末应用案例116
参考文献 118
第4章 数据挖掘119
4.1 开篇小插曲:坎贝拉公司将高级分析和数据挖掘应用于更多客户119
4.2 数据挖掘概念和应用121
4.2.1 定义、特征和优势122
4.2.2 数据挖掘原理127
4.2.3 数据挖掘与统计学130
4.3 数据挖掘应用131
4.4 数据挖掘过程133
4.4.1 步骤1:业务理解134
4.4.2 步骤2:数据理解134
4.4.3 步骤3:数据准备135
4.4.4 步骤4:建模137
4.4.5 步骤5:测试和评估137
4.4.6 步骤6:部署137
4.4.7 其他标准化的数据挖掘过程和方法139
4.5 数据挖掘方法140
4.5.1 分类 140
4.5.2 估算分类模型的准确率141
4.5.3 数据挖掘聚类分析146
4.5.4 关联规则挖掘148
4.6 数据挖掘软件工具151
4.7 数据挖掘的隐私问题、谬误和隐患156
4.7.1 数据挖掘和隐私问题 156
4.7.2 数据挖掘谬误和隐患157
本章要点158
关键词159
问题讨论160
练习160
章末应用案例162
参考文献163
第5章 文本与Web分析164
5.1 开篇小插曲:《危险边缘》上的人机大战:Watson的故事164
5.2 文本分析和文本挖掘概述166
5.3 自然语言处理170
5.4 文本挖掘应用174
5.4.1 营销应用174
5.4.2 安全应用174
5.4.3 生物医学应用177
5.4.4 学术应用178
5.5 文本挖掘过程180
5.5.1 任务1:建立语料库180
5.5.2 任务2:创建词项—文档矩阵181
5.5.3 任务3:提取知识182
5.6 情感分析186
5.6.1 情感分析应用189
5.6.2 情感分析过程190
5.6.3 极性识别方法191
5.6.4 使用词典191
5.6.5 使用训练文档集192
5.6.6 识别句子和短语的语义倾向192
5.6.7 识别文档的语义倾向193
5.7 Web挖掘概述193
5.8 搜索引擎197
5.8.1 搜索引擎剖析198
5.8.2 开发环198
5.8.3 网络爬虫198
5.8.4 文档索引器198
5.8.5 响应环199
5.8.6 查询分析器199
5.8.7 文档匹配器/排名器199
5.8.8 搜索引擎优化200
5.8.9 搜索引擎优化的方法201
5.9 Web使用挖掘(Web分析)203
5.9.1 Web分析技术204
5.9.2 Web分析度量 206
5.9.3 网站可用性206
5.9.4 流量来源207
5.9.5 访客特征208
5.9.6 转化统计208
5.10 社交分析209
5.10.1 社交网络分析210
5.10.2 社交网络分析度量211
5.10.3 联系212
5.10.4 分布212
5.10.5 分割213
5.10.6 社交媒体分析213
5.10.7 人们如何使用社交媒体214
5.10.8 评估社交媒体的影响215
5.10.9 社交媒体分析的最佳实践216
本章要点218
关键词219
问题讨论220
练习220
章末应用案例221
参考文献223
第6章 大数据与分析225
6.1 开篇小插曲:当大数据遇上大数据科学225
6.2 大数据的定义228
6.3 大数据分析基础233
6.4 大数据技术237
6.4.1 MapReduce237
6.4.2 为什么使用MapReduce238
6.4.3 Hadoop238
6.4.4 Hadoop如何工作238
6.4.5 Hadoop技术组件239
6.4.6 Hadoop:利与弊240
6.4.7 NoSQL241
6.5 数据科学家243
6.6 大数据和数据仓库248
6.6.1 Hadoop的使用案例248
6.6.2 数据仓库的使用案例249
6.6.3 灰色区域(任意一个都能胜任)250
6.6.4 Hadoop和数据仓库共存250
6.7 大数据供应商252
6.8 大数据与流分析258
6.8.1 流分析与持久性分析259
6.8.2 关键事件处理260
6.8.3 数据流挖掘260
6.9 流分析的应用261
6.9.1 电子商务261
6.9.2 电信261
6.9.3 法律实施与网络安全263
6.9.4 电力行业263
6.9.5 金融服务263
6.9.6 健康科学263
6.9.7 政府264
本章要点264
关键词264
问题讨论265
练习265
章末应用案例266
参考文献268
第7章 业务分析:趋势与前景269
7.1 开篇小插曲:俄克拉荷马州天然气及电力公司利用数据分析促进智能能源使用269
7.2 为组织提供基于位置的分析270
7.2.1 地理空间分析271
7.2.2 实时位置智能273
7.3 面向消费者的分析应用275
7.4 推荐引擎277
7.5 Web 2.0革命和在线社交网络278
7.5.1 Web 2.0的典型特征279
7.5.2 社交网络279
7.5.3 定义和基本信息279
7.5.4 商业和企业社交网络280
7.6 云计算与商务智能281
7.6.1 面向服务的DSS282
7.6.2 数据即服务283
7.6.3 信息即服务284
7.6.4 分析即服务284
7.7 数据分析对组织的影响286
7.7.1 新的组织结构286
7.7.2 重构业务流程和虚拟团队286
7.7.3 工作满意度287
7.7.4 工作压力和焦虑287
7.7.5 分析工具对管理人员活动和绩效的影响287
7.8 法律、隐私和道德问题288
7.8.1 法律问题288
7.8.2 隐私 289
7.8.3 最近涉及隐私和数据分析的技术问题290
7.8.4 决策中的道德问题和支持291
7.9 数据分析生态系统291
7.9.1 数据分析行业的类别292
7.9.2 数据基础设施供应商292
7.9.3 数据仓库行业293
7.9.4 中间件/BI平台行业293
7.9.5 数据聚合商与分发商293
7.9.6 专注于分析的软件开发者293
7.9.7 报表和分析294
7.9.8 预测性分析294
7.9.9 规范性分析294
7.9.10 特定行业或通用的应用开发者、系统集成者295
7.9.11 分析工具的用户组织296
7.9.12 行业分析师和影响者297
7.9.13 教育机构和认证机构297
本章要点298
关键词298
问题讨论299
练习299
章末应用案例300
参考文献301
索引303

教学资源推荐
作者: (美)Hector Garcia-Molina,Jeffrey D.Ullman,Jennifer Widom
作者: Gerhard Weikum,Gottfried Vossen
作者: 张玉洁 孟祥武 编著
参考读物推荐
作者: (美)John Poole,Dan Chang,Douglas M.Tolbert,David Mellor
作者: Peter Koletzke