参考读物 – 图书教辅

扩展信息

语种 : 简体中文

页数 : 283

开本 : 16

原书名 : 用户体验度量：用户研究实践

原出版社: Elsevier (Singapore) Pte Ltd

属性分类: 店面

包含CD : 无

绝版 : 未绝版

图书简介

有效地测量任何产品的可用性都需要选择和使用正确的度量，并要有效地利用它所揭示出来的信息。本书首次介绍了相关实用资料，可以使可用性从业人员和产品开发人员完成这种测量。作者把几十个种度量整理成六类：绩效、基于问题的、自我报告式的、Web导航、综合性的/派生的，以及生理/行为的。他们对每一种度量都进行了考察，并认真考虑了收集、分析和呈现这些数据的最佳方法。他们对使用任何技术来测量任何类型产品的可用性都提供了步进式指导。
这是一本指导性质的书，而不是一本理论专著。主要就实际中的应用提出一些建议，比如：在什么情境下收集哪种可用性度量、如何收集这些度量、如何使用不同的分析方法对数据进行梳理，以及如何以一种最清晰又最有吸引人的方式呈现结果。本书也将会与读者分享实践中的一些教训，这些教训源于作者在该领域内40多年经验的总结。

图书特色

阅读本书是一种愉悦的享受。它涉及用户体验领域的统计推理。它既不居高临下，也不难于理解。
　　　　　　　　　　　　　　　　　　　　 —— Joe Dumas，用户体验顾问，《Practical Guide to Usability Testing》作者

当要求你用统计方法量化可用性改进的效果时，即使你拥有统计学背景，也会感到犹豫，因为你可能不确定应该使用哪种统计检验，而且在为可用性研究中采用小样本检验辩解时感到棘手。
本书是使用统计学解决用户研究中常见问题的指南。它包含了你每天都要面对的常见问题，例如：当前的产品是否比竞争者的产品更易用？我们能确信70%的用户在第一次尝试时就完成任务吗？用户在网站上购买商品需要花费多长时间？本书详细阐述如何选择统计检验方法，以及在应用这些方法时如何为统计理论和最佳实践提供基础。
本书聚焦于可应用于实际用户研究项目的方法，是作者实际工作经验、调查研究，以及对最新的统计学、心理学、人因工程学的文献资料研读的结晶。它不只是对传统统计学的复述，而是为当今从业者提供了全新和切题的解读。
为各种项目中可用性测试的统计问题提供操作指南，包括使用六西格玛的项目
向从业者展示选择哪种检验方法，其适用的原因以及应用中的最佳实践，并为分析数据提供易于使用的Excel公式和网页形式的计算器
向从业者推荐使用通俗易懂的语言与相关人员沟通结论的一些方法

作者简介

Jeff Sauro 资深用户体验专家、统计分析师、资深用户体验设计咨询顾问，Measuring Usability公司主要创始人，具有10多年的用户体验从业经验。对可用性项目和统计分析有非常深入的研究。曾就职于PayPal、Walmart、Autodesk、Oracle、Intuit、GE等公司。Jeff经常在人机交互和可用性专家协会大会发表演讲，他发表过10余篇研究文章，同时也是《Journal of Usability Studies》的编委会成员。他拥有斯坦福大学设计和技术专业硕士学位。
James R. Lewis 资深人因工程师、实验心理学专家，国际公认可用性测试和测量方面的专家，有30多年的用户体验从业经验，目前主要从事语音应用的设计和评估，他还著有《Practical Speech User Interface Design》。他是认证的人因专家，拥有实验心理学（语言心理学）博士学位和工程心理学硕士学位。他是IBM首席发明家，有美国专利局颁发的77项专利。

如何量化用户体验对有效提高产品的可用性而言至关重要。用户体验从业者可能经常会遇到这样的问题或挑战：测试多少样本足以揭示问题？用小样本研究结果能说明总体情况吗？如何对结果进行科学衡量？针对用户研究中的这些实践性问题，作者全面深入地梳理了自己及国际上最前沿的研究结果，并结合自身工作经验，深入浅出地介绍不同情况下可用性测试中的数据搜集方法和衡量方式，推荐最佳解决方法。对于用户研究从业者或关注用户体验的人，相信在本书帮助下能获得极大启发。
本书共10章，主要内容包括量化用户研究常用方法、汇总数据及计算误差幅度、基准比较、组间比较、选择合适的样本量、标准化可用性问卷、与用户研究相关的统计学知识等，涵盖用户研究项目实施、分析、汇报阶段所遇到的常见疑问和问题根源的分析。

Amazon五星级畅销书，资深用户体验专家、统计分析师、心理学专家10余年工作经验结晶，着眼于用户体验设计人员工作中所遇到的疑难问题，推荐最佳解决方案
从科学的量化视角给从业者以思考，注重实战，每个知识点都辅之以设计精巧的案例，包含大量操作技巧和最佳实践

上架指导

计算机\Web设计

封底文字

阅读本书是一种愉悦的享受。它涉及用户体验领域的统计推理。它既不居高临下，也不难以理解。
——Joe Dumas，用户体验顾问，著有《Practical Guide to Usability Testing》

当要求你用统计方法量化可用性改进的效果时，即使你拥有统计学背景，也会感到犹豫，因为你可能不确定应该使用哪种统计检验，而且在为可用性研究中采用小样本检验辩解时感到棘手。

本书是使用统计学解决用户研究中常见问题的指南。它包含了你每天都要面对的常见问题，例如：当前的产品是否比竞争者的产品更易用？我们能确信70%的用户在第一次尝试时就完成任务吗？用户在网站上购买商品需要花费多长时间？本书详细阐述如何选择统计检验方法，以及在应用这些方法时如何为统计理论和最佳实践提供基础。

本书聚焦于可应用于实际用户研究项目的方法，是作者实际工作经验、调查研究，以及对最新的统计学、心理学、人因工程学的文献资料研读的结晶。它不只是对传统统计学的复述，而是为当今从业者提供了全新和切题的解读。

·为各种项目中可用性测试的统计问题提供了操作指南，包括使用六西格玛的项目
·向从业者展示了选择哪种检验方法，其适用的原因以及应用中的最佳实践，并为分析数据提供易于使用的Excel公式和网页形式的计算器
·向从业者推荐使用通俗易懂的语言与相关人员沟通结论的一些方法

作者简介

（美）Jeff Sauro　 James R. Lewis 著：暂无简介

译者简介

殷文婧徐沙杨晨燕隋馨缘陶伯仲译：暂无简介

译者序

首先感谢机械工业出版社编辑和我们亲爱的同事周莜将此书介绍给我们，同时也带给了我们一次书籍翻译的经历。
　　时下用户体验的概念甚为时兴，相关书籍俯拾即是，但作为一名从业者，想找到一本真正对实践有指导意义的资料却十分困难。看到此书时我们甚为惊喜：作者为业界资深专家，有丰富的从业经验；书中的讨论重点着眼于用户体验设计人员工作中所遇到的疑难问题。由此，我们欣然接下了本书的翻译任务，也希望将其介绍给国内更多关注用户体验的朋友。
　　译者小团队有5名成员，皆为腾讯公司的用户体验从业者。团队成员来自上海、深圳、成都三地，部分成员虽是同事但之前少有机会合作，都因此书结缘而走到一起。译者团队有用户研究人员，也有设计师，从业经验最长6年，最短两年。其中两名成员还是腾讯公司用户体验与设计部“CDC翻客”团队的主力成员。
　　写书难，译书亦不简单。互联网行业的从业者工作之余的时间少得可怜，加之本书涉及众多统计概念和推导分析，极大地增加了翻译工作的难度。各位译者迎难而上，牺牲了周末、年假、工作中的休息时间，持续4个月进行翻译、交叉校对、讨论、统稿，最终完成本书翻译工作。其中辛苦只有自知。凭借团队成员的知识背景、工作经验和辛勤付出，相信我们为读者提供的是一份有诚意的高质量译本。
　　在此我们也向团队成员互表感激，感谢大家在这4个月中的付出和精诚合作。同时感谢鼓励我们的家人、团队领导和同事们。
　　由于时间有限，工作难免有纰漏之处，期待读者们提出反馈，帮助我们修正。我们的邮箱地址：Quantify.team@QQ.com。
　　以下是团队成员的翻译感言，排序不分先后。
　　殷文婧：翻译本书，感触最深的是作者面对问题的坚持精神和实证方法。我认为这正是自己对这本书和作者的敬佩之处，也是业界对用户研究从业者的“专业”给予认可和尊重之源。
　　徐沙：从事用户体验相关工作以来，我不断对自己原有学术的“科学方法体系”进行调整。类似可用性测试这类方法，如何科学衡量结果，一直困扰着我们。“科学的一个本质特征是发展新的创意以及将新老想法进行实证测试”，在实际工作中我们采用可用性测试进行评估，但往往忽视了对结果的评估，导致可用性测试变成了信息搜集而不能直接帮助决策。当然评估的标准不限于本书，本书的价值在于从科学的量化视角给从业者以思考，本书推荐的很多问卷也可以在实践中尝试使用。
　　杨晨燕：用户研究从业者在研究过程中常会遇到这样的问题和挑战：“测试多少样本足以揭示问题？”“小样本用户研究结果能说明总体情况吗？”本书针对用户研究中的这些实践性问题，全面深入地梳理了作者及国际上其他最前沿的研究结果，并结合自己的工作经验，推荐了最佳解决办法，特别是在可用性测试和测量方面。对用户研究从业者或关注用户体验的人来说，相信本书能够带给大家帮助和启发。
　　隋馨缘：在平日的工作中，常常会遇到资源紧缺的问题：时间资源、样本资源、财务预算。你甚至会怀疑在多大程度上对自己的结论有信心。统计学能够帮助你评估，在你能承受的误差范围之内需要多少资源。也能让你审视自己的资源，更有效地利用资源来帮助你做出决策。
　　陶伯仲：作为设计师，我们一直倡导“以用户需求出发”来做设计，但在实际工作中往往由于时间、资源上的限制只能在没有用户测试数据的情况下自己拍板。由于对“需要多少样本？”“结果可不可信？”等问题心里没底，普通设计师想要自己搜集用户信息时还是举步维艰。本书作者根据自身多年的工作经验，深入浅出地介绍了不同情况下可用性测试中的数据搜集方法和衡量方式，对于想用心做用户喜欢的产品的设计师来说，是一本不可错过的指南和工作手册。最后，还想对翻译过程中一起辛苦熬夜的同事和家人说一声：“谢谢！辛苦了！”

图书目录

译者序
致谢
作者介绍
第1章　导论1　1.1　简介1
　1.2　本书的组织结构1
　1.3　如何使用本书2
1.3.1　应该使用何种检验2
1.3.2　我需要多大的样本量5
1.3.3　你不必手动计算6
　1.4　本章要点7
　1.5　本章思考题7
　1.6　参考资料8
第2章　量化用户研究9
　2.1　什么是用户研究9
　2.2　用户研究的数据9
　2.3　可用性测试10
2.3.1　样本量10
2.3.2　代表性和随机性10
2.3.3　数据收集12
2.3.4　任务完成率12
2.3.5　可用性问题13
2.3.6　任务时间14
2.3.7　出错数14
2.3.8　满意度评分14
2.3.9　复合分数14
　2.4　A/B测试15
　2.5　调查数据15
2.5.1　等级量表15
2.5.2　净推荐值16
2.5.3　评论和开放性数据16
　2.6　需求收集16
　2.7　本章要点17
　2.8　参考资料17
第3章　我们的估算到底有多准确19
　3.1　简介19
3.1.1　置信区间=误差幅度的两倍19
3.1.2　置信区间提供了精确度和位置20
3.1.3　置信区间的三个组成部分20
　3.2　完成率的置信区间20
3.2.1　置信区间的历史21
3.2.2　Wald区间：对于小样本来说就太不靠谱了21
3.2.3　精确置信区间22
3.2.4　Wald校正区间：增加两个成功与两个失败22
3.2.5　完成率的最佳点估计24
3.2.6　遭遇可用性问题的置信区间26
　3.3　等级量表和其他连续性数据的置信区间26
3.3.1　任务时长数据的置信区间29
3.3.2　任务时长均值还是任务时长中位数30
3.3.3　几何均值30
3.3.4　大样本任务时长的置信区间32
3.3.5　围绕中位数的置信区间33
　3.4　本章要点34
　3.5　本章思考题35
　3.6　参考资料36
第4章　我们达到或超过目标了吗38
　4.1　简介38
　4.2　单侧检验和双侧检验40
　4.3　完成率与基准的比对41
4.3.1　小样本检验42
4.3.2　大样本检验44
　4.4　满意度分数与基准的比对46
　4.5　任务时间和基准的比对50
　4.6　本章要点54
　4.7　本章思考题54
　4.8　参考资料57
第5章　不同设计之间有统计学差异吗59
　5.1　简介59
　5.2　比较两个平均值（等级量表和反应时）59
5.2.1　被试内设计比较——配对t检验60
5.2.2　比较任务时长62
5.2.3　组间比较（双样本t检验）64
5.2.4　t检验的假设68
　5.3　比较完成率、转换率以及A/B测试69
5.3.1　组间比较69
5.3.2　组内比较78
　5.4　本章要点86
　5.5　本章思考题88
　5.6　参考资料94
第一部分：总结性研究95
第6章　我们需要多大的样本量
　6.1　简介95
6.1.1　我们为何要关注95
6.1.2　可用性研究的类型至关重要96
6.1.3　总结性可用性测试样本量预估的基本原则96
　6.2　预估数值97
　6.3　比较数值104
　6.4　如何控制变异性109
　6.5　二项置信区间样本量的估计110
6.5.1　大样本的二项样本量估计110
6.5.2　小样本的二项样本量估计112
6.5.3　与基准比例相比较的样本量115
　6.6　卡方检验的样本量预估（独立比例）117
　6.7　MCNEMAR精确检验的样本预估（配对比例）120
　6.8　本章要点123
　6.9　本章思考题124
　6.10　参考资料130
第二部分：形成性研究131
第7章　我们需要多大的样本量
　7.1　简介131
　7.2　使用发现问题的概率模型来估计形成性用户研究的样本量131
7.2.1　著名方程：P（x≥1）=1-（1-p）n131
7.2.2　从1-（1-p）n中推导出样本量估计方程133
7.2.3　使用表格计划形成性用户研究样本量135
　7.3　二项概率模型的假设136
　7.4　模型的附加应用137
7.4.1　估计多重问题或其他事件的复合p值137
7.4.2　校正小样本p的复合估计值138
7.4.3　估计可发现的问题数和未被发现的问题数143
　7.5　影响p值的是什么144
　7.6　什么是合理的目标问题发现率145
　7.7　调解“神奇的数字5”和“8还不够”147
7.7.1　一段历史：20世纪80年代147
7.7.2　又一段历史：20世纪90年代148
7.7.3　“神奇的数字5”的起源149
7.7.4　“8还不够”：一个调解方法151
　7.8　更多关于二项概率公式和其小样本校正155
7.8.1　二项概率公式的起源155
7.8.2　紧缩校正是如何起作用的156
　7.9　针对问题发现的其他统计模型159
7.9.1　对问题发现使用二项式模型的批评159
7.9.2　扩展的二项式模型160
7.9.3　Capture recapture模型161
7.9.4　在计划形成性用户研究时为什么不用其他模型161
　7.10　本章要点165
　7.11　本章思考题166
　7.12　参考资料168
第8章　标准化的可用性问卷171
　8.1　简介171
8.1.1　什么是标准化的问卷171
8.1.2　标准化可用性问卷的优点171
8.1.3　什么样的标准化可用性问卷是有用的172
8.1.4　标准化问卷的质量评估：信度、效度和灵敏度173
8.1.5　问卷的步距数174
　8.2　整体评估问卷174
8.2.1　QUIS(用户交互满意度问卷)175
8.2.2　SUMI（软件可用性测试问卷）176
8.2.3　PSSUQ178
8.2.4　SUS(软件可用性问卷)182
8.2.5　可用性整体评估问卷的实验比较194
　8.3　任务评估问卷197
8.3.1　场景后问卷197
8.3.2　单项难易度问卷198
8.3.3　主观脑力负荷问题198
8.3.4　期望评级199
8.3.5　可用性等级评估201
8.3.6　任务评估问卷的实验比较203
　8.4　网站感知可用性的评估问卷205
8.4.1　网站分析和测量问卷206
8.4.2　标准通用的百分等级问卷207
8.4.3　其他评估网站的问卷209
　8.5　其他有趣的问卷210
8.5.1　计算机系统可用性问卷210
8.5.2　有用性、满意度、易用性211
8.5.3　用户经验的可用性度量211
8.5.4　享受性质量212
8.5.5　美国消费者满意度指标213
8.5.6　净推荐值213
8.5.7　福雷斯特客户体验指数215
8.5.8　技术接受模型215
　8.6　本章要点216
　8.7　本章思考题217
　8.8　参考资料220
第9章　测量和统计的六大持久论战224
　9.1　介绍224
　9.2　对多点量表数据进行平均合理吗225
9.2.1　一方观点225
9.2.2　另一方观点226
9.2.3　我们的推荐228
　9.3　需要测试至少30名用户吗229
9.3.1　一方观点229
9.3.2　另一方观点230
9.3.3　我们的推荐231
　9.4　所有的实验都要进行双侧检验吗231
9.4.1　一方观点231
9.4.2　另一方观点232
9.4.3　我们的推荐233
　9.5　当p>0.05时，我们能拒绝原假设吗233
9.5.1　一方观点233
9.5.2　另一方观点234
9.5.3　我们的推荐235
　9.6　能将各种可用性度量指标合并到一个分数中吗236
9.6.1　一方观点236
9.6.2　另一方观点238
9.6.3　我们的推荐239
　9.7　假使你需要进行多次检验该怎么办239
9.7.1　一方观点239
9.7.2　另一方观点241
9.7.3　我们的推荐241
　9.8　本章要点245
　9.9　本章思考题246
　9.10　参考资料249
第10章　总结251
　10.1　简介251
　10.2　更多信息251
　10.3　好运254
　10.4　本章要点254
　10.5　参考资料254
附录A　基础统计概念速成255