用户调研之任务评估问卷

22 sec read

整体评估问卷是在一个相对较高的水平上评估满意度的。这使得在比较竞争对手或不同版本的总体满意度时成为一个优势,但却不利于在用户界面问题中需找更多详细的诊断信息。对于提到的这种劣势,很多从业者在被测者完成每个任务或场景后,立即进行感知可硬性的快速评估,今天主要梳理的是几张常见的任务评估问卷。

ASQ(场景后问卷)

场景后问卷(After-Scenario Questionnaire,ASQ)由PSSUQ和CSUQ的作者Lewis(1993)发表。总共包括三个项目,分别测量用户在三个方面的满意度:任务难度、完成效率和帮助信息。场景化问卷的开发与PSSUQ采用相同的形式,探测整体上完成任务的难易度、完成时间和支持信息的满意度。ASQ的项目采用从1(强烈同意)到7(强烈不同意)的7点计分。ASQ分数即是3个项目得分的平均分。Lewis (1995)的研究指出ASQ分数与PSSUQ分数的之间存在r=0.8的强相关,与场景任务的成功率也存在r=-0.4的显著相关。

ASQ问卷内容:

SEQ(单项难易度问卷)

单项难易度问卷(Single Ease Question,SEQ)只是要求评估完成任务的整体难易度,类似与ASQ第一项。SEQ的评分方式包括5点计分和7点计分,但根据目前的研究结果,7点评分拥有更高的信效度。

Sauro and Dumas (2009)发现SEQ分数与SUS得分呈现r=-0.56的的中等相关,与任务完成时间(r=-0.9)和任务出错率(r=-0.84)均存在显著相关性。同时,通过比较了SEQ、SMEQ和UME三个任务后评估问卷,他们也发现SEQ分数与SMEQ分数存在r=0.94的强相关,与UME分数存在r=0.95的强相关。

SEQ问卷内容:

SMEQ(主观脑力负荷问题)

主观脑力负荷问题(Subjective Mental Effort Question,SMEQ)由Zijlstra & van Doorn(1985)年发表,仅包含有一个项目,是一个从0到150,包括9个文字标签的定距测量(Jeff Sauro & Dumas, 2009)。在SMEQ的纸质版本中,被测这画一条线穿过问卷(问卷长度为150mm)来表示完成任务所感知的脑力负荷,在Sauro和Dumas(2009)开发的在线版本中,被测者使用一个滑块空间来调整他们的打分。与ASQ或SEQ不同,SMEQ的测量得分为定距分数。这意味着得分45与50之间的差距与得分120与125之间的差距是一样的,更加便于比较。

Sauro and Dumas (2009)发现SMEQ分数与SUS得分呈现r=-0.60的的中等相关,与任务完成时间(r=-0.82),任务完成率(r=0.88)和出错率(r=-0.72)均存在显著相关性。同时,SMEQ与UME分数存在r=0.84的强相关。

SMEQ问卷内容为:

问卷标签翻译成中文为:极其难做,非常非常难做,非常难做,相当难做,难做,有些难做,有一点难做,不是很难做,一点也不难做。

ER(期望评分)

期望评分(Expactation Ratings,ER)由Albert & Dixon(2003)发表,他们认为任务的难度是与用户进行任务前的预期难度相关的。因此,ER包括两个项目:一个在进行任务前施测,另一个在任务后施测:

  • 在进行所有任务之前(期望评分):“你预期这个任务的难易度如何?”
  • 完成每个任务后(经验评分):“你觉得这个任务的难易度如何?”

ER的项目采用从1(非常容易)到7(非常困难)的7点评分。与其它问卷比较最终得分的解释方法不同,ER的分数解释通过预期分数和体验分数两个维度构成的象限图来完成。如下:

四象限分别代表的意思为:值得推广、改进机会、保持状态、急待改进

UME(可用性等级评估)

可用性等级评估(Usability Magnitude Estimation,UME)由McGee(2003)发表,是仅包括一个项目的定比测量。Jeff Sauro and Dumas (2009)的研究推荐了一种更方便解释和施测的方法,即为UME的评分定义基线。在研究中,他们将一个图标搜索任务的难度定义为10,被测者对任何测试任务的难度评估均以10标准点得出。

与其它任务后测量问卷不同,UME并不限定被测者的作答区间,可以是从绝对零值到正无限的任意值。这意味着50分的任务就是比25分的任务困难2倍,为解释结果提供了便利。对于UME的使用,目前仍存在着诸多争议。与其它问卷相比,UME更加依赖于主试人员;不同被试对基线的理解存在差异;训练被试理解‘两倍难度’,‘一半难度’等概念也会增加测试成本和误差。

本文主要资料来源《用户体验度量》

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

享受性质量 HQ

为了支持非任务相关方面的用户体验研究,Hassenzahl等(2002)开发了一份评估享受性质量(Hedonic Quality,HQ)的问卷。HQ有7个7点双极的题项。具体如下:
3 sec read

技术接受模型 TAM

5 sec read

用户心理负荷的测量

用户在使用产品时的心理负荷水平也直接影响着用户的主观满意度。心理负荷(Mental Workload)的定义五花八门,我们在这也无意探讨其精确的含义。大体上,我们可以把心理负荷看成和体力负荷。目前学术界和产业界对于工作负荷的评估方法,发展较为成熟的主要 ...
16 sec read

Leave a Reply

Your email address will not be published. Required fields are marked *