用户调研之标准化可用性问卷

7 sec read

在做用户调研的时候,除了自己设定问卷内容外,还以可以使用标准的可用性问卷,比如上一篇文章中介绍的SUS问卷。今天主要是针对标准化可用性问卷做下简单的介绍,后续将一些比较常用的问卷做单独的介绍。以下很多内容摘抄自《用户体验度量》这本书。

什么是标准化的问卷

问卷是一种用于获取被测者信息的表格,问卷的题目可以是开放式的问题,但更典型的是选择题或打分题。标准化问卷是被设计为可重复使用的问卷,通常有一组特定的问题使用特定的格式按照特定的顺序呈现,基于用户答案产生的度量值具有一定的规则(对于用户的回答,也有特定的计算方法和规则。)。作为标准化问卷设计的一部分,设计者通常需要报告问卷测量的信度、效度和灵敏度,换言之,问卷需要经过心理测量的条件审查(并不是每一份被重复使用的问卷就能称为标准化问卷)。

标准化问卷的评估:信度、效度和灵敏度

对标准化问卷的质量的测试指标主要是信度和效度。

  • 信度——测量一致性。它衡量的指标是:对同一对象测量得到的结果是否一致。一般信度的评估包括重复测量信度和分半信度,最常见的方法α系数法。信度范围在 0 到 1 之间,对于问卷的信度,并没有固定的要求,不同内容的问卷对信度的要求不一样,但是,那些有着重要影响的问卷,例如 IQ 测试等,我们对其信度要求高,一般达到9 以上,而一些其他的问卷,信度要求 0.7 以上就能够接受。
    • α信度系数是目前最常用的信度系数,其公式为:α=(k/(k-1))*(1-(∑Si^2)/ST^2),其中,K为量表中题项的总数, Si^2为第i题得分的题内方差, ST^2为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。总量表的信度系数最好在8以上,0.7-0.8之间可以接受;分量表的信度系数最好在0.7以上,0.6-0.7还可以接受。α系数如果在0.6以下就要考虑重新编问卷。
  • 效度——测量有效性。确定有效性有不同的方式。确定有效性有几种不同的方法:
    • 内容效度是一种通过考察条目出处的理性而非经验的评估。通常,如果条目是由领域专家创建,或是引用于目标领域或相关领域已有调查问卷的文献中,则我们可以预设该内容是有效的。
    • 效标关联效度是指测量结果与某种预设或并发测量这边的相关性,通常使用皮尔逊相关系数来评估。这些相关性并不需要很大就能证明有效性。
    • 结构效度是指为问卷所选的条目与调查问卷锁设计的评估基础结构之间的一致性程度。问卷调查人员使用统计程序(主要是因子分析)来发现或确定相关项目的集群。当项目以合理(或按预期的)的方式聚集在一起时,这不仅体现了构建效度,也是形成合理分量表的基础。测量之间在结构上存在高度的相关性可以被认为时聚合效度的证据,反之,在结构上没有达到预期一致性可以被认为时分歧效度的证据。
  • 灵敏度的间接指标时产品比较时达到统计显著性所需的最小样本量,问卷越灵敏,所需的样本量最小。

标准化可用性问卷的优点

  • 客观性:允许可用性测试的从业者独立的验证其他从业者的报告。
  • 复用性:可以轻松复用别人的研究,甚至是自身的研究。例如,可用性测试的研究一再表明,标准化可用性问卷比费标准化可用性问卷更可靠。
  • 量化:标准化测量使得从业者的报告结果有更细微的细节,而不仅只有个人判断。标准化也运行从业者使用高效的数学和统计学方法来理解他们的结果。
  • 经济:开发标准化测试需要大量的工作。但是,一旦开发出来,他就能重复使用,非常经济。
  • 沟通:当标准化测试可用时,从业者能更加方便的进行有效沟通。
  • 科学的普适性:科学结果的普适性是科学工作的核心。标准化对评估结果的普适性必不可少。

常见的标准化可用性问卷

我们在做产品或系统的可用性测试后,都想把结果更好地传递给相关方。除了定性的研究结果之外,还有定量的可用性问卷,这些可用性问卷是标准化的,不仅可以科学地量化用户体验,也方便相关方之间有效沟通。常见的标准化可用性问卷有整体评估问卷、任务评估问卷和网站感知可用性评估问卷:

  • 整体评估问卷:用于完成一系列任务场景后,对产品或系统整体的感知可用性测量。
  • 任务评估问卷:每完成一个场景任务,让用户对该任务进行感知可用性测量。
    • ASQ(场景后问卷)
    • SEQ(单项难易度问卷)
    • SMEQ(主观脑力负荷问题)
    • ER(期望评分)
    • UME(可用性等级评估)
  • 网站感知可用性评估问卷 大部分标准化可用性问卷最初在20世纪80年代中期到后期被开发,在网络开始流行时,出现了更有针对性的评估网站感知可用性的问卷。
    • WAMMI(网站分析和测量问卷)
    • SUPR-Q(标准化的用户体验百分等级问卷)
  • 其他有趣的问卷
    • CSUQ(电脑系统可用性问卷)
    • USE(有用性、满意度、易用性)
    • HQ(享受性质量)
    • EMO(情绪指标结果)
    • ACSI(美国顾客满意度指数)
    • NPS(净推荐值)
    • CxPi(福雷斯特客户体验指数)
    • TAM(技术接受模型)

最后,推荐《用户体验度量》这本书,虽然此书的内容比较学术化,看起来也没一般的书那么容易,但是可以引导你变得更加专业。

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

优秀的产品经理/糟糕的产品经理

每个产品经理都希望自己时优秀的,而不是糟糕的。但如何定义是否优秀却没有一个统一的标准。最近看到了一片文章,中间
1 sec read

Paul Graham 的创业建议

描述创业的13句话 选择好合伙人 快速发布 让你的创意进化 (大多数创意来自实现过程) 理解你的用户 (许多成
19 sec read

享受性质量 HQ

为了支持非任务相关方面的用户体验研究,Hassenzahl等(2002)开发了一份评估享受性质量(Hedoni
3 sec read

发表评论

电子邮件地址不会被公开。 必填项已用*标注