会话式UI下篇：如何从包容性视角为视障人士做会话式UI ？

date

Jul 5, 2020

slug

conversational_ui_2

status

Published

如何为视障人士做会话式UI ？

接下来，终于到了硕士研究的具体项目部分，如何为视障人士做会话式UI ？

项目概要

简单介绍一下项目背景，除了前面说明的理论研究外，也有一部分实例研究证明，会话式UI，作为一种交互手段，有望支持和帮助视障、肢体残障人士、智力障碍人士和老年人的生活。根据Alisha Pradhan及其同事对残疾人使用智能扬声器的研究，结果表明，盲人和肢体残障人士可以通过智能扬声器提高生活中多方面的体验，包括独立行为支持，记忆支持，提高效率和安全性。

那这是一个什么项目？简单地讲，这个系统是一项基于会话的语音助手辅助服务，一般用户和视障人士可以使用此服务，来使用航班信息查询，购票，登机，机场内导航和中转预订等一系列功能。视障人士可以在做飞机出门旅行的时候，通过手机上安装的语音助手，和机场的值机机器的语音交互功能，来完成查询、购票、登机等行为。

具体项目细节可参考我的个人网站。

对话设计

这是我与一位全盲的大学生测试手机上的机场语音助手的视频。这段测试对话，是使用语音助手App值机的场景。不过是测试语言为日语，以下为文字翻译（可能不适用于中文语境）。

第二个视频是测试机场值机设备的语音交互功能的场景，视障用户到达机场后，使用值机机器来值机。除了值机的对话设计之外，还有比如机场内步行导航、出租车预约等功能的对话设计，就不一一说明了。

大家应该对这个项目有了大概的印象了。

调研：视障人士的生活方式

那么我们回到一个项目的最开始，他们有什么需求？现状是什么样的。

首先，我开始了一项调研，对象是40位视力障碍人士（问卷 + 访谈其中5位）。针对他们的病症、严重程度、是否外出、是否旅游、如何使用交通工具、是否使用数码设备、怎么使用等等方面的调查和访谈结果，制作了这份《视障人士的外出和数字生活调查报告》。

視覚障害者の生き方 - 視覚障害者の外出状況やデジタルライフに関する調査レポート

The Way of Life for the Visually Impaired Survey Report of the Visually Impaired People's Outgoing and Digital Life

https://speakerdeck.com/ryouissei/shi-jue-zhang-hai-zhe-falsesheng-kifang-shi-jue-zhang-hai-zhe-falsewai-chu-zhuang-kuang-yadezitaruraihuniguan-surudiao-cha-repoto

視覚障害者の生き方 - 視覚障害者の外出状況やデジタルライフに関する調査レポート

其中包括一些定量数据：

后天性疾病导致的视力障碍是最常见的。

在受访者中，障碍程度最高的视觉障碍者占72.5％。

97.5％的视障人士每月和每周外出。他们中有70％独自外出。

75％乘火车或电车出去旅行过。

85％的人有在日本旅行的经验，而27.5％的人有在国外旅行的经验。

手机、电脑等数字设备的使用率很高。

和一些改善的方向

视障者平时的生活与一般人群相同，但是有些事情他们自己无法克服，需要他人帮助。

必须使用技术来支持视障者的独立性和社会参与。

有必要改善数字可访问性作为基础设施。

除了知道他们的现状和需求还是不够，毕竟不能切身体会。所以我想了一些尽量能接近的体验，试图感受视障人士是如何生活的。这段视频就是使用VR眼镜模拟「视网膜色素变性」而导致的视野变窄从而视力逐渐消失的病症，过程则是搭乘电车去羽田机场。

语音交互系统的结构

了解需求也还是不够。需要正确的理解对话系统时如何运作的，才可能作出合适的设计。

语音识别 ASR：将声音信息转化为文字。

自然语言处理 NLP：理解人们想要表达的意思，并给出合理的反馈和信息。

语音合成 TTS：指将文字转化为声音。

会话式UI的设计流程

会话式UI的设计过程可以粗略地可以分为这几部分：

1.从场景出发设计示例对话脚本

创建一个用户角色和想定的目标使用场景。

找一位朋友并在对话中扮演角色，一个人扮演用户，另一个人扮演系统。

记录谈话内容。订正后就是示例对话脚本的初稿。

审阅对话脚本，读出用户的台词。并在文本语音转换引擎（TTS）中播放每一句台词。如果不是很自然的话，就重新写或者使用SSML（语音合成标记语言）改善语音的语气、停顿时间等元素。

如果有不同的用户角色和场景，重复以上步骤。

2.Intents(意图)和Entities(实体)

在设计步骤1的对话脚本时要注意的是，用户的目的是什么，为了达成这个目的需要获得哪些信息和数据。这里的目的就是意图，信息和数据和就是所谓的实体。

Intents(意图)

达到用户最终目的的对话，数据和功能的组合。比如：查询天气、预约航班…

Entities(实体 Google平台用语)/Slots (Alexa平台用语)

对话中需要的数据类型。比如：时间、地点、食材…

3.完善分支对话流程

一旦有了一些示例对话脚本，就可以抽象出对话的流程和逻辑，包括主流程外的介绍流程、分支选择、错误流程、返回流程等等。在有多个功能和目的的情况下，也可以创建多个使用流程。

好的设计可以在对明确定义的用户路径的需求与用户对直接指向他们想要的快捷方式的需求之间取得平衡。

4.怎么做语音交互原型

与GUI一样，设计师最终也需要作出语音交互的原型，那么该如何制作呢。现在可以使用的主要是这几种，这篇文章不涉及具体用法，稍作简单的介绍。

Adobe XD相信大家很熟悉，但是原型功能里adobe凭借他的云端技术硬是在设计软件里内置了语音识别和语音生成的功能，足以实现大部分的语音交互甚至带屏幕的语音交互的原型需求。

Google的开发者平台，在不接入数据的情况，可以无代码实现原型制作，推荐在使用adobe XD之前试一试，了解系统的运作。

Voiceflow则是以流程图的形式视觉化了交互，原型可以同步到开发者平台。

5.改善视障人群使用的VUI

首先，根据残障程度创建个性化的对话和服务。比如，全盲人士可以完全通过的语音交互使用完整的功能，中度弱视人士可以通过一定的GUI和辅助的VUI来使用。GUI的部分，通过调节字体和颜色对比来增强可读性。

第二，服务中包含的所有VUI和GUI都需完善辅助功能。比如，对应系统级别的VoiceOver；语音导航时无法分辨初始位置和方向，因此首先要显示附近的位置。第三，由于无法感同身受，所以前期调研更加需要深度的调研和共情体验。

最后在语言层面，也更加需要注意对话设计的言辞中对人的尊重，和语气、韵律、说话速度的调节等等。

6.测试和评价VUI的原型

除了在前期设计对话时，可以通过角色扮演来测试对话流畅程度之外，业界也存在一些语音交互产品的用户评价定量方法。我从两篇相关论文中（见文末参考文献）中选出以下四种方法：

AttrakDiff

AttrakDiff是HCI领域中最常用的标准化问卷之一，用于衡量体验的可用性和舒适度。它明确关注娱乐性，还衡量产品的实用质量和整体吸引力。

SUISQ (The Speech User Interface Service Quality)

语音用户界面服务质量（SUISQ）问卷是一种用于评估语音界面的服务质量的问卷方法。 SUISQ共有25个项目经过主成分分析验证，分为四类，包括用户目标定位，语音特征，冗长性和客户行为。SUISQ也有很多改进版本，对验证项目进行增改，具体可以参考这篇论文。

SASSI (The Subjective Assessment of Speech System Interfaces)

语音系统界面主观评估（SASSI）问卷用以评估基于VUI的主观满意度，专注于评估语音输入阶段的体验。具体而言，通过与用户体验有关的34个项目进行评估。

SUS

系统可用性量表（SUS）是用于评估交互式系统可用性的最著名，使用最广泛的调查表，不仅限于对话UI的评估。在《语音用户界面设计》这本书使用的也是这种方法，所以就不放图了，有兴趣的同学可以看看这本书。

如何在设计实践整合道德考量

前近代的人们，可能缺衣少食，但不大缺意义，相反，我们这个时代，什么都不缺，却常感到意义在流失。

为什么要做这个项目呢？可能是践行理念的一个实际行动吧。这个部分就不重复讲座的内容，具体可以参考我以前的一篇文章「Design for Well-being | 设计中的道德伦理考量」。

上篇：「从理论和历史两个角度来谈什么是会话式UI」

参考文献

Lewis J R. Standardized questionnaires for voice interaction design[J]. Voice Interaction Design, 2016, 1(1).）

Kocaballi A B, Laranjo L, Coiera E. Measuring user experience in conversational interfaces: a comparison of six questionnaires[C]