AudioUserInterface.org

欢迎访问音频用户接口(Audio User Interface)项目网页
用纯音频媒介作为人机交互
全新探索!

主页
技术
演示录像
相关连接
关于

什么和为什么?

当你在行走,跑步,驾车 或是开会中,你怎样与随身的移动计算设备交互呢?

按照传统的思维方式,显示器是任何移动计算设备不可缺少的用户界面。其实不然。我们知道,人耳随时随地都在接收大 量的信息,然而在用户界面的设计中,这一优势却被忽视了。当今的移动设备,例如手机,MP3,车载计算机,个人数字助理,本来可以做到很小,但是却被液晶 显示屏幕的尺寸所限制。 如果我们利用音频界面代替视觉界面,就会让人们在不影响行走,跑步,驾车 或是开会的同时,达到与随身移动设备交互的 目的。撇开液晶显示,设计一个只有音频界面的用户接口,这就是项目的最终目标。

本项目定义了利用音频进行人机交互的方法,系统 和基础结构。它试图建立音频用户接口(AUI)的通用标准。项目重点放在音频用户接口以及以网络为中心的技术实现上,而不是理论探讨。以下是一些系统描述的简要术语:

  • 在移动计算和移动通讯设备上,不需要视觉显示器。一个简单的手动控制输入设备,配之以丰富 的 音频信息反馈,用户可以不需要视觉的反馈情况下随意操作设备。

  • 在互联网上,通过音频网络终端(Audio Net Terminal-ANT)中的音频浏览器可以浏览音频空间。音频空间是用AudioXML来描述,JavascriptPHP网络程序基础构成的。在这种应用下,音频空间可以取代视觉界面的网页概念。

  • 最终,电脑就在您的耳朵里!就像带着耳机一样。

更多背景

本项目建立了一个用于信息处理设备的全新用户接口的系统和方法。这些设备是人们在日常生活的中,无论是个人需求还是工作需要都 会用到。如手机,MP3,车载设备,家庭娱乐系统,电话,交互式语音应答(IVR),工业控制系统,医疗设备,台式电脑等。一种设备是否被公众接收和喜爱,不仅取决于该设 备的处理能力,存储空间的大小,更重要的是,它是否有适应环境和用户意图的输入/输出(I / O)方式和交互技术。对于目前几乎所有的用户接口设计中占主导地位的图形用户接口(GUI ),如何将其做至最小,且又容纳丰富信息是一个很矛盾的问题。音频不受这些条件所限制,然 而,音频感 知并没有引起我们的重 视。其实它和视觉感知一样,只是其的功能性不同能而已。以声音的形式接收外界的信息,是人类生理本能。正如眼睛可以识别光的不同变 化,比如:色调,亮度和 对比度,耳朵能通过改变音色,音量和音高而感知到各种各样的声音,然后经过大脑将这些不同的声音与具体的事件,事物,或抽象的概念联系在一起。遗憾的 是在目前的人机交互系中统并没有利用人耳能力的这种优势。我们现在引入以音频为基础的人机互 动系统,目的就是以不同的方式提供给人们更多的交互选择。

此 外,当用户正在进行某种工作或任务,在许多情况用户是不能被转移视线的。例如驾车,跑步,开会,甚至在战场士兵上。人们不可能在同一时间观察多种情况。考 虑另一 种情况就是在昏暗的光线环境下,很难看到显示器。某些情况下甚至关系到生死,就像我们前边讲到的驾车。驾驶当中,视线离开行驶方向是非常危险的。这意味着 用户界面应该转移到背景方式。人机互动应处于协助模式,而不是主导模式。大家都知道,听是被动的过程。用户可以在处理其他事物的同 时,轻松地收听音频信号。因此,音频是背景计算的最好选择。

今天的计算机或互联网设备拥有数以千计的应用程序。人们使用他们大多为一些非常简单的任务,如收发电子邮件,收听
MP3,阅读新闻,查询天气等。但是,操作这些计算机和移动设备却是并非简单的任务。而
音频用户接口AUI 和音频网络终端ANT就 是解决这个问题的。它的宗旨就是简单,再简单。以最简操作满足人们最常用的需要。音频媒体是如此简单,它并不需要光怪陆离视屏显示。由于听是被动的,不存在主动的看的过程,因此不会感觉负担过重。总之,设计这样的系统的目的就是让人们在简单,轻松,愉快的情绪下生活工作。

多少年来,人总是寄希望于语音识别作为解决上述问题的办法。 但它的成功应用只是在有限的程度上。在许多情况下,语音识别是不够的,在某些情况下,它是完全不合适的。比如: 1 )噪音环境,尤其是在拥挤 的人群中,即使是最好的语音识别也可能失败。2 )没有安全性,被讨论的事情是非常机密或私人性的。3 )烦躁性,如在公共领域和社会环境。4 )难以做到无差错控制,不可靠。即使是最好的语音识别也不可 能做到无差错。5 )语言的依赖性。当然,语音识别在某些有限的情况下仍然是很 有用的,比如,简单的指令输入或从列表名单中选择一个。

应用领域

本项目的技术核心和系统设计并非针对任何单一的应用,而是一系列应用的共同核心。它定义了 一种用户界面的方法和标准,它为单机和网络应用提供了一个框架和API。这里列举一些可能的应用:MP3播放器,手机,电话,车载计算系统,网络电台,网络信息,音频浏览,如天气报告,RSS新闻,电子邮件,语音图书,音频全球定位系统,音频游戏,交互式语音应答(IVR)系统,家用仪器,医疗设备等。

备注:此技术已申请美国专利,现在还不是开源系统
网页更新时间2009年7月5日,美国加州硅谷