从交互设计角度看锤子科技备受争议的坚果R1与TNT

图文均转载自微博@尚洁怡

少啰嗦,看东西。

这次发布会我自己还挺激动的,但是大家看完后好像不是那么激动,看来起在技术理解上存在不匹配。

微博上的质疑集中在这个 9999 的 TNT 工作站,觉得这就是个显示器,不理解为什么显示器要这么贵。

TNT(Touch and Talk)的核心并不是显示器,显示器只是一个硬件载体。

这次发布的核心产品其实是一个创新的交互逻辑。

为了便于这套交互逻辑的设计动机,要先剖析一下 IT 行业的交互变革史(以下内容来自我的第一条问答)。

━━━━━

交互的发展史

计算机刚被发明的时候并不是现时看到这个样子的,而是这个样子的。

· 像房子一样大的计算机

当时的计算机一切数据和操作指令都是通过由纸带输入机进行的,是当时唯一的输入设备。穿孔纸带上利用一排孔表示一个字符,用穿孔或不穿孔表示 1 和 0,来将指令和数据导入内存。

· 用于人机交互的穿孔纸用于人机交互的穿孔纸

穿孔纸用起来非常慢,即使是一个简单的程序,所需要的纸也是一箱一箱的。

后来,键盘终于被发明了,可想而知这输入速度有多大的提升啊,直到今天,键盘仍然是人机交互当中效率非常高的输入设备。

· 键盘

再之后,苹果推出(其实是抄了施乐)了图形用户界面的操作系统,同时把鼠标这种输入工具也发扬光大了(鼠标也不是苹果发明的),在图形用户界面上,鼠标是一种比键盘更高效的定位工具,与键盘配合直到今天仍然是高频的输入设备。

· 鼠标可以在图形界面中快速定位

再然后,又是苹果,把触摸屏这种交互方式在智能设备上发扬光大,(触摸屏也不是苹果发明的,但基于移动设备触摸屏的交互方式,基本上是苹果定义的),所见即所得的交互方式更符合人性的直觉,乃至儿童不经培训也懂得使用,触摸屏迅速风靡全球,成为移动设备上非常重要的操作方式。

· 触摸交互符合人类直觉,更容易使用

随着人工智能当中的深度学习算法变得成熟,语音输入法终于把识别率达到日常可用的程度,于是人们又多了一种输入方式:麦克风。只要说话就可以实现与设备的交互,机器能理解人说的话并转变成执行操作。

· 讯飞语音输入法

人工智能带来的交互方式不止一种,随着视觉识别技术的成熟,摄像头也成为了一种交互方式,人们只要对着摄像头做出某种手势,机器就能识别出你的操作意图。

· 支持手势识别的无人机

· 基于视觉识别的体感游戏机

甚至,马斯克放言要基于人脑电波的识别技术开发脑机接口,你什么都不用做,只要你的大脑在想,计算机就能识别出来并执行你的意图。

· 脑机接口

感觉霍金应该很喜欢这个技术,可惜他走得太早了。

这中间,还出现过其他的交互方案,例如搭配 Surface Studio 使用的 Surface Dial 模块,在屏幕上旋转就可以实现很多功能,使某些应用场景下的交互变得更快。

· Surface Dial 旋转交互模块

还有 MacBook Pro 上的 touch bar,也是一种传统交互方式的补充。

· touch bartouch bar

在人机交互发展史上,苹果并没有发明图形界面、鼠标和触摸屏,但却多次把握住风口机会利用交互技术开创出新的时代,在所有 IT 巨头中,苹果对交互的理解是最深的。

━━━━━

交互变革引发 IT 时代变革

IT 技术的发展基本上是伴随着交互的变革前进的,新的交互会带来新的流量入口和市场机会,键盘鼠标之于 PC,触摸屏之于智能手机,语音交互之于智能音箱,这些交互变革的规律无非两个:效率越来越高,使用越来越简单。

键盘和鼠标比打孔纸更高效率因此繁荣了 PC 时代,触摸屏降低了交互的难度(老人小孩都会用),使移动计算设备得以更大范围地普及,而语音交互时代的到来,又一次降低了交互的难度(释放双手,不学习任何输入法也可以用),则使语音交互入口(如智能音箱,车载设备等)成为所有巨头都争相抢夺的新战场。

关于语音交互的趋势,大家可以参考几个数据,一是亚马逊的智能音箱(Echo、Tap、Dot 系列)保守估计已经卖出超过 5000 万个了(注意:美国只有 1 亿多个家庭),二是 Siri 已经成为美国第二大搜索引擎了(是的,点亮屏幕-打开 Google-输入关键词,人们都嫌麻烦),三是手机百度上使用语音搜索的比例是相当高的,最后,微信用户每天发送的语音是 61 亿条。

前三个数据是为了说明,人类总是懒的,当语音识别率在某些场景达到可用水平时,用户趋势肯定是倾向于不输入文字的,而微信的语音发送数据只是为了说明:发语音比打字容易太多了,这是微信当初引爆用户规模的其中一个杀手锏。

越简单的交互,越能侵入用户的生活。

基于键盘和鼠标的个人电脑已经发明了数十年,今天老罗却说,要重新定义未来十年的个人电脑。

━━━━━

为什么传统的个人电脑值得颠覆?

每一个质疑 TNT 工作站的人都认为,TNT 在效率上怎么可能比 PC+键盘鼠标+office 三件套要高呢?

现在请 office 三件套高手回忆一下,从开始练习键盘打字、中文输入法、Windows 使用等一系列平台工具,然后再学习 office 三件套基本操作及高级技巧,最终成为 office 高手,总共花了多少时间?

计算完这个答案,大家会哭。

Office 的高效率,并非来自平台或软件本身做得好,而是因为自己花了大量的时间学习和刻苦训练,而我们却把这种效率当作理所当然。

现在小学就有电脑课了,要学习键盘打字,要学习 windows 基本操作,要学习中文输入法,社会上有大量在职培训机构开设 office 培训班(在线课程也很多),真正开始工作后,还要学习大量的实战技巧,这些都是你成为 office 高手前付出的代价。

· 电脑培训班是全球性的产业

事实上,windows 和 office 都是相当难用的,因为这两个软件都需要无差别匹配全球用户的需求,而且一直要以向上兼容的方式来迭代,导致软件非常臃肿和复杂,每个人打开软件都要面对大量自己很少用到但别人可能会用到的功能,只是大家经过长年累月的学习,即使很难用也已经学会了,适应了,没有人去研究这个问题。

office 取得了接近垄断式的成功,这也导致微软没有什么动力去优化软件体验,而且社会上的培训体系已经成为成熟产业,微软只需要不断增加 office 的功能以满足更多的需求就可以了,这只会令 office 越来越难用。

以 word 为例,1983 年就开始编写,1989 年成为 office 的一部分运行于 windows,这个 PC 早期发明的软件即使到了今天仍然具有非常明显的交互特征:命令导向

所谓命令导向就是 DOS 时期的思维:把一系列命令图形化,仅此而已。

· 传统 PC 软件的交互方式就是命令的堆叠

命令导向的软件都是很难用的,office 三件套都有一致的交互,软件顶部和右边是一系列复杂的菜单和功能键,集成了处理工作所需要的所有命令,多得令人不寒而栗,你要记住和熟悉这么多的命令及其功能,才能熟练使用这些软件。

其实整个 PC 时代的软件都是基于命令导向来设计的,因为这就是基于鼠标键盘的 windows 平台的交互特色。

那么来看看锤子科技的 TNT。

━━━━━

TNT——革命性的交互逻辑

举个例子,你想到了一个 PPT 的逻辑顺序,随手拿起手机记录闪念胶囊,回到工作站面前,胶囊一键自动生成 PPT,这个过程中系统会根据胶囊里的内容含义自动从网上抓取适合的配图及排版,注意,是自动配图及排版。

再举个例子,你想把一篇长文章里 62 处“我爱这个世界”这个关键词换为红色并加下划线,在传统的 Word 里大概需要点击 200 次鼠标和花费 10 分钟,但是在 TNT 里,只需要说一句话就可以了。

再举个例子,当你指着当前窗口说:关掉其他窗口。系统就只保留了当前窗口,其他窗口全部关掉,而在过去,这是需要你用鼠标一个一个关掉的。

发现什么规律了吗?

这种交互方式跟传统的命令导向有很大的不同,TNT 处理的是用户的“意图”而不是“命令”,我把这种交互方式命令为“想法导向”。

“我想关掉其他窗口”和“我用鼠标一个一个关掉窗口”就是想法导向和命令导向的典型区别,基于命令导向的交互方式,每个动作都要自己逐一完成,而基于想法导向的交互方式,藏在系统背后的 AI 会理解你的意图并帮你完成一系列复杂的操作,直接给你呈现结果。

命令导向的交互方式是反人性的,这种交互仅提供了工具,依赖于用户大量的前置学习和训练,依赖于用户对系统功能非常熟悉,依赖于用户一点一滴地执行,这种交互方式的效率来源于用户自身的努力和时间投入。

以一份办公室经常用到的晋升通知为例,在过去,这样的稿件需要我们打开 word一字一句地输入-排版-审批-打印-盖章-张贴,这个简单的文档前前后后花了 HR 一个小时,但是在未来,吴德周只要在上班路上对着坚果 R 系列手机的闪念胶囊上说一句:“写一份朱海舟从产品经理晋升到高级产品经理的晋升通知,表彰他在 TNT 产品研发过程中取得的优异成绩”,回到办公室的 TNT 工作站前,一份排版优美用词严谨的完整版晋升通知已经自动生成了,只需要修改某些字眼就可以打印出来。

从一字一句地输入到所想即所得的交互方式,就是我们马上可以触摸到的未来。

很多人通过分析坚果 R1 手机和显示器的硬件参数,又或觉得语音识别和触摸交互都不是新鲜的技术来质疑老罗说的颠覆是不是吹牛逼,这是错误的判断角度,从命令导向到想法导向,就是 TNT 对传统交互最大的颠覆。

TNT 这种交互方式的终极目标是你不用学习复杂的工具和命令用法,只需要清晰自己的工作目标,不断地提出你的想法就可以迅速地完成工作。

━━━━━

TNT 创新交互的设计依据

老罗把 TNT 的交互方式称为直觉交互。

为什么说直觉交互更符合人类的真实体验呢?

语言学家认为,人与人在面对面交流时,身体语言(如眼神、表情、动作等)比口头语言(声音)传达了更大的信息量,结合身体语言来表达意图已经是人类数百万年来的习惯,这就是电话里有些事情很难表达清楚的原因。

· 肢体语言配合声音是人类长期以来形成的表达习惯

这也是人们觉得智能音箱像个智障的原因,因为如果你把智能音箱当人,音箱看不懂你的身体语言,而你却已经习惯了身体语言+口头语言的表达方式,因此智能音箱会漏掉了很大的信息量,造成错误的理解,显得像个智障。

无论智能音箱怎么努力调整算法,人类以肢体语言辅助声音来表达这种方式是很难改变的,用户单用嘴巴总是难以表达清楚需求(例如用户很焦急地说:“给我输出啊!”其实这个需求漏掉了大量的信息,语音交互平台既不知道要输出什么,也没看到用户焦急的表情,就会一直问用户想要什么),所以纯语音交互的瓶颈是极难打破的。

正是因为洞察到这个难以解决的问题,所以老罗设计出TNT交互方式。

TNT(touch and talk)相当于给了用户补充肢体语言的表达机会,当你触摸某个具体区域再说出你的想法,系统不再漫无目的地乱猜你的想法,而是根据所指区域迅速收窄你的需求,给出更精准的答案,如果你对着空气中说一个需求,即使是打败了柯洁的 Alpha GO 理解起来都是困难的,但是当你触摸到具体的文字、图片或表格上再说需求,系统大概就知道你想要干什么了。

结合语音和触摸收窄用户需求(TNT),再基于语义分析和行为习惯来领悟用户需求(CRYSTAL BALL),在桌面上以 AI 来组合一系列功能动作完成用户需求,这就是想法导向的 TNT 与命令导向的鼠标键盘最大的不同之处。

基于以上创新的交互理念,再结合 POKER DEALER(发牌手功能,相当于全局搜索,充分利用大屏优势提高答案命中效率), Bullet Messenger(子弹短信其实是一个跨平台协作系统,不是发布会上那样用来群聊的,目前完成度不足,后期有巨大惊喜),闪念胶囊,及配备双线性马达的 10 个多功能触控键,使工作或娱乐的效率得到巨大提升。

TNT 里集成了大量的 AI 技术,但锤子科技并没有大力吹嘘 AI,好多厂商都说自己的手机用了 AI,但我想说的是,把 AI 用于生产力才是最大的价值,把 AI 用来美颜那是小儿科而已。

━━━━━

TNT 的目标

我们的人生中需要花费大量时间学习和训练来弥补传统 PC 软件的难用,这不是必然的,即使这种反人性的用户体验方式持续了三十年,但也不是必然的,键盘和纸带输入一样,是计算历史上阶段性的产物,当其他不需要学习的输入方式效率提高到一定程度时,键盘就会被淘汰。

TNT 的短期目标是缩短基于命令导向软件的学习时间,降低使用难度,提升工作效率,长远目标是干掉鼠标键盘和陈旧的软件交互方式,所想即所得。

我知道有些人还是很想杠,在办公室里大家这么说话不是很奇怪吗?

首先,你的办公室没有鸟巢现场那样三万多人和三万多部手机产生干扰,不需要像发布会那样很严谨大声地说出来,正常说话的语气就可以了,坚果 R1 专门设计了双麦克风和硬件降噪算法来处理这个问题。

其次,随着系统背后的深度学习算法越来越智能,通过学习你日常的事务处理习惯,你需要说话的场景只会越来越少。

再次,结合挂在脖子或耳朵上的蓝牙智能耳机使用,嘴巴与耳机间的对话距离非常短,喃喃自语就可以完成语音交互,在办公室基本可以做到无干扰,相信不久将来就会有第三方厂商推出这样的蓝牙耳机,预计售价将不超过 300 块。

最后,搜狗最近推出的“唇语识别”技术准确率已经很高了,导入类似技术,一些简单的语音交互需求甚至只需动动嘴就能完成了。

杠是没有价值的,技术总是在进步,问题只要存在解决的可能性,就一定会被解决。

━━━━━

9999 的一体机是不是太贵了?

我们来分析一下微软的 Suface 策略。

Suface 只是微软向第三方厂商示范硬件可以怎么做才好用,但微软并不是一个擅长制造并贩卖硬件的企业,把硬件大规模分发到全球市场仍然需要依赖联想戴尔等厂商,,如果 Suface 定价太低,对市场产生了心理锚定,那合作厂商推出同类型产品就没有利润了,这样会打击到合作厂商的热情。

所以 Suface 的定价必须高高的,这样人们买第三方厂商产品时,就会觉得很超值。

同理,如果锤子科技希望基于 TNT 交互的 Smartisan OS 被大量使用,必然要借助第三方硬件厂商的力量,把 TNT 工作站的配置做到顶尖再宣布 9999 的定价,也是为了给市场锚定价格预期,给配套厂商留下空间,要知道勤劳美丽的深圳人很有可能会把这个工作站做到 999 元(老罗微博已经透露将会有低至 500 元的第三方配套产品),这么一来,第三方 TNT 工作站是不是显得很有吸引力啦?

买个坚果 R1 手机,以后就有机会享受到 999 元的第三方配套工作站,家里放一台公司放一台甚至车里也放一台,随时跨平台工作和游戏,想想现在还买其他骁龙 845 手机是不是很吃亏?

━━━━━

TNT 是正确的方向吗?

随着技术的进步,在保持低功耗的同时,移动处理器的速度越来越快,以骁龙 845 为例,计算能力已经媲美普通的笔记本,而以后只会越来越快,越来越快的处理器只是用在手机上是不够的,高通一直以来希望有一个理想的桌面解决方案来推动处理器向桌面系统进军(并向其他厂商提供示范),以侵蚀英特尔的市场。

但环顾整个行业,所有已推出的解决方案都是噱头式方案,没有实用价值,而小米华为等厂商为了安全选择了难用的微软桌面系统,没有一家厂商能支撑高通的梦想。

直到 TNT 出现。

高通非常认可 TNT 的价值并决意在这个方向上作出支持和投入,所以这次我们看到在鸟巢发布会现场插满了高通的旗子,因为高通站在 TNT 身后,要全面推动这个桌面系统实用化,实现自己移动芯片桌面化的目标。

· 旗舰之选——高通骁龙处理器

另外,核心合作伙伴讯飞和三角兽都是 AI 领域里积累极深的企业,也非常清楚纯语音交互的瓶颈(无法理解肢体语言),所以他们都觉得成为 TNT 项目的参与者是非常有价值的。

最后,如果 Google 也认可 TNT 比自己家的 Chrome OS 更有机会实现安卓向桌面化进军的野心,那就更好了。

行业巨头因为拥有更大的信息量和前瞻性,对一个方向的把握肯定比大众清晰得多,这几家巨头愿意与 TNT 项目通力合作甚至站台,足以表明 TNT 的发展方向是对的。

所以 TNT 这个项目不是锤子科技一家小公司捣鼓出来的,是一大堆相关领域的顶尖厂商合作做出来的,因为锤子科技是项目的核心设计者和牵头人,也是硬件终端企业,所以这个产品最后由老罗发布出来了。

苹果并没有发明图形界面、鼠标和触摸屏,锤子科技也没有发明语音识别和多点触摸屏,没有发明语义分析和深度学习技术,TNT 的理念跟 iOS 第一次定义移动设备的交互是一样的,是交互逻辑和效率上的颠覆。

当然,创新只是一个项目是否能成功的其中一个因素,当年苹果的图形操作系统比微软早推出十年,但是在商业运作上的不成熟,最后还是输给了微软。TNT 的商业化之路肯定也充满挑战,但是把交互从命令导向进化到想法导向,肯定是交互领域的革命性升级,跟普通的语音识别完全不是一回事(很多人跟风转了李开复那个视频,甚为无知),作为科技爱好者,这个本质的区别还是要懂的。

谢谢阅读,下面是推广信息,谢谢支持。

福利:内购正品DW手表,2人团购低至6折

长按识别内购地址

智取交互学院,交互扫盲课程已上线,欢迎访问

点击原文链接访问

访问:http://jiaohu.com

0

评论0

站点公告

 

AI创作与绘画大师,国内版chatGPT在线版本免费使用哦

点击打开: https://ai.uiya.cn

   
显示验证码
没有账号?注册  忘记密码?

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码