比如图标,它是基于单个词的分析给出,精度往往比较高;同时图标是一个Nice to have的功能,它不会特别影响我的正常使用。因此没必要给特别明显的更改图标的功能。 反之,如果决策相对重要,而AI不能给出完全正确的决策时,要么只是给出建议,要么就是能提供快速的修改方式。这里需要交互设计师在这个过程中找到合适的平衡点。
[Fig – 6] 谷歌Inbox的自动回复功能
[Fig – 7] Tribe app能自动识别语音聊天中的信息,并提取关键信息 在这里我在追加几个例子,谷歌邮箱服务中的Inbox的自动回复功能和Tribe在视频聊天中自动提取信息并生成卡片的功能。这些就像沟通流中默默观察并在适当时候提供帮助的助手一样,如果设计得当也能给人们生活带去便利。 Multi-modal输入 在过往的这些年图像识别和语音识别已经发展得相当完善,已经能够在一些日常功能中使用它替代一些输入了。比如 锤子科技在发布会试图推动的语音输入 各大地图和搜索应用中添加的语音输入 利用摄像头直接进行翻译的谷歌翻译 之后这些应用场景只会越来越多。 对于交互设计师或产品经理来说,如何巧妙地将这些新技术应用到现有的产品中,使得用户能够很方便的在他们需要的情况下调用这些功能,是我们真正应该关注的。这就需要找到非常有需求的应用场景。 在Smartisan OS的大爆炸功能中,当界面上的文字无法被直接提取时,系统会提示用户选择屏幕截图,然后针对所选区域实施OCR功能。这其实就是用图像识别这一巧妙的方式绕过系统的壁垒。 那下一步其实就是更深度地在算法上进行优化,针对图片和点击区域进行智能的裁切,用户根本就不需要进行裁剪这个操作(这个操作其实又是个操作成本比较高的、应该用AI优化的操作,我每次都不愿意使用,都是直接对整个截图进行OCR),整个体验不会被打断,用户可能根本没有意识到背后的一系列算法操作。这样用户体验又可以进一步提升。 更优的输出 除了在输入方面能够减少大家工作量,AI还有可能提供更加个性更加优化的输出。 这个趋势非常热门,比如说: iPhone可以通过给用户的照片进行分析,直接生成一段可以分享的电影; 包括今日头条在内的各大资讯网站对不同用户进行智能的内容的分发; YouTube自动生成的智能预览图; 各大国产ROM中对邮件和短信进行智能分析和重新排版等。 这种应用在算法上和用户分析上都相当有挑战性。 结语 这篇文章提到了很多AI在产品中的使用。我觉得最核心的是一个思维方式的转变,之前我们解决问题很多时候都是用创新的界面设计,使得用户可以更快地达到他们想要的目的;而在AI时代,我们可以重新思考所有问题能否在后端用AI尝试解决,并在前端以一个合理的方式呈现出来。比如: 我们总是被恼人的通知打扰,是否系统能通过判断我们取消通知的操作来推断我们从来不看某些应用的通知,并将其降低优先级或定时清理? 我们的屏幕亮度调节不准,是否系统能根据我每次在自动模式下人为干预亮度,对亮度调节算法进行优化? 系统有没可能检测到我经常进行的重复性操作(每天到公司打卡),为我自动创建IFTTT类似的快捷功能? 视频播放器能否在字幕和声音不匹配时自动匹配呢?(当这个发生时,要很好地对齐真的很困难) 能否智能分析如何取消邮件的订阅,使得我能有一个列表告诉我订阅了哪些邮件,我只需点击checkbox,后台自动为我取消或恢复订阅?或是想Smartisan OS那样,以智能屏蔽的方式取消订阅? 能否在我通话时提及电话号码时,自动识别数字并保存?录音也同时保存下来确保不发生识别错误。 下一次,当你遇到问题时,试试用AI的方式解决吧~ 引用 (责任编辑:admin) |