首页
UI设计正文内容

生成式 AI 体验中的新兴用户体验模式

2024年04月08日
阅读时长 3 分钟
阅读量 18
生成式 AI 体验中的新兴用户体验模式

你是否曾经被一位咖啡师准确地知道你的咖啡订单?在不需要详细说明每个细节——温度、冲泡时间、水量、咖啡豆产地、研磨粒度、烘焙程度等等——的情况下,享受到了一杯咖啡。这展示了我们如今在人工智能领域所面临的范围。

本文不是关于咖啡的,而是关于用户交互如何改变和适应的,关于生成式 AI 用户交互如何根据 GUI 的先前趋势和生成式 AI 交互中出现的新趋势而发展。我们将探讨上下文捆绑、用户策划、信任和生态系统作为 AI 用户体验的关键趋势。

从命令到对话

让我们回到计算机诞生的时代,当时使用计算机意味着在命令行界面(CLI)中输入精确的命令。想象一下记住打开文件或复制数据的确切命令的挑战,更不用说找到你的“作业”文件夹了。并不是每个人都适合成为程序员。为了更广泛的可用性,需要进行转变。

1964年,ELIZA出现了,它是早期的自然语言处理尝试,通过关键词识别和脚本化的回应与用户进行基本对话。尽管具有开创性意义,但 ELIZA 的交互远非灵活或可扩展。

与此同时,施乐帕克(Xerox PARC)正在开发图形用户界面(GUI),后来由苹果于1984年微软之后推广。GUI 彻底改变了计算机,用图标、菜单和窗口取代了复杂的命令,通过鼠标进行导航。这一创新使得计算机在日常任务中易于访问和直观,为技术在我们生活中的普遍角色奠定了基础。

不同界面的示例。ChatGPT 的主要交互是基于文本的,它可能会如何发展?

请看上面的示例图像。我们今天正在见证一种平行的演变。用户提示基本上是用自然语言编写的小程序,其结果的质量取决于我们的提示工程技能。就像早期的计算从复杂的 CLI 过渡到简单的 GUI一样,使技术对每个人都可用,我们在生成式 AI 中看到了类似的趋势,即将复杂的输入捆绑到更简单、更用户友好的界面中,背后的复杂性则由系统处理。

UI 和 Stable Diffusion WebUI、Midjourney 和 DALL·E 3 的潜在提示展示了对图形化表示复杂图像扩散后端的不同方法。

如上所示的图像生成器,例如Stable Diffusion WebUIMid JourneyDALL·E 3在提示中要求不同程度的准确性才能获得结果。虽然 Mid Journey 和 DALL·E 更易于使用,但 Stable Diffusion 允许更具体的输出。然而,我们对用户了解得越多,就越容易提供简单的体验同时保持他们所需的特定性。

上下文捆绑

上下文捆绑通过将相关信息组合成一个命令来简化交互,解决了传达复杂指令以实现预期结果的挑战。这通过在一次操作中对齐用户意图和机器理解来提高效率和输出质量,消除了手动编写用户提示的需要。

我们已经看到这种趋势在生成式 AI 工具中的出现,例如 Edge 中的示例提示、Google Chrome 的标签管理器以及 Stable Diffusion 中的触发词是提示中的特殊标记,可以通过文本反转、LoRa 模型或其他改进进行微调。

在上下文捆绑中,“对话式” AI 并不总是指对话。它关注的是用户试图获得的结果,而不仅仅依赖于基于文本的提示。上下文捆绑为用户提供了无需进行冗长对话即可快速获得所需输出的捷径。用户体验不再依赖于通用的对话界面,差异化是由特定数据和更专业化的体验驱动的。

这种特定性的示例包括Miro AssistClay AI 公式生成器SCOPUS AI。每个工具都通过将相关信息组合成特定的单个命令来简化交互。

扩展上下文捆绑的另一种方式是让用户定义这些捆绑的属性。用户可调整的偏好和个性化被捆绑到上下文中,为用户提供更高效和相关的交互

上下文捆绑不仅仅是简化对话,它还有助于帮助用户直接实现他们的目标,无论是通过搜索查询、摘要还是其他特定任务。它将详细的指令转化为简单易用的交互,特别适用于简单或重复的任务。但是对于探索等更开放的任务,或者需要精细调整的目标呢?这就需要连续的用户反馈机制或反馈循环。

用户策划

尽管在使 AI 交互更直观方面取得了进展,但仍存在一系列需求,用户必须对输出进行精炼以实现他们的特定目标。这在研究、头脑风暴、创作创意内容、优化图像甚至编辑等活动中尤为重要。不断增加的上下文窗口和多模态能力使得引导用户穿越复杂性变得更加重要。

无论是否意识到,我们作为人类不断策划着我们对世界的体验(上图)。这种策划可能是在对话中突出或选择我们感兴趣的关键词,或者在书中手动突出显示。在观察用户使用 ChatGPT 进行头脑风暴时,我注意到了这种类似的突出行为。当时,用户无法与突出部分进行交互,但使用其中的部分来指导他们的下一步。这表明,尽管初始输出可能无法完全满足用户的需求,但它为下一步行动提供了有形的锚点。使用户更容易策划和完善他们的输出,可以使用户和机器获得更高质量的结果。

示例包括 Clipdrop、ChatGPT、HeyPi、Google Circle 和 Github Copilot。在上面的图片中,修复图像、线程对话和突出显示交互都是 emergent examples 的例子,它们展示了用户如何策划信息的特定部分,以创建更相关的上下文并获得更好的结果。

以撰写一份深入研究的报告为例。用户的旅程通常从广泛的研究开始,然后发现需要深入调查的关键点。随着他们收集和评估信息,他们逐渐将其编译和综合成最终的作品。在这个过程中,突出或选择特定内容的时刻起着关键的锚定作用,引导 AI 提供更相关的结果和上下文。这条路径需要用户保存和使用突出显示的方式。

用户策划揭示了,为了使生成式 AI 有效地支持复杂的创造性任务,它不仅必须理解,而且还要预测用户与信息互动的微妙方式。通过识别和响应这些“策划信号”,AI 工具可以提供更有针对性的帮助,丰富整体用户体验和结果。

为了建立足够的信任而进行设计

尽管生成式 AI 使用户与技术的互动变得更加容易,但信任仍然是广泛采用的重要障碍。这在过去是如此,今天仍然如此。解决信任问题对于建立和鼓励新的 AI 工具的采用至关重要。

在许多用于理解人们接受和使用新技术的框架中,有两个框架特别具有启发性:统一的技术接受和使用理论(UTAUT)和 Fogg 的行为模型(FBM)。

作为一个有用的简化:UTAUT 表明使用意图受到绩效期望、努力期望、社会影响和促进条件的影响。例如,某人可能决定开始使用客户管理工具,因为他们相信它将有效地帮助他们实现销售目标(绩效期望),他们发现该应用程序简单易用(努力期望),他们的同事和导师也在使用和推荐它(社会影响),他们的组织数据库可以通过它访问(促进条件)。

一个类似的理论,FBM,将行为简化为动机、能力和提示(或触发器)的函数。例如,购买咖啡的行为是由对咖啡因的渴望、有钱和附近的咖啡店以及咖啡店的招牌作为提示驱动的。

生成式 AI 减少了实现结果所需的努力。据说,许多用户已经克服了与生成式 AI 的激活惯性。然而,确保更多用户尝试并保持参与是信任发挥关键作用的地方。

在设计信任的背景下,有许多观点和框架,如上述提到的。在这里,我们将进一步简化并将信任视为由以下因素塑造:以往的经验、风险容忍度、互动一致性和社会背景。

以往的经验: 我们必须认识到用户有自己的经验。他们通过以前的经验创造了上下文。为了影响这种信任基础,我们只需要不要重复发明轮子。熟悉的界面和互动方式使用户能够将过去的信任转移到现在。在这个信任基础上建立起来要容易得多,而不是反其道而行之。在对话式 AI 的背景下,与其告诉用户输入提示,我们可以利用潜意识倾向在对话中进行镜像来影响用户的互动方式。

风险容忍度: 理解用户希望避免负面结果。关键在于了解用户不愿承担哪些风险。我们必须将风险降低到用户的风险容忍度以下。影响风险容忍度的一些方法包括:增加透明度、用户控制、用户同意、合规性。通过创建精心设计的体验,可以利用美学可用性来降低风险预期。然而,特定于产品的方法总是更有效。例如,想象一下为医生提供诊断的对话式 AI。风险容忍度非常低。误诊对医生和患者都会产生极大的影响。通过提供参考资料、提示细分和相互冲突的观点来确保输出的透明度可以有效降低风险。

互动一致性: 互动既是输出,也是用户到达目标的方式。用户不应该疑惑不解不同的词语、情境或行为是否意味着相同的事情。为了改善互动一致性,确保从布局到按钮文本的内部和外部一致性保持一致。在对话式 AI 的背景下,互动一致性可能表现为响应具有相似的格式,单词在对话中具有相同的含义。如果用户请求一个主题的摘要,它不应该在一个互动中看起来像一篇文章,在另一个互动中看起来像一个项目列表,除非用户明确要求。

社会背景: 可能是最显而易见的层面。社会背景可以包括来自可信来源的认可,如经理的认可,或在受信任的网络中的促进,如与经过批准的企业软件连接。社会背景可以受到社会证明策略的影响,并在互动中创造社会证明机会。在内部数据库的大语言模型的背景下,这可能意味着突出用户及其直接团队所做的工作。指出系统具有对内部数据的可见性有助于进一步建立对系统在这个社会背景中的批准的信任。

在设计 AI 体验的信任时,值得考虑哪些因素应该是即时关注的。通过理解和设计信任的这些方面,AI 体验可以与用户的期望和需求相一致,增加普遍的采用和接受。解决信任问题不仅有益,而且对于未来生成式 AI 工具的整合和接受是必要的。

上下文生态系统

本文涵盖了上下文捆绑和用户策划的新兴趋势,以及为信任进行设计。作为一个整体,生成式 AI 通过降低普通用户开始任务的障碍,革新了生产力,这与 GUI 的好处和发展过程相似。然而,现代用户体验已经远远超出了窗口和指针。那么生成式 AI 接下来会走向何方呢?

GUI 通过支持多个程序界面促进了更深入、更高效的用户互动。这使用户能够在不同任务之间无缝切换,比如在一个应用程序中进行会计工作,在另一个应用程序中进行报告。管理和跨越不同上下文的操作强调了从桥接各种用户意图和应用程序中获得的生产力收益。

emergent examples 中显示的 Edge、Chrome 和 Pixel Assistant 将 AI 功能整合到一起,允许用户使用生成式 AI 与他们的软件进行交互。在这种情况下,大语言模型意识到了软件,这超出了以前的应用程序所限制的对话窗口。

回顾过去,我们可以看到 GUI 为用户创造了一个数字画布。与物理世界相比,这带来了改进的效率、可扩展性和生产力。很可能生成式 AI 将走上类似的道路,其中 AI 成为合作者,将我们的日常生活变成共享体验。未来可能是一个增强的生态系统,其中对话式和生成式 AI 工具将在一个协调的工作流中连接专门的代理。这种生态系统方法可以进一步加深用户的互动,实现在各种数字和现实环境中更加整合和高效的体验。未来的趋势不仅仅是对话式或伴侣式的体验。与我们今天所见相似,生成式人工智能将直接用于创建输出。目前用户与输出进行互动,但画布的创作者和所有者最终是人工智能。随着我们与以人为中心的人工智能产品的成熟,下一步将是创建AI和用户可以在同一画布上进行协作的空间。我们在旧工具如Grammarly中看到过这种情况,并且在生成式工具如Github Copilot中也出现了。我们看到生成式人工智能作为贡献者进行协作,而用户最终创建和拥有工作空间。随着我们对技术的适应和发展,我们可能会看到生成式人工智能在管理我们日常生活(物联网)的数字和物理方面发挥更重要的作用;增强现实并重新定义我们对生活和生产力的看法。

生成式人工智能交互的发展重复了人机交互历史。通过将上下文捆绑到更简单的交互中,赋予用户策划他们的体验的能力,并增强已知生态系统,我们将使生成式人工智能更值得信赖、易于接触、易于使用,并对每个人都有益。

免责声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

相关文章

在 Figma 中使用自动布局的技巧
2024年11月21日20:43
本文分享了在 Figma 中使用自动布局构建响应式组件的技巧,重点介绍了“固定”、“填充”、“拥抱”等大小选项的应用。文章通过实例展示如何创建组件,并在设计过程中逐步测试其响应性,确保最佳的可扩展性和稳定性。通过调整组件和布局设置的顺序,设计师可以更有效地利用自动布局工具。
设计更好的文本输入控件的 8 个技巧
2024年11月17日10:35
本文分享了设计用户输入表单中文本输入控件的8个实用技巧:不要将标签用作占位符,避免使用过长的标签,清晰传达输入要求,不要在控件内使用占位文本,使用适当的输入控件,仅标记可选字段,调整输入控件宽度,使用视觉指示和文本突出显示错误。这些技巧有助于创建直观、用户友好的输入表单,提高产品的可用性和用户体验。
登录表单用户界面设计指南
2024年11月14日21:09
本文探讨了设计简单、极简登录表单的方法,包括层次结构条带的应用和网格间距的定义。通过详细的设计步骤,强调用户界面的逻辑分组和字体选择,确保对比度检查以提高易用性。同时,提供了一些可能的改进建议,帮助设计师展示对细节的关注。
如何处理超过 100 个选项的筛选器
2024年10月11日18:00
在模态中添加导航,通过侧边栏和堆栈设计,使用户可以轻松浏览数百个筛选选项。在移动设备上,使用手风琴菜单或逐级深入的方法来处理筛选器。这些设计解决方案可以提升用户体验,尽管实施需要大量工作。
设计下拉菜单的 10 个最佳实践
2024年09月10日20:20
本文分享了设计下拉菜单的10个最佳实践,包括避免过长菜单、不要在仅有2个选项时使用下拉菜单、禁用无效选项、避免过于明显的选项使用下拉菜单、限制多级菜单等。此外,还提到了设计清晰的视觉设计、考虑移动设备适配、组织选项顺序、提供搜索功能和设置默认选择。通过遵循这些实践,可以提高产品的可用性和用户体验。
UI 设计技能等级与被雇佣关系的分析
2024年07月04日21:34
通过观察500份初级UI设计师作品集,发现达到第四级及以上的设计师更容易被雇佣。关键因素包括可读性、布局、颜色、对比度、字体选择等。从第一级到第五级的设计水平有明显差异,第四和第五级的设计更受欢迎。设计师需要注意间距、字体选择、结构等细节。第五级设计要求严格遵循8点网格、一致的间距和清晰的结构。练习和努力是提升设计水平的关键。