选择分类
  • 云瑞原创
  • Mockups
  • Ui Kits
  • 背景纹理
  • 图标
  • 平面图形
  • 探索
  • 笔刷
  • 图层样式
  • PPT模版
  • 影视素材
  • 教程
  • C4D资源
  • PS动作
  • 常用3D资源
  • 字体
  • 网站模板
  • LR预设
  • 设计学院

设计有用的生成式人工智能体验:从无聊的废话生成器到实用的终极副驾驶

0DgAXKzCUibzFKioZ
照片作者 Rolf (Unsplash) 

突然间,关于生成性人工智能的新闻无处不在。人们谈论ChatGPT如何在创纪录的5天内达到100万用户,高盛如何预测人工智能将影响3亿个工作岗位,以及新的必应如何 “不正常”……

抛开所有的夸大其词,作为一个从事数字助理工作的人,拥有人机交互的背景,以及对新兴技术设计的热情,这对我个人来说是一个令人兴奋的时刻。

生成式人工智能的突破就像我们发现电的那一刻–事情可能仍然需要多年才能成熟(尽管它正在加速),但我们知道,我们可能刚刚落在一块重要的垫脚石上,突然间开启了许多可能性,而行业中的每个人都在试图弄清楚什么是可能。

的确,什么是可能的?以及我们如何最好地利用生成性人工智能的能力,并弥补其缺点?

在这篇文章中,我将尝试解读我作为一个设计师在玩了几十个生成式人工智能工具后的心得。我将谈论良好的输入对生成式人工智能的重要性,语言作为输入的局限性,以及我们如何利用设计的最佳实践来弥补这些局限性,并使生成式人工智能对日常用户有用。

虚假的承诺

我们已经看到了人工智能的爆发,它们可以生成语言、艺术、音乐、整个演示文稿、代码,甚至是对公众人物的播客采访(想想乔布斯?)

看着所有这些在几个月前对公众来说有些难以想象的新能力,我们可能很容易产生这样的错觉:不久之后,我们只要说几句话,生成性人工智能总会发挥其魔力,创造出一个无可挑剔的解决方案,完全代表我们心中所想的。

然而,情况并非如此。

是的,如果你想为你的小企业创造一个标志,而你又不想雇用专业的标志设计师,你也许能够创造一个足够好的标志,在Midjourney中通过一些提示和迭代为你完成任务。但是,这只在你想做废品的时候有效。

如果你对标志的外观和感觉有具体的要求,那么你可能需要多次打磨你的提示,使其更接近你的想法,如果有的话。

这需要大量的人力监督和来回编辑,不能只用几个字就能完成。

输入质量的重要性

这是因为在我看来,使用生成性人工智能最重要的规则之一–输入质量决定了输出质量。下面的例子显示了我给ChatGPT的一个通用提示:

1oHxChkGVXoWj93X8nXyexQ
由ChatGPT生成 

其实很有趣的是,ChatGPT在想象力方面很疯狂,并尽力使事情具体化,但却输出了一封充满陈词滥调的邮件。这让我想起了我在reddit上看到的一个备忘录:

0HFNogYKRHk8b6xtD

这将是对人工智能作为我们的废话生成器和废话解码器的如此不力的使用。

而且我不怪ChatGPT,因为我给出的提示很糟糕,没有包含很多信息。我没有说明电子邮件的风格、长度、我和我的团队之间的关系、我所指的任何现有项目,等等。我的脑子里可能有这些背景和信息,但如果我不说出来,ChatGPT就永远不会知道。

这就是具有挑战性的部分–知道如何传达足够的背景信息,以便使用生成性人工智能真正节省我的时间,并提供我需要的输出。

语言的挑战

知道如何 “设计 “提示以帮助向人工智能模型精确传达我们的想法是很难的。我们自己的语言,如英语,在给出精确指令方面本来就很糟糕。这就是我们首先创造了具有严格语法的编程语言的原因之一,以便毫不含糊地、有效地将我们的想法传达给计算机。

“代码是我们设计的界面,能够为计算机编程。这是我们所需要的。它是客观的、明确的、毫不含糊的、(相对)静态的、内部一致的、稳健的。

英语具有这些属性中的无–它是主观的,意义往往是隐含的,而且是模糊的,它总是在变化,出现矛盾,而且其结构经不起分析。”

– 道森-埃利亚森 “英语是一种可怕的编程语言”

由于这个原因,即使是人类也会每天误解对方。我们可能需要多次解释我们的想法,来回反复几次,才能让另一个人完全掌握它。很多时候,我们还需要借助外部的人工制品,比如白板画,或者非常详细的文件来解释我们的整个思维过程,以实现这种一致性。

我们需要对人工智能做同样的事情。

通往你的终极合作者和副驾驶的道路

我们可以通过一些方法来设计和定位人工智能工具,以避免这些挑战。我们不应该给人们错误的希望,认为人工智能工具只是 “读懂你的思想”,而应该更多地把它说成是一个强大的合作者,或者像微软所说的,一个 “副驾驶”,可以帮助你完成工作。设计和建造人工智能工具的人也应该提供方法,帮助日常用户以精确而有效的方式与他们的 “副驾驶 “沟通。

以下是为生成性人工智能设计时需要记住的几件事。

1. 抽离提示工程

提示工程可以很有趣,它甚至已经成为一份可以让你每年赚取33.5万美元的工作。然而,我认为这些工作的存在只是为了让专业的提示工程师能够代表日常用户做艰苦的工作,他们不必为了人工智能而成为另一种语言的专家。

相反,我们可以让日常用户通过预设的问题/类别输入并描述他们正在寻找的东西。有了这些信息,系统就可以代表他们生成一个更精致的提示,以最大限度地提高模型产生良好结果的机会。

这对专注于狭窄领域的产品特别有帮助,在那里我们可以建立一套预设问题,对大多数场景都有帮助。

例如,HomeByte让用户生成待售房屋的重新设计的图片,以设想它在新的家具和风格下可能是什么样子。它允许用户使用既定的用户界面元素选择风格、房间类型和颜色主题,然后为生成式人工智能模型生成最终提示。它还将提示暴露给用户,因此高级用户可以自己对其进行微调。

1k559cxESLTBYYqqoYDNrvw
From HomeByte 

2. 提供脚手架和约束

这是对上述观点的延伸。提供约束条件是Don Norman提出的七个设计原则之一。这听起来可能有违直觉,但很多时候,限制用户的选择,而不是给他们一张白纸(在这种情况下,从头开始生成他们自己的提示)可能更有效。

故事人工智能就是一个很好的例子,它在为用户生成故事创意之前会要求用户提供一些输入。这包括故事的风格,主要人物的信息,它的背景,主要冲突,以及对故事的额外特殊要求。

1-RJBPfUh-CI6Eru_XsPkTg
From Story AI 

这些选项促使用户考虑其要求的不同方面,以确保输入足够强大,从而获得高质量的输出。

3. 利用现有的人工制品作为输入

提供详细、高质量输入的另一种方式是利用现有的人工制品作为输入,让生成性人工智能对其进行完善、样式化,或将其转换成不同的格式。

谷歌工作空间和微软办公室最近的公告视频都说明了这种情况。

例如,你可以在手机上写一个潦草的电子邮件草稿,不需要考虑格式问题,让Gmail为你正式处理它。

从几个要点来正式确定一封电子邮件 – 谷歌工作区的Gmail

或者把你昨天的原始会议记录,即捕捉到你的团队的所有想法,转换成Microsoft Word中的提案。

0t0bh1DAqsAYPQwnJ
根据会议记录起草一份提案–Microsoft Office 365中的Word 

在我看来,这是人类和人工智能之间的伟大伙伴关系,人类仍然负责内容。毕竟,生成型人工智能是一个推理引擎,而不是一个知识库。如果没有内容作为基础,它所能做的就是产生幻觉和编造。但如果由人类提供内容,即使是原始形式的内容,人工智能也能将其风格化,并使其变得更棒。

4. 数量大于质量

即使有限制条件和良好的输入,人工智能可能仍然很难在一次尝试中完全捕捉到用户的意图。因此,设计人工智能工具,使其提供几个选项,并让用户挑选他们最喜欢的选项来进一步打磨,可能是有帮助的。

0C6pt5TJweCOMv_uf
“一个没有想象力的世界 “由Midjourney生成

1BvPIl6wcmakSpC5-diS5CQ
由谷歌的巴德产生的多个草案

“数量大于质量 “也是头脑风暴时的原则之一。因此,生成性人工智能的一个很好的用途是提供选项来启发用户,而不是一蹴而就地创造最终的解决方案。把它看作是一个缪斯,而不是一个神谕。

这也是我们可以利用人工智能模型的所谓 “缺点”,并将其转化为优势的地方:我们可以接受人工智能模型引入的随机性,而不是期望无瑕疵地执行我们的想法,由于语言的限制,这可能是困难的。对人工智能模型的 “误解 “可能会导致偶然的发现,不完美的输出扩展了我们的视角,鼓励我们探索新的、未知的道路。

5. 允许用户控制和微调

即使有多种反应,AI的生成通常仍然是一个起点。最终,用户将需要控制和微调结果的能力(控制也是Jakob Nielsen提出的10个可用性启发式方法之一)。

在ChatGPT中,你可以要求它用新的约束条件重新生成响应。然而,由于生成模型的概率性质,以及语言的不精确性,这可能是一个挑战。

1ZZRZSiBsb3hLIn5HKdqyhg
ChatGPT创建 

在上面的例子中,ChatGPT可能没有理解我说的 “保留隐喻 “是什么意思(我也很含糊)。它在我的第二次提示后重新生成了整个东西,而我只是想改变一下措辞。

仅仅通过提示工程让模型一次又一次地再生是很难的,这可能会导致令人沮丧的经验,即用户在21次反复后最终放弃。

不过另一方面,我们可以设计工具,让用户自己编辑反应,或者轻松地选择其中的一部分,通过直接操作来隔离改变的需求,甚至在AI的帮助下进一步完善。

1zdrBVu1m0QLtzpEpzMyEDA
Notion允许用户在事后对生成的故事进行微调

这对生成的文本来说可能很容易,因为它们很容易被编辑。但Adobe Firefly的早期预览显示,它也可以隔离图像的一部分,以允许用户根据他们的需要对结果进行微调。

0V4EFASb9lXEsPr04
Adobe Firefly的早期预览

6. 从用户的习惯和偏好中学习

即使在我们与其他人类合作时,这些来回的编辑也很常见,尤其是在合作的早期阶段。随着时间的推移,我们会了解对方的工作风格、偏好,并更容易建立共同点。

一个精心设计的人工智能系统应该是类似的,通过隐性和显性的输入来了解用户的习惯和偏好。

目前的人工智能工具通常只允许用户对反应的质量提供反馈,目的是为了改善模型本身,而不是为用户进一步个性化的模型。

1vhTt7iUEk-mmf_-0qpZ8cA
巴德的用户反馈选项

从今天起,为每个用户创建个人模型可能是相当昂贵的,但在未来,我们可能会开始看到从过去与用户的互动中学习的模型,并随着时间的推移,学习用户的风格,并产生更多的个性化反应,以更少的尝试满足用户的需求。

总结

生成式人工智能很热,它背后的狂热可能会让人们对它能做什么产生不切实际的期望。然而,重要的是要记住:

  • 对于生成式人工智能,输入质量决定输出质量。在可能的情况下,为用户提供选择/约束,并代表他们生成高质量的提示。充分利用人类以原始形式产生的现有内容,并以人工智能的超级力量对其进行完善。
  • 语言是不精确的,而生成性人工智能模型是概率性的。在有疑问的时候,提供多个草案供用户建立–更多的选择甚至可能以偶然的方式启发他们。允许用户通过直接操作来编辑结果,以弥补语言的局限性。
  • 从长远来看,学习和适应用户的习惯,使合作更加无缝。

 

 翻译:云瑞设计

原文:Tony Jin

云瑞设计小程序
云瑞设计小程序

微信扫一扫
手机使用更方便!

云瑞设计订阅号
云瑞设计订阅号

关注我们的微信订阅号,不错过任何福利。