生成式AI应用程序:更少的内容能传递更多的信息吗?
最近A16Z发表了一篇关于生成式AI的文章,谈论生成式AI的下一波趋势何在。A16Z是安德森·霍洛维茨风险投资公司(Andreessen Horowitz)的简称。它是一家著名的硅谷风险投资公司,由Marc Andreessen和Ben Horowitz创立于2009年。该公司投资了许多知名的科技公司,包括Facebook、Airbnb、Lyft和GitHub等。
在过去的几年里,我们看到大型语言模型(LLM)成为主流,并研究了B2B应用程序环境中的实现。尽管有一些巨大的技术进步,并且LLM在一般时代精神中存在,但我们相信我们仍然只是B2B用例的第一波生成AI应用程序。随着公司确定用例并寻求围绕其产品建立护城河,我们预计方法和目标将从当前的“第一波浪潮”转变为更集中的“第二波浪潮”。
迄今为止,生成式人工智能应用程序压倒性地关注信息的分歧。也就是说,他们根据一组指令创建新内容。在第二波浪潮中,我们相信我们将看到更多人工智能在信息融合方面的应用。 也就是说,他们将通过综合可用信息向我们展示更少的内容。我们将第二波浪潮称为合成AI(“SynthAI”),以与第一波浪潮形成对比。虽然第一波浪潮在应用层创造了一些价值,但我们相信第二波浪潮将带来阶跃功能的变化。
最终,B2B解决方案之间的战斗将不再关注令人眼花缭乱的AI功能,而更多地关注这些功能将如何帮助公司拥有(或重新定义)有价值的企业工作流程。
第一波浪潮:跨越从消费者到企业的桥梁
要分析第一波浪潮,首先区分 B2C 和 B2B 应用程序会很有帮助。当我们作为消费者使用生成式人工智能时,我们的目标是玩得开心,分享一些东西。在这个世界上,质量或正确性并不是重中之重:让 AI 模型生成您可以在 Discord 频道中分享的艺术或音乐很有趣,在您很快忘记它之前。我们也有一种心理倾向,相信更多的内容=高效率=好,所以我们被自动化创造所吸引。ChatGPT 的兴起就是一个很好的例子:我们容忍质量上的缺陷,因为有更长的东西可以分享更令人印象深刻。
当涉及到B2B应用程序时,目标是不同的。首先,对时间和质量进行成本效益评估。您要么希望能够在相同的时间内生成更好的质量,要么生成相同的质量但速度更快。这就是从B2C到B2B的初始转换失败的地方。
我们在质量至关重要的工作场所环境中使用 B2B 应用程序。然而,今天人工智能生成的内容在很大程度上是重复的和低风险的工作。例如,生成式 AI 非常适合为广告或产品描述撰写简短文案;我们已经看到许多B2B应用程序在这一领域表现出令人印象深刻的增长。但我们随后看到,生成式人工智能在撰写意见或论点方面不太可靠(即使人工智能生成的内容引人注目或自信,它通常也不准确),这在B2B环境中的创新和协作方面更有价值。一个模型可能会生成可用的SEO垃圾邮件,但一篇为软件开发人员宣布新产品的博客文章将需要相当多的人工改进,以确保它是准确的,并且消息将与目标受众产生共鸣。
另一个越来越常见的例子是编写境外销售电子邮件。生成式 AI 对于通用的电子邮件很有用,但对于准确的个性化不太可靠。从优秀的销售代表的角度来看,生成式人工智能可能有助于在更短的时间内写更多的电子邮件,但要写出提高回复率并最终导致预订会议的电子邮件,代表仍然需要做研究并判断他们的潜在客户想要听到什么。
从本质上讲,第一波浪潮在头脑风暴和起草阶段成功地进行了更具实质性的写作,但最终,需要的创造力和领域专业知识越多,就需要更多的人工改进。
中断工作流程的成本(或收益)是什么?
即使在生成式 AI 对较长的博客文章有用的情况下,提示也必须精确且具有规范性。也就是说,在人工智能以长形式表达它们之前,作者必须已经清楚地了解代表博客文章实质的概念。然后,为了获得可接受的最终结果,作者必须查看输出,迭代提示,并可能重写整个部分。
一个极端的例子是使用 ChatGPT 生成法律文档。虽然可以这样做,但提示需要熟悉法律的人提供所有必需的条款,然后 ChatGPT 可以使用这些条款生成较长格式文档的草稿。考虑从条款清单到结束文档的类比。人工智能无法执行主要各方之间的谈判过程,但是一旦确定了所有关键条款,生成人工智能就可以编写较长的结束文档的初稿。尽管如此,训练有素的律师仍需要审查和编辑输出,以使文档达到各方可以签署的最终状态。
这就是为什么成本效益评估在B2B背景下崩溃的原因。作为知识工作者,我们正在评估是否值得花时间在我们的工作流程中添加额外的人工智能步骤,或者我们是否应该自己做。 今天,对于第一波浪潮应用程序,答案通常是我们最好自己做。
第二波浪潮:融合信息以改进决策
随着我们进入下一波生成人工智能应用,我们希望看到重点从信息生成转向信息合成。在知识工作中,决策具有巨大的价值。员工根据不完善的信息做出决策,而不一定是执行或解释这些决策所产生的内容数量。在许多情况下,更长不是更好,只是更长。
许多公理都支持这一点:编写的代码行数不是工程生产力的良好衡量标准;较长的产品规格不一定能更清楚地说明需要构建的内容;较长的幻灯片并不总是提供更多见解。
Hex的首席执行官兼联合创始人Barry McCardel相信人机共生,并强调了LLM如何改善我们的工作方式:
“人工智能是为了增强和改善人类,而不是取代他们。在理解世界和做出决定时,您希望人类参与其中。人工智能可以做的是帮助我们把更多的脑电波应用到有价值的创造性工作中,这样我们不仅在一天中花更多的时间在重要的工作上,而且可以解放自己去做最好的工作。
人工智能如何改善人类决策? 我们认为LLM需要专注于综合和分析 - SynthAI - 提高决策的质量和/或速度),如果不是自己做出实际决策的话。这里最明显的应用是总结人类永远无法直接消化的大量信息。
SynthAI未来的真正价值将在于帮助人类更快地做出更好的决策。我们设想的几乎与 ChatGPT 用户界面相反:如果我们可以从大量数据中对总结它的简洁提示进行逆向工程,而不是基于简洁的提示编写长格式的响应会怎样? 我们认为有机会重新思考用户体验,使其尽可能有效地传达大量信息。例如,像Mem这样保存组织中每次会议的笔记的人工智能知识库可以主动建议相关决策、项目或人员,人们在开始新项目时应该参考这些决策、项目或人员,从而节省他们浏览先前机构知识的时间(甚至几天)。
回到我们的境外销售电子邮件示例,一种可能的表现是人工智能识别目标客户何时处于最高意向水平(基于新闻报道、财报电话会议、人才迁移等),并提醒相关销售代表。然后,人工智能模型将根据综合研究,建议在电子邮件中提及的一两个最重要的问题,以及与该目标帐户最相关的产品功能。具有讽刺意味的是,这些输入可以输入到第一波浪潮解决方案中,但价值来自合成阶段,并为销售代表节省了数小时的研究时间。
确保这种综合足够高质量的根本转变将从大规模通用模型转向利用多个模型的架构,包括在特定于领域和用例的数据集上训练的更精细的模型。例如,构建客户支持应用程序的公司可能主要使用以支持为中心的模型,该模型可以访问公司的历史支持票证,但在极端情况下会回退到 GPT。在某种程度上,微调的模型和数据集是专有的,这些组件有机会成为交付速度和质量的护城河。
实现合成人工智能
当我们思考第二波浪潮可能是什么样子时,我们认为从合成 AI 中受益最大的用例将是同时存在以下两种情况:
1.大量的信息,因此人类手动筛选所有信息是不切实际的。
2.高信噪比,使主题或见解明显且一致。以准确性的名义,您不想让AI模型解密细微差别。
这有助于我们思考第二波浪潮应用程序将提供的结果类型,以及它们与第一波浪潮结果有何不同。
在产品反馈用例上,Sprig 一直使用 AI 来分析开放文本响应和语音响应,并将它们总结为主题。Sprig创始人兼首席执行官Ryan Glasgow对LLM改进其合成解决方案的潜力感到兴奋:
“有了LLM,我们可以为客户节省比以前更多的时间。对于我们以前的模型,在客户看到主题之前,我们有一个人工审查流程;现在,我们可以轻松地立即呈现主题,然后进行审查过程。此外,我们现在能够为每个主题添加描述符以提供更具体的信息,从而使见解更具可操作性。在未来,我们认为有机会让用户提出后续问题,如果他们想进一步挖掘一个主题。归根结底,这是关于提供端到端的工作流程 - 从快速收集数据到快速理解数据 - 以帮助实时做出决策。“
人工智能如何改变我们工作方式的潜力是无穷无尽的,但我们仍处于早期阶段。B2B 应用程序中的生成式 AI 需要从创建更多内容演变为合成 AI,使我们能够更好、更快地完成工作。在 B2B 应用程序中,围绕谁可以拥有工作流程是一场持续的争战,而 AI 原生应用程序将使这种争战变得更加有趣。