在2023年,生成式人工智能成为最热门的话题。以ChatGPT为例,该平台拥有超1.8亿的订阅用户和近亿的周活跃用户。无论是媒体还是公众,都在广泛讨论生成式人工智能。尽管我对此感到好奇,但我不确定应该提出哪些问题,也不清楚它将如何应用到我的工作或公司中。经过一番尝试,我发现结果并没有达到我的预期,这让我意识到人工智能仍需长时间的发展。
本文将探讨人工智能代理如何改变商业世界,及其对我们个人工作和未来的影响,重点讨论大规模语言模型(LLM),如OpenA I的GPT-4。
(为便于理解,本文中将交替使用人工智能、人工智能代理、生成式人工智能和LLM等术语,从技术上讲,它们的含义略有不同,我只是以一种更易于书写和理解的方式来使用。)
生成式人工智能如何影响知识型工作者?
最近的研究发现,自ChatGPT和Midjourney推出以来,主要在线自由职业平台上的文案和平面设计师的工作量和收入都显著下降。这说明生成式人工智能产品正在与人类创作的作品竞争,直接影响到他们的工作。
OpenAI估计,人工智能新进展对高薪工作岗位的威胁最大,高薪工人面临的风险是低薪工人的三倍。这表明人工智能不仅会影响简单重复的工作,也会影响那些需要专业知识的工作。
ChatGPT的出现促使许多企业董事会开始讨论人工智能战略。随着生成式人工智能解决方案证明其价值,并被更广泛地应用于业务流程中,预计其应用范围将进一步扩大。
我们需要认识到,人工智能正在改变工作的方式,而不仅仅是替代工作。通过自动化重复性任务,人工智能可以帮助员工将更多时间用于战略性和创造性工作,从而提高生产力和效率,推动业务增长并创造新的就业机会。人工智能技术已经从根本上改变了商业格局,重塑了各行各业的劳动力结构和工作岗位。
生成式人工智能真的有助于提高生产力吗?如何做到?
以Github Copilot为例,这是一款领先的人工智能解决方案,它帮助软件开发人员提高代码编写的清晰度和速度,据报告,使用Copilot的开发人员在这些方面的表现提高了70%以上。人工智能辅助对新手开发人员尤其有用,帮助他们更快地学习和提高编码技能。这说明人工智能不仅能提高生产力和质量,还可以作为学习工具。
一项针对微软人工智能解决方案 Copilot 用户的研究发现:1) 用户在执行任务时平均提速27%。 2) 在独立专家小组的评估中,使用Copilot撰写的电子邮件在清晰度方面提高了18%,在简洁性方面提高了19%。3) 使用人工智能的用户在收集和组织信息方面也快了27%。
哈佛商学院最近研究了GPT-4对波士顿咨询公司(BCG)员工的工作效率和质量的影响,发现使用GPT-4的BCG顾问在完成一系列咨询任务时,工作效率高于没有使用这一工具的同行,具体数字为:工作速度快25%,处理工作量多12%,工作质量高40%。
这项研究还发现,在使用人工智能工具后,绩效排名后50%的用户表现提高了43%,而排名靠前的用户提高了17%。这意味着所有员工,无论技能水平如何,都能从人工智能的使用中获益,尤其是之前表现较差的员工。这些结果表明,人工智能可以缩小人们在执行任务能力上的差距,提高组织中每个人的整体工作质量。
研究还描述了两类与人工智能合作的人。第一组被称为"半机械人",他们与人工智能密切合作,不断生成、审查和完善答案;而第二组被称为"半人马",他们分工合作,专注于自己的专业领域,让人工智能承担更多从属任务。
最终研究发现,在所有工作领域,人工智能的作用和效率并不相同。对于一些需要深入理解问题或在解决问题时需要更细致判断的任务,人工智能并没有带来上述改进。这表明,尽管人工智能在许多领域有可能提高生产率和质量,但它无法完全取代人类的深度认知能力和专业知识。
那么,为什么我们还没有到那一步呢?
许多研究和文章已讨论了一个改变后的世界。那么,为什么我还没有开始使用人工智能?为什么我周围的人似乎也没有使用人工智能?问题何在?
当我与不同的人谈论在工作中使用人工智能时,我发现人们对人工智能的理解和使用能力存在巨大差异。人们对生成式人工智能的作用、能力和局限性有不同的看法,对如何使用它以及如何委托它完成任务也有不同的想法。这导致人们在使用人工智能的能力上存在巨大差距。如果这种情况继续下去,人与人之间的产出差距只会继续扩大。
许多人仍将GPT等LLM视为简单的搜索引擎或知识数据库。因此,当LLM不掌握最新事件信息或无法提供特定专业知识的准确答案时,就很容易低估LLM的力量。
事实上,我们应该将GPT等LLM模型视为推理引擎。推理是对观察到的信息或收集到的数据进行分析,从而发现规律或模式,对未来事件做出预测,或得出结论以加深理解的脑力劳动。这一过程对于建立信息之间的联系、提出复杂问题的解决方案以及产生新的想法至关重要。在知识型社会中,这些推理技能是科学家、工程师、医生、律师、商业分析师等各类专业人员日常工作的关键。研究表明,在许多领域,GPT-4的推理和决策技能已经超过了普通人。LLM可以在创造、创新、分析、说服力等方面发挥重要作用。
然而,仅有大型语言模型(LLM)是不够的。
为什么每当使用LLM,都给出不尽如人意的答案?这是因为缺乏良好的短期和长期记忆,也没有适当的参考资料或指南。LLM的语境背景有限,这意味着它们只能关注简短的信息和时刻。如果试图一次性处理过多信息,就无法正确处理,也就失去了整体理解能力。如果没有适当的指导,LLM就会随意发挥,忘记重要事实,记错内容。
但LLM的潜在能力在于,它们可以利用自身的推理能力利用各种工具和知识库。这使得LLM能够做出更好、更明智的决策和行动。当然,要让 LLM 为您服务,选择正确的数据源和工具至关重要。LLM不仅仅是一个搜索引擎,还是一个推理引擎。
如何让人工智能更好地完成工作?
我们给人工智能下达的指令称为提示。然而,根据你提供的提示,得到的结果可能大相径庭。
让我们换个角度思考。回想一下你刚开始参加工作时,作为一名初级员工或实习生,你可能会遇到很多不同的管理者。好的管理者会清晰地定义任务目的,了解你的技能和经验,给出执行任务的建议,并提前告知你可能会犯的错误。他们还会明确表达对具体交付成果的期望。在这种情况下,有才能的下属更容易理解工作目的并尽力完成所要求的结果。相比之下,糟糕的管理者对任务含糊不清,对你的了解不足,抽象地要求交付成果。这样的工作指示很难产生好的结果。事实上,与人工智能合作也很相似。显然,好的管理者在这里可以写出更精确的提示,得到更好的结果。当然,如果你有一个即使你在胡言乱语时依然能听懂你的下属或人工智能,那当然更理想,但我们还没有达到那个阶段。
1)了解人工智能作为推理引擎的角色并了解其能力和局限性的人,能够设计出更复杂的提示。2)知道自己需要输入什么以及想从中得到什么的人,能写出更好的提示。3)拥有与不同团队合作经验的人往往能更有效地使用人工智能和聊天机器人平台。他们更擅长引导人工智能提供更准确、更有用的回答。4)安排工作的能力对设计提示也有重要影响。具有结构化思维的人能够清晰地设定目标、设计行动计划,并有效地将所需信息传达给人工智能。在解决复杂问题时,这可以让你分解问题的每个部分,并相应地设计提示,从而最大限度地发挥人工智能的能力。
用户可以根据上下文理解人工智能的回答,并在必要时询问更多信息或跟进更具体的问题。这种方法(类似于前文提到的“半机械人”类型)对于从与人工智能的互动中获得更好的结果至关重要。在分析人工智能提供的数据、制定策略和做出决策时,你可以利用人工智能的优势。这样,你就能充分利用人工智能的反应,更高效、更有效地完成工作。事实上,这种能力不仅对人工智能支持的工作至关重要,对于同事间的协作也极为重要。
非英语国家面临的英语语言挑战
大多数LLM的开发都在英语世界进行。英语是国际交流和学术研究中使用最广泛的语言,获取英语数据的机会也远高于其他语言。因此,英语培训数据集也更容易构建。所以,LLM处理英语的能力优于其他语言。现代LLM(如GPT-4)一直在使用非英语语言的训练数据,改进其多语言学习方法,并专门针对特定语言进行训练,以提高其处理不同语言的能力。然而,尽管做出了这些努力,在使用LLMs时,英语与其他语言之间仍然存在性能差距。
以GPT-4为例,英语和其他语言在提示时的表现差距相当大。即使是关于相同内容的问题,使用的语言不同,结果的准确性也不同。GPT-4对英语问题的准确率为85.5%,但对韩语问题的准确率为77%,相差11%。乍看之下,这一差异似乎并不显著。
然而,当需要进行更复杂的推理时,不同语言之间的差异就会变得更加明显。例如,如果需要三个独立的推理才能做出一个复杂的推理,那么做出每个推理的正确概率都是通过乘以连续事件的概率来计算的。在英语中,正确做出所有三个推理的概率大致为 (0.855)^3,即约 0.624。在韩语中,概率为 (0.77)^3,约 0.456。这意味着,韩语中三个独立推理全部正确的概率比英语低 37%。关于中文的准确度问题,目前没有官方的数据公布,但可以推测与英文差距比较大。
当然,这种计算方法只适用于所有推论都完全独立的情况。在现实中,推断间可能存在关联,差异可能不如预期那般显著。然而,通过这些计算,我们能大致了解不同语言输出间的差异性。显然,通过改善提示和使用方式,可以在一定程度上弥补这些差异。无论使用何种语言,都能通过明确指导人工智能的思考过程,逐步引导其思考,或者将问题分解为逻辑步骤并在最后进行审查来提升性能。当然,这还需要大量实验和改进工作。至少目前看来,英语水平与使用人工智能的效能有直接关联。如果你一直使用中文提示,不妨尝试英语,可能会得到截然不同的结果。在人工智能时代,英语是否重要?答案可能是肯定的。
数据安全问题
ChatGPT物有所值。有免费版本可用,而专业版允许继续使用GPT-4,虽然有些时间限制。对于相同数量的任务,直接连接到 API 会产生更高的成本。为什么ChatGPT可以免费?为何价格更低?借用业界流行说法:“如果你没有为产品支付费用,那你就是产品。”这暗示如果你不为产品支付费用,你的数据就是产品。
LLM公司明确表示,他们会收集基于网络产品(如ChatGPT和BARD)的用户对话数据,并用这些数据来训练模型。这些平台依赖用户对话数据来缓解数据匮乏,并收集不同的使用案例来改善模型。如果你在ChatGPT中输入敏感信息,这些信息可能会被储存并在训练过程中以任何方式使用,这意味着敏感信息有泄露风险。实际上,最近有报道称,ChatGPT在输出中包含了训练课程中使用的电子邮件地址,从而暴露了这些信息。
这可能是因为某人的电子邮件用于训练,而输出恰好包含了这些信息。也就是说,你输入ChatGPT的内容也可能被用作训练数据,出现在别人的输出中,如上图所示。
另外,你还可以在内部环境中部署开源LLM,这样你就可以在自己的服务器上管理所有数据。但是,安装和维护这样一个系统的成本可能比想象中要高。与商业模式相比,开源LLM的性能还有不小差距。尽管基准测试显示开源LLM的性能近年来有所提升,但在实际使用中,你可能会发现其性能低于基准测试结果。在使用非英语提示和接收结果时,这种差距更为显著,短期内可能难以缩小。
下一个选项是将GPT作为API使用。OpenAI、微软Azure、谷歌和Anthropic均将LLM作为API提供,并规定数据不得用于训练目的。通过API仅发送必要数据,无需共享完整上下文。这种方式并非完全安全,但值得注意的是,许多组织在AWS和GCP等云服务刚推出时也有过类似顾虑。最终,性能、成本和整体实用性超过了最初的担忧。如果你已经在使用AWS、GCP、Slack、Notion、Google Docs等服务,那么使用LLM API的额外担忧可能就不必要了。
总之,目前使用LLM最有效、便捷的方式是通过GPT、Claude或Gemini的API开发自己的解决方案,或使用间接使用LLM API的服务,如Kompas AI。如果选择自行开发,需准备应对一系列技术挑战,包括使用检索增强生成(RAG)、系统提示、内存和工具。为充分利用LLM,需要进行大量微调(需要大量人力),而这些知识并非普遍熟知,需要大量专业知识(通过大量试验和错误获得的经验)。
LLM在工作中的应用
多项研究显示,LLM在以下领域表现出色:1)创造和创新;2)分析、说服力和管理;3)对工作提供一线反馈;4)帮助决策和提供另一意见。例如,作家或设计师可利用LLM生成多个文本或设计概念版本,然后挑选或完善最合适的版本。业务分析师和数据科学家也可使用LLM从数据中提取见解并进一步分析,从而更快做出更好的决策。
正如上文所述,LLM是推理引擎而非搜索引擎。通过确保您的提示反映了你的明确目标、你希望如何进行以及预期输出,并通过连接正确的知识和工具,你可以执行复杂多样的任务,并获得可立即用于工作的高质量结果。以下是几个使用案例。
1) 快速撰写简单的英文电子邮件
2) 进行市场和竞争分析
3) 进行战略分析。
除了上述的任务之外,AI代理还:
- 为企业决策过程提供有价值的洞察。
- 协助进行复杂的研究。
- 处理并分析复杂的数据。
- 提出创新的计划和策略。
- 支持编码和调试。
- 通过UX写作协助,增强用户体验。
- 自动筛选众多的简历。
- 编写和分发OKRs和KPIs。
- 分析来自各种文件的数据,编制报告。
- 组织复杂的思考,并协助设定优先级。
这些大多数功能并非在ChatGPT中开箱即用。首先,需要自行编写提示;其次,执行复杂任务时,ChatGPT可能会拒绝或超时崩溃。
运行复杂的人工智能代理需要无限运行资源和能处理多次迭代的基础设施,此外,还必须克服传统代码解释器的 60 秒执行限制。至于搜索引擎,谷歌的搜索结果通常优于必应(在非英语搜索中,Bing的搜索结果几乎是灾难性的)。要实现这些功能,你需要开发自己的LLM运行架构,建立自己的人工智能代理,或使用像Kompas AI这样的服务。上述结果都是通过 Kompas AI 使用基于 GPT 和 Claude 的人工智能代理生成的。
我一直提到 Kompas AI,因为我是Kompas AI 的开发者。 简单介绍一下产品:
- Kompas AI是一个多用途人工智能代理,它支持用户轻松快速获得出色结果
- 提供的代理能解决更复杂问题,基于google集成、高迭代次数、对各种LLM模型的支持以及具有强大的高级代码解释器。
- 支持多语种,提供团队功能,让你可以创建自定义人工智能代理并在团队内共享。
- 最重要的是,Kompas AI在数据管理和隐私方面有严格政策,确保不使用训练数据,用户可以完全控制自己的数据。
如果感兴趣,可登陆https://kompas.ai注册免费试用。
如果你还未使用人工智能
根据Salesforce的报告,28%受访者表示已在工作中使用人工智能,其中超过一半(51%)希望人工智能技能提高工作满意度,44%希望因此获得更高薪酬。
同时,许多组织尚未提供明确指导,决定是否及如何应用人工智能于工作场所。在使用ChatGPT的人群中,55%未经公司正式许可情况下使用人工智能服务。企业领导者似乎仍将人工智能视为遥远且未完成的一项未来技术。2023年是人工智能大发展之年,预计2024年将迎来更大变革。即便如此,我们现在也需要了解人工智能工具的能力与局限,并制定适当的使用政策。我们需要确保员工能够利用新技术提高工作效率,并保障数据安全。
最后,引用世界经济论坛经济学家理查德-鲍德温(Richard Baldwin)的话:“人工智能不会抢走你的工作,但使用人工智能的人会”,我想补充一点,“人工智能不会毁掉你的公司,但有效使用人工智能的公司会。”
现在认为为时已晚,仍为时尚早。与我们即将见证的整体变革相比,我们仍处于变革的初期阶段。
由于本人经验和知识有限,本文内容可能存在不准确或遗漏的地方。 请指出,以便我改进。