狗狗币专家观点正在强烈冲击AI A...

正在强烈冲击AI Agent的“准Agent” GPTs,真的会杀死AI智能体吗?

-

原文来源:钛媒体

作者:王吉伟

图片来源:由无界 AI生成

  • OpenAI推出的GPTs是不是Agent?为何能让很多AI智能体项目半年白干?
  • 很多人说GPTs不是真正意义上的AI Agent,为何却被称作Agent杀手?
  • OpenAI宫斗100+小时期间数量超两万的GPTs,真会成为AI Agent杀手吗?
  • GPTs到底是什么?与AI Agent有什么区别?为什么说它会杀死AI Agent?
  • 为何“准Agent”GPTs对真AI Agent造成那么大冲击?真的会杀死AI智能体吗?
  • 说GPTs会杀死AI Agent有些危言耸听,Agent未来生态注定百花齐放

OpenAI的宫斗大戏已经告一段落,精彩剧情的余韵仍在久久回荡。

波澜起伏的剧情,精湛的演技,硅谷大佬的客串,100多个小时的演绎,缔造了这部足以载入史册的AGI成长大戏。剧中角色则被赋予更多传奇色彩,比如Sam Altman一度被视作当年被董事会罢免的乔布斯,而Ilya Sutskever也被贴上了“AGI卫道者”的标签。

这场宫斗的真正根源,到现在还在市里坊间被人猜测。其中最有可能的一个原因是,GPT已经发展成为能够威胁人类的AI,所以卫道者Ilya要出来干预,不惜使用各种手段阻止OpenAI带有重大危险因素的超高速成长。

Sam要通过商业手段推动OpenAI疾驰,Ilya则要确保AI在监管之下可控发展。

两人都是AGI的笃信者,发展理念却在OpenAI的第一个开发者大会之后产生了强烈冲突。Sam相当激进,Ilya过于谨慎,于是矛盾一触即发,而导火索可能恰恰就在于GPTs。

从Sam被开除开始,大家都在关注OpenAI宫斗这几天,GPTs仍旧以超高的速度发展,目前GPTs的数量已超过2万。超低的创建门槛和APP Store一样的商业模型,必会让OpenAI快速构建GPTs生态。

但另一方面,目前这些GPTs还存在不少问题。就以安全可言,99%的GPTs都在裸奔,几句话就能套取知识库文件。如果这些GPTs都在对人类存在潜在威胁的大语言模型之上运行,后果可想而知。

当然,这些仍然还是猜测,也不是本文讨论的重点。

事实上,GPTs推出后在创投领域引起更多不满的,是OpenAI为何既要做底层技术又要做上层应用。这直接杀死了相当数量的基于GPT的Agent相关项目,当然大量项目都是Sam所说的“简单模仿、套壳OpenAI”公司的项目。

不管这些项目是不是在套壳OpenAI,GPTs以及Assitant API的推出,确实对第三方Agent构建框架及工具造成了不小的冲击,就连Langchain、LlamaIndex等都已被看作一无是处了。

有意思的是,一些人并不认为GPTs算是真正的Agent,因为现在的大多数GPTs仅是实现特定功能的聊天机器人。这样的东西,又怎能取代或者杀死结构完整功能强大的独立Agent呢?

那么,GPTs 到底算不算Agent?GPTs的推出是否真的意味着开发者几个月来构建的Agent产品和开源项目都会死亡?GPTs是否真的有能力杀死所有AI Agent?

本文,王吉伟频道就跟大家聊聊这些。

从GPTs说起

OpenAI官方对GPTs的定义是,用户为特定目的创建的ChatGPT版本。

任何人都可以创建量身定制的GPTs,用于日常生活、特定任务、工作或家庭中获得更多便利以及提升效率,也可以制作仅供公司内部使用的GPTs,比如帮教孩子数学或者设计贴纸、学习棋盘游戏、搜索资源、数据分析等。

此外,用户还可以分享创建的GPTs,以让更多人使用它们提升各种场景的使用效率。想要详细了解GPTs,大家可以到OpenAI官方博客查看《Introducing GPTs》这篇博文。

要构建一个GPTs也非常简单,不用代码,只需与GPT Builder(OpenAI推出的GPTs创建器)进行对话,并为其提供说明和其他知识,再选择GPTs能够执行的搜索网络、制作图像、分析数据等操作,一个GPTs就创建完成了。

GPTs可以做很多事情,比如学习棋盘游戏的规则、帮孩子学习或者设计贴纸。还可以把GPT和外部服务连接起来,让它们访问更多的信息和功能。例如,通过连接翻译API,GPT就可以通过访问数据库获取实时数据进行分析,实现用多种语言交流。

为了让用户感受GPTs的魅力,OpenAI官方推出了16个GPTs,用户可以直接使用这些GPTs。在构建GPTs时,用户也可以选择是否使用DALL-E图片生成或者代码解释器。

这16个GPTs如下:

  • DALL·E GPT:让你的想象变成图像。
  • Data Analysis:放入任何文件,帮助分析和可视化您的数据。
  • ChatGPT Classic:最新版本的GPT-4,没有附加功能。”
  • Game Time:快速向任何年龄的玩家解释棋盘游戏或纸牌游戏。
  • The Negotiator:帮助你为自己辩护并获得更好的结果,成为一名出色的谈判者。
  • Creative Writing Coach:渴望阅读您的作品并为您提供反馈以提高您的技能。
  • Cosmic Dream:有远见的数字奇迹画家。
  • Tech Support Advisor:从设置打印机到对设备进行故障排除,逐步为您提供帮助。
  • Coloring Book Hero:把任何想法变成异想天开的图画书页。
  • Laundry Buddy:回答任何关于污渍、设置、分类和一切洗衣的事情。
  • Sous Chef:根据你喜欢的食物和拥有的食材给你食谱。
  • Sticker Whiz:把你最疯狂的梦想变成模切贴纸,直接送到你家门口。
  • Math Mentor:帮助父母帮助他们的孩子学习数学。
  • Hot Mods:把你的形象修改成真正狂野的东西。
  • Mocktail Mixologist:用你手头的任何食材制作无酒精鸡尾酒食谱,让任何派对都大放异彩。
  • genz 4 meme: 帮你理解行话和最新的表情包。

OpenAI推出这些不同的GPTs,不仅对外展示了GPT 模型的技术实力,也意味着个性化AI助手将成为我们日常生活中不可或缺的一部分,在未来满足我们独特的需求和兴趣。

从现在已经推出的各种GPTs来看,有的比如使用Zapier插件的GPTs已经能够处理稍微复杂一些的业务流程,但大部分GPTs仅是聊天机器人,还无法实现复杂任务的执行。

所以,GPTs 到底算不算Agent呢?

从Agent定义及架构看GPTs

OpenAI开发者大会以后,比尔•盖茨(Bill Gates)在其博客发表了一篇名为《AI is about to completely change how you use computers》的文章,并很快刷屏国内外。

在这篇文章中,他提到了Agent与机器人(如Clippy等)的区别,主要有以下三点:

  • 积极主动地根据用户需求提出解决方案;
  • 能够跨应用程序完成任务;
  • 随着时间的推移而改进。

按照这几点,现在除了部分能够参与企业业务流程的GPTs(如通过Zapier等插件以API调用CRM、HR等相关企业应用),大部分GPTS都是跟ChatGPT一样的对话机器人。

这一点也无可厚非,毕竟GPTs要做的就是为用户定制各自专属的ChatGPT,而更多人的需求可能就是通过对话生成一些内容。

但创建GPTs过程中Action的加入,让部分GPTs具备了执行能力,比一般机器人强大得多,足以连接部分现实世界。

我们还可以把GPTs带入现在业界公认最理想的由OpenAI提出的“LLM+规划+记忆+工具”四件套Agent框架。

可以发现,大部分GPTs在工具使用方面还未达到AI Agent的标准,因为它们仅在“knowledge”中上传了一个知识文档,仅是一个通过对话来获取文档相关知识的对话机器人,并没有涉及工具使用这个部分。

这类GPTs只能根据输入的指令进行思考并给予用户文字、图片等内容的反馈,而无法去执行某些目标比如操作一些软件去完成相关任务。

事实上,用于构建GPTs的GPT Builder正是一个标准的Agent。用户提交需求指令之后,GPT Builder会通过设定目标和任务分解,通过互动一步引导用户去完成GPTs的构建,就连logo都可以根据指令自动生成。

GPTs对外展示了Agent的相关功能,并证实了Agent连接真实世界的可行性。这些GPTs能够连接到其他产品和服务,从电子邮件到购物网站,使AI可以执行更广泛的任务。

OpenAI通过GPTs让更多人知道了什么是AI Agent,以至于有人将GPTs称之为下一波人工智能浪潮的先驱。

到现在为止,大多数GPTs缺乏用户所期望的自主程度,还达不到自主智能体(Autonomous Agent)的级别。其实就连Sam Altman也没有说GPTs就是真正意义上Agent,他在开发者大会上用了“Precursors”一词,用以表明GPTs属于Agent的“初期形态”。

所以在一些探讨GPTs与AI Agent的观点中我们可以发现,GPTs被看作是“几乎成为Agent”或者“准AI Agent”。

“几乎”与“就是”,还是存在一些差距的。

那GPTs与Agent尤其是自主Agent相比,有什么区别呢?

GPTs与AI Agent的区别

在大家所说的GPTs会杀死的Agent项目中,有些项目比如Baby AGI 、MetaGPT及Aiagent等在运行过程中,可以明显体现合格Agent应该具备的特性。换句话说,它们的表现要比GPTs强很多。

OpenAI开发者大会之后,LangChain曾在X发推文强调了其与GPTs的区别以及自身优势,并在11月10日推出了一个名为Opengpts的开源项目。

该项目通过整合LangServe和LangSmith,旨在为用户提供与OpenAI GPTs相似体验的平台。相对于OpenAI只能用GPT模型构建GPTs,在Opengpts用户可以通过选择不同的语言模型、自定义工具以及控制提示,实现对聊天机器人更灵活的控制。

从目前GPTs的表现与“独立”AI Agent所具备的功能来看,两者存在以下几点区别:

1、GPTs仍旧处于试用阶段。

虽然GPT Shunter(一个第三方GPT Store项目)收集的GPTS数量已经超过2.1万,但大部分GPTs产品形态仍旧比较初级。

目前GPTs所表现的属性更易于分享,但在功能上仍旧差强人意,属于个人娱乐及应用产品的试用阶段,并不适合大量企业去使用。

2、技术栈存在一定限制。

GPTs基于大语言模型GPT-4构建并与OpenAI的生态系统紧密关联,这也意味着开发者所能用的整体技术栈存在一定局限性。

GPT并不开源,所以构建GPTs在LLM的选择上只能基于GPT,而不能选择更多的LLM。同时当前版本在使用上也有一些限制,比如最多只能上传10个数据文件。

3、GPTs构建者技能水平不同。

“独立”AI Agent的构建者主要是开发人员,GPTs的构建者大多是不会代码的业务人员。目前大部分GPTs都是用简单指令提示来构建的,这让GPTs的数量快速暴涨,这也使得GPTs在专业程度上要差很多,更适合自娱自乐或者解决简单业务流程。

程序人员还可以用Assistant API构建功能更多更专业的GPTs,这些才有可能成为企业级Agent应用。

4、能处理的任务和GPTs的能力。

现在AI Agent正在成为各种类型的智能助理,可以用于订餐、买机票以及编程等相对复杂的业务流程。GPTs也有很多不同用途像私人教练、老师、咨询师等,但大多数仍然是聊天机器人。

它更像各种角色扮演类AI,人们可以自定义各种角色来娱乐或者处理简单事务,比如用来生成各种文本以及用DALL-E生成图像等。

当然,GPTs已能够参与部分企业运营的业务流程,比如使用Zapier GPT访问日历或者Slack等。但目前它还无法深入到企业运营中的比如SAP、用友、金蝶等的复杂流程中去。

主要在于,一方面很多企业管理软件缺少API,另一方面有些API授权费用太高,此外API也不是绝对稳定。

5、技术和安全挑战

目前的AI Agent经常被批评不可靠,因此还没有实现量级的企业级应用。GPTs也面临着同样的问题,会出现幻觉、在同一提示下提供不同的结果以及不能真正理解潜在过程,会产生随机结果。

除了大模型本身问题,目前GPTs更大的问题是数据安全,据说目前99%的GPTs都在裸奔,几句话就能套走GPTs的数据库。这些问题,会让企业在GPTs的选择上更加谨慎。

理论上,可以通过更高级的模型或围绕Agent构建产品以弥补可靠性的不足。比如实在智能推出的RPA Agent,就在数据安全上下了很大的功夫,在大语言模型和RPA工具包上都设置的多重安全机制,以保证用户更安全的使用AI智能体。

6、初级阶段的GPTs缺乏产品属性

到目前为止,GPTs缺乏具体的产品特性,或者说缺乏一种利用GPTs开展业务的方法。不具备产品级应用的试用性产品,在安全、应用、数据、扩展性及解决方案方面很难达到企业要求,不容易在企业推广。

此外GPTs仅供ChatGPT付费用户及企业用户使用,限制了更多人的使用,且没有定价策略或产品等级差异化的选项。或许这些,都要等到GPT Store的正式上线。眼下OpenAI宫斗大戏刚刚落幕,GPT Store何时上线还是个谜。

GPTs会不会杀死AI Agent?

尽管OpenAI推出的GPTs还不算成熟的AI Agent,或者说处于Agent早期阶段,但无疑它响应了一种趋势,即Agent将会无处不在。GPTs这种形态的大语言模型产品会让人人都能用上Agent,这是它的伟大之处。

接下来随着GPT Store的推出,GPTs将会成为现在APPs一样存在于每个人的手机、平板抑或其他形式(比如最近的风头正盛的AIpin)的通讯、娱乐及办公产品之上。

目前的GPTs还很原始,大部分都属于定制化的面向某个功能的比如心理咨询、产品说明、文字及图片生成等聊天机器人。

但从业务流程角度而言,很多企业的一些业务部门比如市场营销、客户支持、新媒体、HR、法务等,某些业务的大部分流程都是文字、语音交互和生成,应用GPTs足以完成大部分任务,在安全、合规的情况下这些部门将非常适用GPTs。

如果简单的GPTs就能胜任企业运营的多种业务场景,是不是就无需再去耗费精力与财力打造所谓的专业单体自主Agent?同时,SaaS化的GPTs开发是不是也比程序员以代码构建专业Agent更为便捷与高效?

目前GPTs还无法介入企业运营的复杂流程,但我们也看到了通过Zapier等插件实现了与电子邮件、旅游网站及支付软件等的集成,已经能够操作部分企业经营的业务流程。

关于企业内部应用GPTs,是另一个需要探索的话题,王吉伟频道在这里跟大家简单聊聊。

现在已经有一些企业在内部进行GPTs的构建与分享,以定制面向不同业务场景的ChatGPT。比如Amgen、Bain 和 Square等企业,已经先一步开始应用自己的专属GPTs。但这些企业GPTs是用在内容生成与理解还是深度的业务运营,目前尚不可知。

通过API调用的各种插件及应用,在OpenAI的Agent架构中都属于工具应用。这些工具可以是简单的邮件列表读取,也可以是复杂的CRM、OA、工作流等流程编排与管理。

OpenAI还没有更重量级的工具,但其投资的一家RPA公司Induced AI,“RPA 3.0”形态的产品正是基于GPT的智能体。

大胆猜测一下,这个产品在以后很有可能会以插件或其他形式成为OpenAI Agent架构中诸多工具中的一员,未来或将弥补GPTs在业务流程执行层面无法操作非API工具的不足。

如果Induced AI能够做这些,其他RPA厂商也能做到。随着更多RPA厂商推出相应插件,用GPTs操作更多组织运营中复杂流程也就不再是梦。尤其是现在借助Assitant API将原有产品改造升级成为基于GPT的Agent,前所未有的简单。

王吉伟频道认为,理论上配合API和RPA,GPTs能够通达到组织运营各处。就看企业如何衡量它的运行功效,以及在安全方面是否能够经得住考验。

鉴于以上几点,GPTs真有可能成为Agent杀手,至少它已经让很多基于GPT-4的第三方Agent的道路不好走了。

好在,LLM厂商并非只有OpenAI一家。

AI Agent生态不只有OpenAI

今天我们所说的Agent,都是基于LLM的Agent,它离不开LLM的支撑。

对于AI Agent的未来生态,比尔盖茨认为不会是一家公司主导AI智能体业务的局面,而是会出现许多不同的人工智能引擎可用。

更多的竞争将会让包括GPTs在内的智能体变得非常便宜,有利于更多人使用AI智能体。

现在全球有那么多大语言模型,单是国内就有200多个。既然OpenAI能够造就GPTs,自然其他LLM厂商也能推出同类产品,或者会与第三方平台合作推出类似产品。

因此GPTs不会只诞生在OpenAI,像谷歌、Meta等科技巨头必然更希望其客户基于自有大模型开发类GPTs产品及更完善的Agent产品。

就在OpenAI宫斗这几天,亚马逊、Meta等厂商已经收到更多的AI相关业务咨询;OpenAI竞争对手Cohere的咨询量也是大幅增加;Writer的企业客户对其服务的兴趣已经增加了两倍;Habib则一直在宣传其AI系统在某些场景下比GPT-3.5模型更好。

这次宫斗事件确实为AI技术采买带来不小的影响,用AI21联合创始人Yoav Shoham的观点表达就是,OpenAI发生的事情让更多企业确信,无论如何都不想把所有鸡蛋放在一个篮子里。

至于国内市场,不只是无法应用GPT等海外大模型,还会因为信创等衍生出更加多元化的需求,也将会有更具特点的类GPTs产品出现。

此外仅有GPT一个大语言模型,也无法满足用户对于GPTs的广泛需求。未来许多GPTs可能都需要在OpenAI之外开发更多特性和功能,开发人员会围绕GPTs构建更复杂的产品。

从这一点而言,以后LLM厂商及Agent厂商们可能会倾尽所能适配更多大语言模型,甚至不排除OpenAI也会将第三方LLM加入产品体系的可能,以支持用户对于多类型与功能GPTs的构建。

事实上,AI Agent想要真正在B端实现量级业务场景的落地及更好地商用,需要综合考量其本身的安全性、技术发展周期是否成熟以及To B端的场景是否密切贴合,还需要考虑接口成本、隐私、管理、授权等诸多因素。

这既是很多供应商的技术与产品门槛,也是广大企业选型的重要依据。

企业在选择用于业务流程自动化的AI智能体时,也会优先考虑技术供应商厂商推出的AI智能体产品,而不是选择LLM厂商推出的尚未成熟的通过API连接各种插件的单一智能体解决方案。

这些,都是眼下GPTs这种单一智能体所无法具备的。至于GPTs什么时候能够发展成为成熟智能体产品,就要看OpenAI如何在企业用户端下功夫了。

在王吉伟频道看来,GPTs确实扼杀了一些Agent相关的初创公司,但大多是Sam Altman所说的“套壳与模仿GPT”的项目。对于AI Agent而言,GPTs目前远未表现出杀手级实力,并且它也杀不死那些为专有功能而构建的复杂类型Agent。

GPTs的出现反而启发了更多企业的创新,会让Agent产品在短期内海量爆发,用最快的速度构建与完善AI Agent生态。

或许,以GPTs范式引领Agent繁荣生态,早日实现AGI,才是OpenAI最想做的。

LEAVE A REPLY

Please enter your comment!
Please enter your name here

热门新闻

狗狗币市值短暂超过西南航空公司

据u.today消息,狗狗币(DOGE)的市值在本周飙升了300%之后,短暂地超过了全球最大的低成本航空公司西南航空的市...

彭博社:预测比特币今年将上涨至40万美元

比特币的涨幅与2013年的约55倍和2017年的约15倍相似。

知名投行摩根士丹利为何选择新增比特币敞口?

12只摩根士丹利的投资基金将在比特币金融产品中配置资金以获得风险敞口

一文读懂元宇宙、NFT 和 GameFi 的关系

GameFi 改变了现实传统游戏中多方各自为阵的割裂模式
spot_img