OpenAI的CEO都在談的 AI Agent,到底是什么?
作為AI應(yīng)用落地的方向之一,AI Agent這一概念受到了不少企業(yè)和從業(yè)人員的關(guān)注,那么,AI Agent究竟是什么?AI Agent又是如何開展工作的?不妨來看看本文的分析和解讀。
為什么要了解 AI Agent ,因?yàn)橥顿Y者當(dāng)前只關(guān)注 AI Agent公司,OpenAI 等 AI 前沿公司都在研究它。
AI Agent 是AI應(yīng)用落地的一個(gè)方向。
創(chuàng)業(yè)圈有個(gè)玩笑話,我有一個(gè)很牛的idea,但就差一個(gè)程序員了。未來,AI Agent 就是幫你實(shí)現(xiàn)idea的「程序員」。
讀完本文,你會(huì)理解 AI Agent 是什么,它是怎么工作的。
一、AI Agent 是什么
AI Agent是指人工智能代理(Artificial Intelligence Agent),是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。
舉個(gè)例子,AI Agent 就像是一個(gè)小愛同學(xué),住在你的手機(jī)或電腦里,有智慧和觀察能力。
當(dāng)你對(duì)它說:“小愛同學(xué),我有點(diǎn)不舒服?!?/p>
它會(huì)像魔法一樣,通過觀察你的狀態(tài)、體溫,還有最近 24 小時(shí)的行動(dòng)軌跡,并結(jié)合互聯(lián)網(wǎng)上的數(shù)據(jù)和信息,通過一系列眼花繚亂的分析,在 1s 鐘后得出結(jié)論,你「陽」了。
然后主動(dòng)給你生成請(qǐng)假條,你點(diǎn)點(diǎn)頭請(qǐng)假單就發(fā)給你 leader 了。
還貼心的告訴你,家里布洛芬和礦泉水已經(jīng)不夠了,已經(jīng)幫你選好商品,只要你一聲令下,30分鐘后會(huì)送到家門口。
它感知到,現(xiàn)在開車并不是一個(gè)好的想法,就順手把你回家的車也叫好了,10分鐘后就到樓下,趕緊撤吧。
這就是一系列的 Agent 協(xié)同工作的結(jié)果。
二、這么優(yōu)秀,它是怎么工作的
一圖告訴你 AI agent 是怎么工作的。這張圖描述了一個(gè)智能體如何處理、分析和響應(yīng)外部信息的流程。
有點(diǎn)不太明白,是吧,那我來拆解下。
AI Agent 分為 4 個(gè)部分:
1. 感知(Perception)
- 這是流程的第一步。AI 通過傳感器、攝像頭、麥克風(fēng)等,建立起對(duì)外部世界進(jìn)行感知。
- 輸入(Inputs):感知到的信息被輸入到系統(tǒng)中。在這個(gè)例子中,輸入是:“我有點(diǎn)不舒服”、我的體溫、精神狀態(tài)、睡眠時(shí)間等
- 外部環(huán)境(Environment):系統(tǒng)所在的環(huán)境或上下文。比如“我有點(diǎn)不舒服”這件事,會(huì)涉及到天氣、環(huán)境(比如是不是在有花粉過敏的場所)等。
2. 信息處理(Agent的大腦(Brain))
可以說是通用大模型+N多知識(shí)庫,用來處理信息。包含以下系統(tǒng):
1)信息存儲(chǔ)相關(guān)
記憶系統(tǒng):包括 Storage 和 Memory ,用來存儲(chǔ)長期和短期的數(shù)據(jù)。
比如長期數(shù)據(jù)是我這個(gè)人的基本信息、愛好、基礎(chǔ)疾病等;
短期數(shù)據(jù)比如我家的礦泉水只剩下1瓶了,購買之后這個(gè)記憶就可以刪除了。
知識(shí)庫(Knowledge):包括醫(yī)學(xué)知識(shí)庫、商品庫等,用來診斷我當(dāng)前的狀態(tài),以及后續(xù)治療、生活所需的管理。
2)大模型對(duì)信息進(jìn)行處理
基于感知的信息(input + Environment )、記憶、知識(shí)庫等信息,進(jìn)行加工處理,得出結(jié)論(Decision Making):“我生病了,而且是「陽」了這種情況”。
3)然后制定下一步計(jì)劃( Planning)。
Action/Reasoning 是基于其決策的具體動(dòng)作,但還沒有實(shí)行。
要幫我寫好請(qǐng)假條、幫我買藥、買水、叫車等。
3. 執(zhí)行(Action)
基于 Barin 一系列眼花繚亂的操作,得出了結(jié)論,制定了下一步計(jì)劃,那就需要執(zhí)行(Action)。
大模型本身不能完成這些任務(wù),需要調(diào)用外部的工具。
這時(shí)候就會(huì)用調(diào)用第三方的工具(Tools 和Calling API),通過接口或者應(yīng)用,與其他App進(jìn)行互動(dòng),達(dá)到最終效果。
4. 輸出(output)
執(zhí)行之后,需要一個(gè)出口,告訴你執(zhí)行結(jié)果。比如我的小愛同學(xué)。它告訴你:“你陽了,已經(jīng)幫你寫好請(qǐng)假條、叫好車.”
以上就是AI Agent的工作原理。
總的來說,這個(gè)系統(tǒng)描述的是一個(gè)簡化的模型,展示了是一個(gè) AI agent 如何從感知信息開始,經(jīng)過一系列內(nèi)部處理和決策,最終做出響應(yīng)的過程。
三、總結(jié)
AI Agent 是未來 AI 發(fā)展的方向之一(另外一個(gè)方向下篇寫)。
它可以是私人助手,也可以是你工作的幫手,他能放大你的能力。補(bǔ)齊你的短板,讓你成為超級(jí)個(gè)體。
本文由@產(chǎn)品淺談 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
那,AI發(fā)展的另一個(gè)方向是什么呢?
謝謝分享,例子生動(dòng)形象~好贊