最新的AI代理工具預計2025於年進入主流市場。AI代理可以獨立操作電腦執行任務,不需要人類插手,但如果遭到濫用,很可能淪為網路詐騙的工具。
您的閱讀篇數已達上限
立刻訂閱全閱讀,即可享全站不限篇數閱讀
繼生成式AI之後,AI代理(AI agent)成為新的科技熱潮,引發企業與投資者的關注。如今我們正進入Salesforce執行長貝尼奧夫(Marc Benioff)所說的第三波AI革命。
所謂的AI代理,指的是能夠感知周圍環境、做出決策,最終完成工作、達成特定目標的AI程式,而且過程中幾乎不需要人為干預。
AI代理最重要的特點就是自主性與任務執行,生成式AI與大型語言模型(LLM)的主要功能是生成內容,而且過程中仍需要人類一步步提示。
如今,包括Google、蘋果、微軟、Meta、Salesforce等科技公司,紛紛投入開發AI代理,希望能搶得先機。
前不久OpenAI宣布,將於2025年1月推出代號為Operator的AI代理,這個工具將可成為使用者的智慧助理,代替使用者執行許多任務,例如寫程式、預訂旅行住宿與交通等等。
此外,它還可以根據使用者的喜好與行為模式調整,例如在預訂機票時,會考慮使用者過去常選擇的航空公司以及偏好的出發時間。
OpenAI的產品長魏爾(Kevin Weil)預言,「2025年將會是代理系統進入主流市場的一年。」
像人類一樣操作電腦
根據全球市調公司Markets & Markets預估,AI代理市場的規模將會從2024年的50億美元,成長到2030年的470億美元,年均複合成長率為44.8%。
另外,顧問公司Gartner指出,未來5年內,超過3成的企業軟體應用程式將包含AI代理功能,代替人類完成約15%的決策行為。
2024年10月底,OpenAI最強大的競爭對手之一Anthropic宣布,在最新升級的大型語言模型Claude 3.5 Sonnet,新增一個名為「電腦操作」(Computer Use)的AI代理工具。有了這個工具,Claude就能直接操作電腦,例如閱讀螢幕上的資訊、移動游標、輸入文字、點擊按鈕等。
「這將會是第一個能夠像人類一樣使用電腦的模型,」Anthropic首席科學家、約翰霍普金斯大學副教授凱普蘭(Jared Kaplan)表示,「我認為我們即將進入一個新時代,未來AI可以操作人類使用的所有工具,自動完成任務。」
這個AI代理工具究竟如何運作?Anthropic示範了三種不同的應用場景。
假使你現在需要填寫供應商申請表,但是填寫表格需要的資料分散在電腦裡不同文件檔案或是不同的線上系統。這時候你只需要下指令,接下來AI代理就會從你指定的電腦檔案或資料庫中進行搜尋,比對表格欄位,抓取相關的資料並逐一填寫,最後確認所有資料填寫在正確的欄位。
如果你想要帶朋友徒步旅行,欣賞舊金山金門大橋的日出美景,你可以要求AI代理幫忙規劃行程。
首先AI代理會在Google上搜尋相關資訊,點擊部落格文章,最終確定斯賓塞炮台是觀看日出的最佳地點。
接下來AI代理會打開地圖應用程式,確認從使用者所在位置抵達斯賓塞炮台,大約需要20分鐘車程。然後透過Google查詢日出時間,並開啟日曆應用程式,建立活動、發送邀請,同時提醒使用者出發時間、當日天氣狀況。
如果你要架設網站,AI代理也能迅速幫你完成任務。AI代理在收到指令後,會自行打開瀏覽器,進入Claude頁面,輸入使用者給予的指令,然後生成網頁程式。接下來AI代理會開啟微軟開發的程式碼編輯器Visual Studio Code,開始進行編輯。
最後,AI代理會開啟文字終端機(text terminal),測試新網站。如果使用者要求修改網頁的某個問題,AI代理會重新回到編輯器,找出有問題的程式碼進行修正。
優點:下好指令自動完成任務
Anthropic產品長克里格(Mike Krieger)表示,他們希望未來AI代理能夠自動執行日常的辦公室任務,提高工作效率,省下更多時間。「如果你不需要浪費時間不斷地複製、貼上或是進行其他重複性工作,你會想要做什麼?如果是我,會花更多時間玩吉他,」克里格笑說。
當然,這個AI代理工具並不完美。Anthropic表示,雖然AI代理可以執行許多任務,但是某些人類可以輕鬆完成的動作,例如滾動、拖曳和縮放,AI代理不一定能順利執行。
目前這個AI代理工具仍處於測試階段,加入測試的客戶包括:Canva、Asana(線上專案管理平台)與Replit(線上程式開發服務平台)。
賓州大學華頓商學院的教授莫利克(Ethan Mollick)也是初期試用者之一。
為了測試AI代理的能力,他要求A I代理為高中生設計《大亨小傳》教案,將整本書分拆成利於閱讀的區塊,並設計符合「共同核心學習標準」(Common Core Learning Standards)的作業,另外他還要求AI代理把教案與作業清單整合在同一份試算表裡。
後來他在自己的部落格「一件有用的事」(One Useful Thing)分享了使用心得,並點出了AI代理與聊天機器人的差異。
「我指派了一項複雜的任務給它之後,就離開電腦,過了一段時間再回來查看它完成的結果,」莫利克說,「如果是使用聊天機器人,我必須一步步引導它,和它一起完成教案。但是AI代理不一樣,只要下好指令,它就會自行完成任務。」
首先AI代理會從網路上下載整本小說的內容,接著利用Google搜尋其他教案,然後打開試算表,設計初步的教案。下一步是查詢共同核心學習標準,然後調整教案設計。
「最後的結果並不差,」莫利克寫道,「我檢查過,並沒有發現太明顯的錯誤。」
缺點:缺乏深刻洞察力
不過整體而言,這個AI代理的能力仍相當有限。例如,莫利克要求AI代理幫忙在亞馬遜購物,結果卻令人失望,AI代理只進行了簡單的產品研究,完全不符合莫利克的個人喜好。
如果讓AI代理研究股票,雖然它能夠快速彙整各項數據、製作表格,並提供投資建議,但是只能停留在本益比等非常表面的資料。
「AI代理確實能夠提供幫助,而且比許多人類實習生做得還要好,例如進行跨網站搜尋,使用特定軟體進行分析與製作報告等工作,」莫利克表示,「但是,現有AI代理工具的最大缺點是,缺乏深刻的洞察力。」
此外,AI代理也會犯錯。聊天機器人在對話時產生幻覺是一回事,但是AI代理代表個人在網路上執行任務時犯錯,又是另一回事,有可能會導致更嚴重的後果。例如:萬一AI代理遭到濫用,很可能淪為垃圾郵件、假新聞、網路詐騙的工具。
卡普蘭表示,Anthropic已經進行多次壓力測試,希望找出漏洞,並設定某些防護措施。例如:開發人員可以限制AI代理何時可以存取使用者的電腦資料,還可以在流程的各個步驟加入人工監督。
「無論如何,目前AI代理還不是完全可靠的,」卡普蘭強調,「我們希望與開發人員持續進行測試,了解可能的風險,以便做好準備,針對任何有可能遭到濫用的情境,加強AI代理的安全訓練。」
【AI代理的優勢與劣勢】
- 自主執行任務:AI代理與生成式AI最大的差異是,前者在接到指令後可自主執行任務,過程中幾乎不需要人為干預。
- 缺乏深刻洞察力:這是目前AI代理的缺點,因此在執行購物或投資決策等任務時,結果不盡理想,無法真正滿足使用者需求。
- AI代理的濫用隱憂:如果缺乏適當的安全預防機制,AI代理很可能會淪為垃圾郵件、假新聞、網路詐騙的工具。
(責任編輯:張蕙蘭)