本報(bào)記者謝嵐 見習(xí)記者梁傲男
人類與機(jī)器的互動(dòng)方式正在發(fā)生范式轉(zhuǎn)變。昔日僅具備對(duì)話功能的Chatbot(聊天機(jī)器人),如今已逐步演化為具備“手、腦、眼”全方位能力的自主Agent(智能體)。
在11月29日舉辦的智譜Agent開放日中,智譜揭曉了在Agent方面的多項(xiàng)新突破。其中,自主任務(wù)完成智能體AutoGLM可以自主執(zhí)行超過50步的長(zhǎng)步驟操作,也可以跨App執(zhí)行任務(wù);AutoGLM開啟“全自動(dòng)”上網(wǎng)新體驗(yàn),支持等數(shù)十個(gè)網(wǎng)站的無人駕駛;GLM-PC啟動(dòng)內(nèi)測(cè),基于視覺多模態(tài)模型實(shí)現(xiàn)通用Agent的技術(shù)探索。
從對(duì)話交互轉(zhuǎn)向具體任務(wù)與操作
當(dāng)前,大模型技術(shù)正引領(lǐng)著機(jī)器與人類互動(dòng)模式的變革,基于理解需求、規(guī)劃與決策、執(zhí)行行動(dòng)和自我反思,Agent將帶來“從人適應(yīng)機(jī)器到讓機(jī)器適應(yīng)人”的人機(jī)交互體驗(yàn)。
蘋果、谷歌及OpenAI等科技巨頭已將Agent技術(shù)視為2025年的戰(zhàn)略重心,業(yè)界普遍預(yù)期2025年將成為Agent技術(shù)的爆發(fā)期。國際信息技術(shù)研究和咨詢公司Gartner將agenticAI列為2025年十大技術(shù)趨勢(shì)之一,并預(yù)估到2028年,至少15%的日常工作決策將由agenticAI自主承擔(dān),相比2024年的零比例,增長(zhǎng)顯著。
據(jù)《證券日?qǐng)?bào)》記者了解,Agent是目標(biāo)驅(qū)動(dòng)型的,能夠完全執(zhí)行工作流程,適應(yīng)、學(xué)習(xí)、迭代、與其他系統(tǒng)和人類協(xié)作,并端到端地完成任務(wù)。與OpenAI略有不同,智譜定義了大模型發(fā)展的五個(gè)階段:語言能力、邏輯能力(多模態(tài)能力)、使用工具的能力、自我學(xué)習(xí)能力以及探究科學(xué)規(guī)律能力。
發(fā)展至今,大模型已經(jīng)初步具備了與現(xiàn)實(shí)世界互動(dòng)的部分能力。“Agent將極大地提升使用工具能力,同時(shí)開啟對(duì)自我學(xué)習(xí)能力的探索。”張鵬表示,Agent可以看作是大模型通用操作系統(tǒng)LLM-OS的雛形?;诖竽P椭悄苣芰Γ磥碛袡C(jī)會(huì)將人機(jī)交互范式帶向新的階段。
自2023年4月份推出AgentBench以來,智譜團(tuán)隊(duì)投入一年半時(shí)間,專注于AutoGLM及GLM-PC模型中CogAgent的研發(fā)。不僅如此,智譜還拓展了技術(shù)邊界,推出了基于PC的自主Agent——GLM-PC,這是面向“無人駕駛”PC領(lǐng)域的一次重要技術(shù)嘗試,依托其多模態(tài)模型CogAgent。目前,GLM-PC已開放首階段內(nèi)測(cè),涵蓋會(huì)議代理、文檔處理、網(wǎng)頁搜索與總結(jié)、遠(yuǎn)程及定時(shí)操作、隱形屏幕等功能。
智譜現(xiàn)場(chǎng)展示的視頻顯示,AutoGLM升級(jí)為可以操作手機(jī)、電腦,以及實(shí)現(xiàn)手機(jī)電腦聯(lián)動(dòng)。例如,在采購火鍋食材的案例中,AutoGLM自主執(zhí)行了54步無打斷操作,并且,在這種多步、循環(huán)任務(wù)中,AutoGLM的速度表現(xiàn)超過人手動(dòng)操作。
“AutoGLM和GLM-PC是我們向AI智能操作系統(tǒng)邁進(jìn)的重要嘗試。”智譜CEO張鵬對(duì)記者表示,這些成果基于智譜在大語言模型、多模態(tài)模型、邏輯推理以及工具使用等領(lǐng)域的技術(shù)積累。不過,他也表示,電腦操作空間大且任務(wù)復(fù)雜得多,加大了技術(shù)難度。
塑造AI時(shí)代智能設(shè)備新范式
隨著大模型能力的不斷進(jìn)化,AI正逐步“生長(zhǎng)”出完備的腦、眼和手。智能的深化、感知能力的豐富、交互帶寬的拓寬,以及Agent技術(shù)所帶來的執(zhí)行力提升,共同塑造著全新的智能時(shí)代。
智譜COO張帆對(duì)記者表示,在大模型的加持下,智能設(shè)備將會(huì)煥發(fā)出新的機(jī)會(huì)。手機(jī)+AI會(huì)變成隨身個(gè)人智能助理,PC+AI將會(huì)成為全新生產(chǎn)力工具,汽車+AI將會(huì)讓車成為人們的智能第三生活空間。大模型不僅僅會(huì)為手機(jī)、PC和汽車帶來機(jī)會(huì),更會(huì)惠及各種各樣的智能設(shè)備。
隨著端側(cè)性能與算力的不斷提升,以及專為AI原生設(shè)備設(shè)計(jì)的模型和端云協(xié)同架構(gòu)的涌現(xiàn),Agent技術(shù)不僅在操作系統(tǒng)和應(yīng)用層面引領(lǐng)用戶體驗(yàn)的革新,更將這一變革延伸至各類智能設(shè)備,從手機(jī)、電腦到汽車、眼鏡、家居等,各種AI原生設(shè)備爭(zhēng)相涌現(xiàn)。
開放日現(xiàn)場(chǎng),一名業(yè)內(nèi)人士向《證券日?qǐng)?bào)》記者分析稱,大模型與Agent的發(fā)展不僅為用戶帶來了AI時(shí)代智能設(shè)備的新范式,更為大模型技術(shù)的廣泛應(yīng)用開辟了廣闊天地。從智能設(shè)備走向智能網(wǎng)絡(luò),見證了AI原生設(shè)備之間的互聯(lián)互通和潛能。
“我們的目標(biāo)是實(shí)現(xiàn)AGI(通用人工智能),即讓機(jī)器能夠像人類一樣思考。智譜從基礎(chǔ)能力著手,首先探究技術(shù)的實(shí)際應(yīng)用,再逆向推導(dǎo)產(chǎn)品的開發(fā)方式。”張帆在接受《證券日?qǐng)?bào)》采訪時(shí)如此表示。
銀河證券研報(bào)顯示,AI智能體將成為通往通用人工智能時(shí)代的必經(jīng)之路。隨著大型模型快速迭代升級(jí),基于大型模型技術(shù)的AI智能體迎來了快速發(fā)展的階段。AI智能體產(chǎn)業(yè)鏈?zhǔn)嵌嘣腋叨葏f(xié)同生態(tài)系統(tǒng),未來市場(chǎng)空間廣闊,同時(shí)將推動(dòng)App生態(tài)逐漸向端側(cè)生態(tài)轉(zhuǎn)變,將成為AI應(yīng)用發(fā)展新趨勢(shì)。
(編輯 才山丹)
萬億市場(chǎng)可期 東北冰雪經(jīng)濟(jì)發(fā)展迎來新舉措
隨著東北等地各大滑雪場(chǎng)陸續(xù)開板……[詳情]
版權(quán)所有證券日?qǐng)?bào)網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號(hào)京ICP備17054264號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注