直擊WAIC丨騰訊吳運(yùn)聲:AI技術(shù)正從圖文問(wèn)答向全方位多模態(tài)交互演進(jìn)
新浪科技訊 7月27日上午消息,在近日開(kāi)幕的2025世界人工智能大會(huì)上,“Tencent AI Talk智能涌現(xiàn)”論壇舉行。
論壇上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲透露了其對(duì)AI技術(shù)演進(jìn)的觀察,他認(rèn)為主要有三個(gè)趨勢(shì):
第一,現(xiàn)在的AI是從到短期記憶到長(zhǎng)期記憶的演進(jìn),在很長(zhǎng)一段時(shí)間里面,大模型只能記住比較短的上下文,或者說(shuō)把用戶一段時(shí)間里面的對(duì)話記錄給記住,但這個(gè)情況下對(duì)于支持一些超長(zhǎng)的復(fù)雜任務(wù)是不夠的。
另外,在很多模型在執(zhí)行一些復(fù)雜任務(wù)的時(shí)候,它需要去調(diào)用工具,往往需要記住更多信息,這對(duì)長(zhǎng)期記憶提出了更高要求。
第二,AI技術(shù)正在從圖文問(wèn)答向全方位的多模態(tài)交互演進(jìn)。用戶的交互輸入輸出不僅僅是圖片或者文字,會(huì)有各種各樣的形態(tài)的輸入輸出,因此
需要對(duì)這樣的感知去做多層次多方位的理解,甚至需要對(duì)空間去進(jìn)行全面的感知。所以在這種情況下,需要一種全模態(tài)的無(wú)縫的交互。
第三,過(guò)去的智能體發(fā)展里面,很多時(shí)候是依賴(lài)于單智能體的能力。單智能體借助于模型和對(duì)工具的自動(dòng)思考和調(diào)度去完成任務(wù)。但是對(duì)于一些很復(fù)雜的任務(wù),單智能體是不夠的。如果有不同的智能體負(fù)責(zé)不同的專(zhuān)業(yè),去讓各種各樣智能體做協(xié)同,才能去完成更加復(fù)雜的任務(wù)。

轉(zhuǎn)載請(qǐng)注明來(lái)自山西智睿祥新能源有限公司,本文標(biāo)題:《直擊WAIC丨騰訊吳運(yùn)聲:AI技術(shù)正從圖文問(wèn)答向全方位多模態(tài)交互演進(jìn)》
