新京報貝殼財經(jīng)訊(記者羅亦丹)7月10日,2025貝殼財經(jīng)年會開幕。在主題為“建設(shè)‘開源之都’:智AI未來,生態(tài)共澎湃”的首場論壇上,商湯科技集團大模型綜合商務(wù)部執(zhí)行商務(wù)總監(jiān)李星冶回顧了人工智能從1.0時代到2.0時代的演變,并重點介紹了商湯在多模態(tài)交互技術(shù)上的突破與應(yīng)用落地。他強調(diào),人工智能正從傳統(tǒng)的計算機視覺向“所見即所得”的多模態(tài)交互轉(zhuǎn)型,這將深刻改變教育、文旅、客服等多個領(lǐng)域。

 

李星冶表示,在AI 1.0時代,商湯專注于計算機視覺技術(shù),主要服務(wù)于政府和企業(yè)。

 

隨著2023年大模型技術(shù)的興起,AI進入2.0時代,商湯開始推動多模態(tài)交互的創(chuàng)新。李星冶解釋,這不僅僅是文字指令的識別,而且是基于“所見即所得”的理念,整合視頻、圖像、語音等多種模態(tài),實現(xiàn)與人類的實時互動。在現(xiàn)場,李星冶展示了通過畫出一個“太乙真人”的卡通形象,喚起太乙真人語音并進行實時互動的場景。

 

李星冶詳細介紹了多模態(tài)交互的落地成果。在教育領(lǐng)域,商湯與學(xué)習(xí)機廠商合作,開發(fā)了“所見即所得”的交互設(shè)備。孩子佩戴設(shè)備后,算法能實時感知手寫解題過程,識別錯誤并提供巧妙解法。針對低幼兒童,系統(tǒng)支持指讀繪本,將圖片轉(zhuǎn)化為故事并互動。目前,商湯已與10所左右學(xué)校合作,打造智能校園助手,處理課程安排、成績查詢等功能。

 

此外,商湯科技的智能體應(yīng)用是另一亮點。李星冶舉例稱,在倉庫租賃場景中,算法分析行業(yè)數(shù)據(jù)輔助BD銷售,生成租約管理方案等功能。在客服領(lǐng)域,商湯與知名運營商合作,打造高效智能體。在智能家居方面,提供家庭互動功能,以人工智能的技術(shù)豐富家庭交互生活。

 

“多模態(tài)大模型的優(yōu)勢正在于此:讓交互不再局限于識別文字指令,更能通過‘所見即所得’的方式,通過視覺等多維度信息,讓大模型與人之間的交互更順暢。”李星冶說。


編輯 楊娟娟

校對 柳寶慶