應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

全雙工實(shí)時(shí)音視頻交互、毫秒級(jí)響應(yīng),商湯“日日新”大模型交互平臺(tái)接入小米 AI 眼鏡

2025-08-07 09:12 IT之家

導(dǎo)讀:作為小米長(zhǎng)期生態(tài)合作伙伴,商湯“日日新”大模型交互平臺(tái)“商量”已探索性接入小米 AI 眼鏡,幫助用戶(hù)在生活與工作的真實(shí)場(chǎng)景中,實(shí)現(xiàn)“看、說(shuō)、記、想”一體化,具備全雙工實(shí)時(shí)音視頻交互能力。

  8 月 6 日消息,據(jù)商湯科技消息,作為小米長(zhǎng)期生態(tài)合作伙伴,商湯“日日新”大模型交互平臺(tái)“商量”已探索性接入小米 AI 眼鏡,幫助用戶(hù)在生活與工作的真實(shí)場(chǎng)景中,實(shí)現(xiàn)“看、說(shuō)、記、想”一體化,具備全雙工實(shí)時(shí)音視頻交互能力。

  據(jù)官方介紹,傳統(tǒng)智能設(shè)備的交互體驗(yàn),常受限于響應(yīng)延遲、語(yǔ)境斷裂與單向輸入。小米 AI 眼鏡 × 商湯日日新組合的亮點(diǎn)之一,在于其全雙工實(shí)時(shí)音視頻交互能力。這并非簡(jiǎn)單的語(yǔ)音指令接龍或“一問(wèn)一答”的半雙工拼接,而是構(gòu)建了類(lèi)似人與人對(duì)話(huà)的自然、流暢、不間斷的交互閉環(huán),例如逛街逛展進(jìn)行實(shí)時(shí)識(shí)別,化身問(wèn)答小百科;出國(guó)旅游又能成為翻譯助手,在這些場(chǎng)景均展現(xiàn)了強(qiáng)大的實(shí)力:

  •   毫秒級(jí)響應(yīng),思考即交流:依托“日日新”強(qiáng)大的模型推理能力與底層優(yōu)化,交互延遲被壓縮至毫秒級(jí),用戶(hù)言語(yǔ)未落,理解已經(jīng)開(kāi)始,回應(yīng)幾乎實(shí)時(shí)生成。

  •   語(yǔ)境連續(xù)不中斷:“日日新”大模型能深度理解上下文,精準(zhǔn)跟蹤對(duì)話(huà)脈絡(luò),支持隨時(shí)打斷、糾偏和深入追問(wèn),對(duì)話(huà)如同與真人助手般自然流暢。

  •   復(fù)雜環(huán)境反饋超穩(wěn)定:即使在嘈雜的展館人潮或喧鬧的街頭,其抗噪性能升級(jí)也能確保指令被精準(zhǔn)捕捉、理解無(wú)誤。

  •   深度分析,記憶加持:結(jié)合音視頻記憶與檢索技術(shù),系統(tǒng)能即時(shí)關(guān)聯(lián)歷史溝通細(xì)節(jié)(如在向客戶(hù)復(fù)述方案時(shí)),提供極具針對(duì)性的信息支持。

  商湯科技稱(chēng),此次合作為智能眼鏡乃至更廣泛的下一代智能硬件交互范式,提供了具備高價(jià)值的參考方向 —— 讓 AI 更實(shí)時(shí)、更深層地融入人類(lèi)感知與交互,持續(xù)釋放其賦能用戶(hù)創(chuàng)造價(jià)值的潛力。

  據(jù)了解,今年 6 月,小米首款 AI 眼鏡正式問(wèn)世,被定義為“面向下一代的個(gè)人智能設(shè)備”,也是“隨身的 AI 入口”。據(jù) XR Vision 報(bào)道,小米 AI 眼鏡首銷(xiāo) 3 天銷(xiāo)量或已接近 5 萬(wàn)副,創(chuàng)下了中國(guó) AI 眼鏡最快銷(xiāo)售紀(jì)錄。