從語音到多模態,科大訊飛重新定義智能硬件AI交互
從“聽懂一句話”,到“理解一個場景”,再到“完成一項任務”,AI交互正從單一語音能力演進為融合視覺、語言、Agent與具身智能的綜合能力,成為智能硬件與機器人發展的核心基礎設施。
7月2日,在2026科大訊飛智能交互生態發布會上,科大訊飛發布AIUI交互平臺、AIUI多語種交互平臺及機器人超腦平臺三項核心升級。

從多模態交互到全球化部署,再到機器人規模化落地,三大平臺共同構建起面向智能硬件與機器人時代的新一代AI交互基礎設施。
AIUI交互平臺升級,從語音交互邁向多模態AI交互
伴隨大模型發展,語音交互正在發生新的變化。
用戶需要的不再只是"聽懂一句話",而是能夠理解上下文、識別眼前場景,并結合視覺信息完成連續交互。基于這一趨勢,AIUI完成近年來最大的一次升級,正式邁向多模態AI交互平臺。

在語音能力方面,平臺持續優化底層能力。針對低算力RTOS設備,AIUI進一步降低接入門檻,實現在100MHz主頻、140KB存儲條件下即可穩定運行;多模態降噪與全雙工能力同步升級,通過融合語音與視覺信息,在復雜噪聲環境中進一步提升識別穩定性,讓設備真正做到"聽得清"。
與此同時,平臺開放100余種超擬人音色,升級語音合成模型,支持輕笑、停頓等副語言表達,并支持Prompt生成不同角色聲音。結合數字形象表情動作生成能力,設備能夠實現語音、情緒與視覺表達協同,進一步提升交互的自然度。
相比以往,最大的變化來自多模態能力。
AIUI融合視覺理解、圖像生成及視覺語言模型,讓設備不僅能夠理解語音,還能夠理解圖片、感知場景,并根據自然語言生成圖像內容,實現從"聽懂語音"向"理解世界"的升級,為教育陪伴、互動娛樂、內容創作等場景提供更加豐富的交互體驗。

此外,平臺同步推出AIUI Code及聲學檢測工具,形成覆蓋能力接入、開發調試、效果驗證的完整開發閉環,進一步降低開發成本。
AIUI多語種交互平臺開放,為智能硬件全球化提供AI底座
隨著越來越多中國智能硬件企業走向海外,真正需要解決的問題已經不僅是語言翻譯,而是本地化交互體驗。
不同國家和地區在語言習慣、網絡環境、部署方式及數據合規等方面存在差異,企業往往需要投入大量資源完成系統整合。
此次發布會上,AIUI多語種交互平臺正式開放,以"一站式、多語種、高效果、成本可控"為核心,為智能硬件企業提供覆蓋AI交互全鏈路的能力。

平臺支持40余種語言,并打通聊天、設備控制、知識問答、多語種翻譯、多模態交互五大核心場景,讓設備能夠以更加符合當地語言習慣的方式與用戶交流。
目前,平臺已完成新加坡、東南亞、中東、歐洲、北美等區域節點部署,支持公有云及私有化部署,并適配GDPR、CCPA、PDPA等不同地區的數據合規要求。同時推出按臺付費模式,結合測試資源、開發支持等服務,幫助企業更低成本實現全球部署。
隨著具身智能快速發展,機器人正從簡單對話邁向復雜任務執行,對感知、理解和執行提出了更高要求。
此次升級中,機器人超腦平臺圍繞多模態交互與場景落地持續完善能力體系。平臺融合全景攝像頭、環形麥克風陣列等硬件,實現360°視聽融合感知,在多人、高噪環境下依然能夠精準識別目標用戶;結合人臉識別、人體追蹤、手勢識別等能力,使機器人能夠完成更加自然的連續交互。

圍繞產業應用,平臺進一步完善"通用能力+行業方案"體系,提供裸板接入、降噪板、封裝麥板、多模態軟核授權等多種接入方式,幫助開發者根據不同產品形態快速完成部署。
針對陪伴機器人、掃地機器人、康養機器人、四足機器人及人形機器人,平臺同步推出行業解決方案,將語音、視覺、多模態感知等能力深度融合,加速機器人在家庭、康養、服務等真實場景中的規模化應用。
與此同時,平臺推出麥克風陣列封裝及多模態一體機,將語音、視覺、感知與交互能力進行一體化集成,進一步縮短開發周期、降低產品落地門檻。

發布會現場,搭載機器人超腦平臺的專業級服務導覽機器人Guide01同步亮相。Guide01集成自主導航、多模態感知及自然語言交互能力,可應用于零售、展館、文旅等場景,展示了機器人從"能交流"邁向"能服務"的新階段。
目前,機器人超腦平臺已連接120家機器人客戶及400家泛機器人生態伙伴,并持續通過開發者大賽、AI服務市場等方式推動機器人產業生態建設。
隨著大模型持續向智能硬件與機器人產業深入滲透,AI交互正從單一能力升級為產業基礎設施。
此次AIUI交互平臺、機器人超腦平臺升級及AIUI多語種交互平臺的開放,不僅進一步完善了從多模態交互、全球部署到機器人場景落地的完整能力體系,也為智能硬件企業和機器人開發者提供了更加完整的AI交互底座,加速大模型能力走向更多真實產業場景。
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













