* 語音交互- */>
智能語音交互
匯聚語音識別、語音合成、自然語言理解等技術
深度理解語音內容并賦予與人交流及反饋的能力
語音算法模型可以根據實際場景訓練提升識別效率
智能語音識別的原子能力
深度語義解析
支持50多個領域的語義理解
多語種和多方言識別
支持普通話、粵語、
英文、方言等識別
中文標點智能斷句
內容理解和停頓智能匹配合適
的標點符號(包括,。???)
數字格式智能轉換
轉換數字序列、小數、時間、
分數、基礎運算符正確轉換
智能語言糾錯
根據語音的內容理解自動
糾正為正確內容
批量快速識別
支持批量上傳、
批量輸出識別結果
識別結果支持時間戳
識別返回的文字結果帶有時間戳,
切分句子開始和結束時間
豐富場景音庫
支持在線/離線語音合成,
語速、音調、音量靈活設置
智能語音識別的核心功能
支持實時或錄音音頻的識別與理解,算法靈活配置可定制開發
錄音音頻識別
實時語音交互
語音定制化及合成
深度自我學習
智能語音識別的核心優勢
結合自然語言識別及機器學習技術,提供豐富及可持續深化的語音交互體驗
毫秒級實時識別與反饋
語義理解準確
配置簡單可定制
核心功能應用場景
會議/庭審語音轉寫
通過豐富的日常語音數據庫以及行業關鍵詞的積累, 如司法/政務等,提高語義理解的準確度,識別準確率高達97%。 充當秘書或書記員的角色,實現輸出文字自動識別、自動糾錯, 自動斷點,自動總結。
解決的業務難點
通過對會議/庭審等音頻的識別與語義理解,智能語音識別技術可以 將語音直接轉變為文字,自動糾錯,有效將重要會議/庭審重要信息 作為會議紀要、庭審筆錄直接使用。