每天資訊智慧語音應用火爆的背後,AI資料的驅動起大作用

菜單

智慧語音應用火爆的背後,AI資料的驅動起大作用

智慧語音技術是人工智慧應用最廣泛的技術之一,擁有天然的互動性,擁有巨大的市場空間。基於大量資料的積累、深度神經網路模型的發展及演算法的迭代最佳化,近年,智慧語音技術的識別準確率取得了不斷的提升,相關場景應用也是不斷深化。這其中,智慧語音技術對資料的依賴愈發明顯。

智慧語音應用火爆的背後,AI資料的驅動起大作用

在人工智慧技術推動下,智慧語音具備的巨大的場景落地潛力。在企業和技術的推動下,語音互動技術在智慧家居、智慧車載、語音助手、機器人等領域取得迅猛發展,迸發出鮮活的生命力。

如今的語音互動雖然囊括了大部分場景對話,但還有更多複雜場景的問題需要解決 —— 聽懂人類情感是非常複雜的過程,這涉及到情感識別、語義分割、聲紋識別等等,對演算法模型訓練背後的資料提出了巨大的挑戰。

高質量AI資料,智慧語音走向成熟的必由之路

從根本出發來考慮,語音互動幾乎和手勢一樣,是人類最自然的互動方式之一,透過聲音與朋友家人交流、與客戶同事溝通都是人類自古以來的通用場景。語音能夠傳達的細節相當豐富,其中蘊含了大量語義、情緒以及未盡之意,資訊濃度非常高。因此,也可以說語音互動技術是讓機器聽懂世界的技術。

在這些發展需求商業化落地的背後,必然需要大量高質量、能被機器識別理解的結構化資料投入訓練,場景化、高質量的資料讓各類終端變得更加聰明。因此,無論出於技術還是商業需求,都需要以雲測資料為代表的AI資料服務提供商介入,生產純淨、安全、精準的訓練資料,助力智慧語音技術深化落地。

智慧語音應用火爆的背後,AI資料的驅動起大作用

雲測資料紮根於AI資料服務領域,在服務眾多智慧語音企業的過程中,積累了豐富的資料採集標註經驗,支援專業音訊裝置與多條件場景,可以幫助企業獲得精細化、高質量的AI資料,在智慧語音方向擁有豐富的專案經驗。

首先,雲測資料擁有充足的被採資源,可最大程度還原搭建應用場景,為企業提供語音類、視覺類資料的場景化採集。諸如在採集過程中雲測資料會運用專業的軟/硬體裝置,來滿足客戶的環境光照要求;如果客戶需要純淨音訊資料,雲測資料會搭建一個錄音棚,滿足諸如混響或者高底噪的採集需求,包括使用麥克風陣列等專業裝置進行錄製。

目前雲測資料覆蓋智慧語音主流應用場景,支援專業音訊裝置與多條件場景,交付能力強。支援常見採集型別,如:喚醒詞、控制詞、指定語料、情緒型別、方言、背景音、情景對話、指定文字念句、遠場語音等等型別的資料型別。

在語音標註能力方面,支援ASR語音轉寫、聲紋識別標註、說話人識別、語音切割、情緒判定標註等;在自然語言處理方面,支援OCR轉寫、NLU語句泛化、文字資訊抽取、實體標註、詞性標註、槽位填充等,具備全方位的語音標註能力。

同時,雲測資料具有自主智慧財產權的資料標註平臺擁有靈活、高效、智慧的特點,幫助標註人員提效減負。在保證資料隱私安全的同時,支援平臺私有化部署,可最大程度保障資料安全性。

智慧語音應用火爆的背後,AI資料的驅動起大作用

在擁有場景化精準語音資料前提下,演算法訓練所需要的資料精準度就決定了智慧語音產品的“聰明”上限,它貫穿在智慧語音產品的探索期與商業落地階段。在人工智慧領域中有著這樣一句話:garbage in,garbage out。換而言之,資料的質量的高低直接影響語音互動應用的結果,實現人機互動順暢。

隨著技術的不斷突破,語音互動體驗方面還有望得到進一步提升。比如在裝置的喚醒率、識別率、誤報率、環境降噪等方面,仍然需要在高質量、場景化的語音資料的助力下不斷進化,持續提升使用者使用的體驗感,創造更加自然的互動裝置,實現智慧語音技術應用的深化落地。