每天資訊小米AI實驗室六篇論文獲ICASSP2022收錄,多模態語音喚醒挑戰賽奪冠

菜單

小米AI實驗室六篇論文獲ICASSP2022收錄,多模態語音喚醒挑戰賽奪冠

1月22日,全球語音、聲學頂級會議ICASSP 2022公佈了論文入選名單,小米AI實驗室6篇學術論文被接收。小米“自由說”系統在MISP(基於多模態資訊的語音處理)挑戰賽中榮獲多模態語音喚醒第一名和多模態語音識別第二名,並受邀在今年5月的全球會議上向工業界和學術界進行方案報告。這也是小米語音方向取得的第6個世界級比賽冠軍。

小米AI實驗室六篇論文獲ICASSP2022收錄,多模態語音喚醒挑戰賽奪冠

ICASSP(International Conference on Acoustics, Speech and Signal Processing)即國際聲學、語音與訊號處理會議,是IEEE主辦的全世界最大的,也是最全面的訊號處理及其應用方面的頂級會議,在國際上享有盛譽並具有廣泛的學術影響力。

小米AI實驗室被錄用的論文涉及語音識別、語音合成、聲學語音質量評價等諸多方向。此次,小米語音、聲學取得了優異的成績,離不開小米工程師們在實際業務中紮實的技術積累,將實踐中總結的技術進步向業界和學術界進行回饋,共同促進AI技術的繁榮和發展。

在語音領域,小米語音團隊在2017年開始在學術頂會發表重要論文,並在TTS(語音合成)全面自研以及在合成的韻律、個性化、以及情感這三個方面實現了重大的突破;智慧生活助理小愛同學的聲音定製效果、合成流暢度與穩定性、合成的情感化都有顯著提升。

同時,小米在語音喚醒和預訓練方面進行了深入研究,提升了手機個性化語音喚醒和小米聞聲的效能,降低了小愛誤喚醒率,保障了語音喚醒的質量,受到ICASSP的審稿人的高度評價。

在聲學領域,小米聲學團隊致力於AI聲學技術的研究及工程落地,為小米手機及IoT全生態硬體產品打造業界領先的音訊體驗。目前AI通話降噪、協同喚醒、協同放音、空間音訊等技術已在手機、電視、小愛、耳機等60餘款產品中落地。4年來累計過審專利已達123項。

未來,小米將不斷探索科技新高度,為大家帶來更多黑科技,讓更多人享受科技帶來的美好生活。