近日,由國際頂級語音會議ASRU(IEEE Automatic Speech Recognition and Understanding,自動語音識別與理解)舉辦的ASRU 2023多通道多方會議轉(zhuǎn)錄挑戰(zhàn)賽(M2MeT2.0)發(fā)布了最終排名結(jié)果。馬上消費人工智能研究院智能語音團(tuán)隊?wèi){借扎實的語音技術(shù)和創(chuàng)新實力,在本次挑戰(zhàn)賽的限定數(shù)據(jù)集和不限定數(shù)據(jù)集兩個賽道中均斬獲亞軍。
語音識別(Automatic Speech Recognition)、說話人日志(Speaker Diarization)等語音處理技術(shù)的最新發(fā)展激發(fā)了眾多智能語音的廣泛應(yīng)用。本次M2MeT2.0挑戰(zhàn)賽對說話人相關(guān)的人物上評估提出了更高要求,并且同時設(shè)立限定數(shù)據(jù)與不限定數(shù)據(jù)兩個子賽道。通過將語音歸屬于特定的說話人,旨在提高多說話人ASR系統(tǒng)在真實世界環(huán)境中的準(zhǔn)確性和適用性,以進(jìn)一步促進(jìn)多說話人語音識別領(lǐng)域研究的發(fā)展。
ASRU是國際上最大的非營利性專業(yè)技術(shù)學(xué)會IEEE旗下語音和語言處理技術(shù)委員會的旗艦技術(shù)活動,來自全球?qū)W術(shù)界和工業(yè)界的頂級專家和研究人員將圍繞當(dāng)下語音領(lǐng)域的研究熱點進(jìn)行深入探討。馬上消費人工智能研究院智能語音團(tuán)隊相關(guān)負(fù)責(zé)人表示,公司在智能語音領(lǐng)域深耕多年,已自研上線了語音合成、語音識別、聲紋識別和語義理解等全流程對話機器人技術(shù),此役得到ASRU2023認(rèn)可也是對公司智能語音技術(shù)的重要檢驗。
據(jù)悉,馬上消費于2017年成立人工智能研究院,在人工智能應(yīng)用創(chuàng)新領(lǐng)域持續(xù)輸出,系統(tǒng)或產(chǎn)品包括AI金融大腦、虛擬數(shù)字人、多模態(tài)生物核驗與防偽等,致力于打造全場景的AI解決方案,全面推動AI應(yīng)用生態(tài)的快速發(fā)展和全面賦能。
此外,馬上消費還聯(lián)合中國科學(xué)院、中國信通院、南開大學(xué)等全國著名科研機構(gòu)及高校建立了16個創(chuàng)新實驗室,先后有15篇論文被AI頂會收錄;先后參與國家及行業(yè)標(biāo)準(zhǔn)制定55項,參與34項權(quán)威成果,獲中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟權(quán)威認(rèn)證,榮獲“2022年度吳文俊人工智能科學(xué)技術(shù)獎”,并與騰訊、百度、華為等多家企業(yè)積極參行業(yè)內(nèi)的標(biāo)準(zhǔn)制定和技術(shù)研討。