9 月 7 日,國(guó)際多通道語(yǔ)音分離和識(shí)別大賽(CHiME)組委會(huì)在微軟海得拉巴研發(fā)中心揭曉了最新一屆 CHiME-5 的比賽結(jié)果。科大訊飛團(tuán)隊(duì)包攬大賽四個(gè)項(xiàng)目的冠軍,包括單麥克風(fēng)陣列任務(wù)、分布式麥克風(fēng)陣列任務(wù)(Rank A)和兩種麥克風(fēng)陣列對(duì)應(yīng)的兩個(gè)端到端的語(yǔ)音識(shí)別任務(wù)(Rank B)。
具體情況如下:
在本屆比賽中,科大訊飛與中國(guó)科學(xué)技術(shù)大學(xué)杜俊教授、西北工業(yè)大學(xué)陳景東教授、佐治亞理工大學(xué)李錦輝教授等國(guó)內(nèi)外知名專家團(tuán)隊(duì)再度攜手。最終在單麥克風(fēng)陣列任務(wù)、分布式麥克風(fēng)陣列任務(wù)(Rank A)和兩種麥克風(fēng)陣列對(duì)應(yīng)的兩個(gè)端到端的語(yǔ)音識(shí)別任務(wù)(Rank B),共計(jì)四項(xiàng)任務(wù)中連續(xù)兩屆包攬所有項(xiàng)目冠軍,并再次刷新各項(xiàng)目的最好成績(jī)。
據(jù)介紹,本屆大賽組委會(huì)通過(guò)采用 4 聲道麥克風(fēng)陣列對(duì) 20 個(gè)真實(shí)家庭的晚餐進(jìn)行錄音來(lái)形成比賽數(shù)據(jù),用以考察和測(cè)試在家庭聚會(huì)等不同場(chǎng)景中自由交談風(fēng)格下的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別效果。整個(gè)賽事的難點(diǎn)主要包括多麥克風(fēng)陣列的同步錄音;對(duì)話風(fēng)格非常自由、近乎隨意;大量的語(yǔ)音交疊(Speech Overlap)以及遠(yuǎn)場(chǎng)混響和噪聲干擾對(duì)錄音的影響等。
作為國(guó)內(nèi)語(yǔ)音識(shí)別領(lǐng)域的翹楚,科達(dá)訊飛從來(lái)就沒(méi)人國(guó)人失望過(guò)。在2016 年首次參與第四屆 CHiME 賽事時(shí),科大訊飛就斬獲全部三個(gè)項(xiàng)目的桂冠并大幅刷新了各項(xiàng)目的歷史最好記錄。
關(guān)于CHiME:
CHiME(Computational Hearing in Multisource Environments) 屬于國(guó)際語(yǔ)音識(shí)別評(píng)測(cè)中的高難度比賽,始辦于 2011 年,由法國(guó)計(jì)算機(jī)科學(xué)與自動(dòng)化研究所、英國(guó)謝菲爾德大學(xué)、美國(guó)三菱電子研究實(shí)驗(yàn)室等知名研究機(jī)構(gòu)所發(fā)起。比賽的目的是希望學(xué)術(shù)界和工業(yè)界針對(duì)高噪聲和混響等現(xiàn)象影響下的實(shí)際場(chǎng)景提出全新的語(yǔ)音識(shí)別解決方案,以進(jìn)一步提升語(yǔ)音識(shí)別的實(shí)用性和普適性。
目前 CHiME 比賽已經(jīng)舉辦五屆。歷屆 CHiME 比賽的參賽隊(duì)伍包括劍橋大學(xué)、卡內(nèi)基梅隆大學(xué)、約翰霍普金斯大學(xué)、日本 NTT 等國(guó)際一流高校和研究機(jī)構(gòu),清華大學(xué)、中科院聲學(xué)所、中科院自動(dòng)化所、西北工業(yè)大學(xué)等國(guó)內(nèi)頂尖院校和研究所也有參與。