[科学时报]科大讯飞语音识别技术获重大进展
本报讯 在不久前结束的2008年国际说话人识别评测大赛上,科大讯飞联合语音实验室的郭武、戴礼荣两位老师组织研究团队首次参加比赛,即获得综合指标第一名的优异成绩。这是科大讯飞继2006年、2007年蝉联国际英文合成大赛第一名后,在语音研究国际大赛上获得的又一殊荣,表明科大讯飞已经在全球语音技术领域内取得了从语音合成到语音识别技术的全面领先地位,“能听会说”的完整解决方案将对以科大讯飞为代表的我国语音产业发展具有重大战略意义。说话人识别技术,又称话者识别或声纹识别,是语音识别技术的重要方向和应用领域。该技术通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),从而识别出说话人的身份,可广泛应用于*事、国家安全和各产业领域。由美国国家标准技术研究院举办的说话人识别评测大赛,是该领域国际上规模与影响力最大的比赛。本届大赛的参赛单位达到了创纪录的43家,其中包括美国卡耐基—梅隆大学、麻省理工学院、斯坦福大学,捷克博诺技术大学以及清华大学、中国科技大学、中科院自动化所、中科院声学所,Motorola研究中心,IBM研究院等语音技术领域的世界顶尖高手。同时,本次比赛在信道复杂度、说话人的数量以及测试的数量等方面比以往也大大增加。本届大赛以识别等错误率(EER)、最小检测代价(minDCF)、检测代价(DCF)为三大核心测试指标。科大讯飞联合语音实验室报送的USTC-iFly系统获得EER、minDCF两项第一名和DCF第三名。此外,科大讯飞语音实验室联合新加坡信息研究所报送的I4U系统,获得DCF第一名和EER、minDCF两项第二名的优异成绩。科大讯飞一直以国际领先的语音合成技术而闻名,而在语音识别研究方面,此前业界普遍认为中国与美国、日本等发达国家相比尚有不小差距,但经过近年来的不懈努力,科大讯飞已经积累了深厚的语音识别研究基础,并组建了高水平的研发团队,因此能够在这次大赛中取得优异成绩。科大讯飞语音实验室是中国科技大学和科大讯飞信息科技股份有限公司联合建立的研究机构,在国家“863”项目和国家自然科学基金委的长期支持下,专门致力于语音及语言技术的研究与产业化。
杨保国 科学时报 2008-7-7