2020年全国声学大会语言声学分论坛介绍

中国声学学会  |   2020-09-07 10:20

来源:中国声学学会

2020年全国声学大会将于11月在上海召开。会议主办单位:中国声学学会。承办单位:复旦大学工程与应用技术研究院、同济大学物理科学与工程学院、华东理工大学机械与动力工程学院。


分论坛内容将分期介绍。







语言声学分论坛

报告人:陈婧(北京大学)

汉语言语可懂度指数及其应用


报告摘要言语可懂度指数(speech intelligibility index,SII)是言语可懂度客观评价的国际标准之一,广泛应用于语音通信系统评估、助听器验配等领域。国际标准的SII适用于英语的单音节词、双音节词、语句等语料类型,不完全适用于汉语语音。本报告将介绍基于汉语语音开展的言语可懂度指数研究进展,包括不同语料类型的汉语语音频带权重函数,以及关于SII模型的新理论与频带权重函数测量的新方法;结合智能助听的应用需求,提出了一种基于SII的听力状况评估方法。



报告人:欧智坚(清华大学)

第三代语音识别技术初探


报告摘要:在深度学习的推动下,语音识别取得了显著进展,尽管微软和IBM近年曾报道”语音识别媲美人类水平”,但语音识别相关产品在落地上并不尽如人意。因此,在语音识别的基础技术上进行大胆创新,突破现有技术的边界,是人工智能研究的核心内容,具有重要学术价值。本报告将简单回顾从上世纪七十年代以来,语音识别研究中出现的几代典型技术,然后探讨新一代语音识别技术的若干拟人化特点,包括:简洁灵活的端对端系统,高效率的多种学习方法以摆脱过度依赖单一有监督学习,融合符号逻辑和知识的语言建模等。报告将分享我们的若干进展,包括:基于神经时序分类状态拓扑条件随机场(CTC-CRF)的端到端语音识别,基于联合随机场(JRF)的半监督学习方法,随机场语言模型(TRF),以及联合随机近似方法实现离散连续混合概率系统的学习。



报告人:汪俊杰(联想)

联想AI语音技术及应用



报告摘要:人工智能是驱动联想和行业智能化变革的核心力量。联想研究院人工智能实验室致力于打造人工智能创新生态系统,在核心领域及关键应用上,如:智能助手、智能服务、智能制造、智慧医疗,与国内外学术界、产业界和内外伙伴保持密切合作。本报告将介绍语音技术在联想的应用,分享联想在设备语音交互及行业语音解决方案上所做的工作,与业界一起探讨智能语音的发展趋势。



报告人:洪青阳(厦门大学)

噪声环境下的说话人识别


报告摘要说话人识别又称声纹识别,可用来判断用户的身份,在人机交互中起着越来越重要的作用。但在噪声环境下,说话人识别准确率会急剧下降,很大程度影响用户体验。本次报告将着重分析噪声对说话人特征的影响,并针对性给出数据扩增、x-vector网络优化、生成对抗网络(GAN)训练等改进方案。其中x-vector网络有很强的学习能力,结合噪声数据扩增可大大提升识别性能。而GAN训练以干净样本和带噪样本成对输入,通过利用生成对抗网络的强大生成能力,学习得到表征空间中噪声数据表征到干净数据表征的映射,从而提升系统的噪声鲁棒性。针对实际应用,还可采用基于深度神经网络的端点检测(DNN-VAD)方案,有效过滤噪声,以提高语音的检测和识别精度。



来源:ASC-2018 中国声学学会

原文链接:http://mp.weixin.qq.com/s?__biz=MzI1NzY3NjE4Ng==&mid=2247485335&idx=1&sn=2924c5e25b35091d61056e9989046b61&chksm=ea128162dd650874c0a919533c35e50f990d053f9e21d5b25497d417d71a473cafb30899d06f&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

相关推荐 换一换