2020年全国声学大会语言声学分论坛介绍

来源：中国声学学会

2020年全国声学大会将于11月在上海召开。会议主办单位：中国声学学会。承办单位：复旦大学工程与应用技术研究院、同济大学物理科学与工程学院、华东理工大学机械与动力工程学院。

分论坛内容将分期介绍。

语言声学分论坛

报告人：陈婧（北京大学）

汉语言语可懂度指数及其应用

报告摘要：言语可懂度指数（speech intelligibility index，SII）是言语可懂度客观评价的国际标准之一，广泛应用于语音通信系统评估、助听器验配等领域。国际标准的SII适用于英语的单音节词、双音节词、语句等语料类型，不完全适用于汉语语音。本报告将介绍基于汉语语音开展的言语可懂度指数研究进展，包括不同语料类型的汉语语音频带权重函数，以及关于SII模型的新理论与频带权重函数测量的新方法；结合智能助听的应用需求，提出了一种基于SII的听力状况评估方法。

报告人：欧智坚（清华大学）

第三代语音识别技术初探

报告摘要：在深度学习的推动下，语音识别取得了显著进展，尽管微软和IBM近年曾报道”语音识别媲美人类水平”，但语音识别相关产品在落地上并不尽如人意。因此，在语音识别的基础技术上进行大胆创新，突破现有技术的边界，是人工智能研究的核心内容，具有重要学术价值。本报告将简单回顾从上世纪七十年代以来，语音识别研究中出现的几代典型技术，然后探讨新一代语音识别技术的若干拟人化特点，包括：简洁灵活的端对端系统，高效率的多种学习方法以摆脱过度依赖单一有监督学习，融合符号逻辑和知识的语言建模等。报告将分享我们的若干进展，包括：基于神经时序分类状态拓扑条件随机场(CTC-CRF)的端到端语音识别，基于联合随机场(JRF)的半监督学习方法，随机场语言模型(TRF)，以及联合随机近似方法实现离散连续混合概率系统的学习。

报告人：汪俊杰（联想）

联想AI语音技术及应用

报告摘要：人工智能是驱动联想和行业智能化变革的核心力量。联想研究院人工智能实验室致力于打造人工智能创新生态系统，在核心领域及关键应用上，如：智能助手、智能服务、智能制造、智慧医疗，与国内外学术界、产业界和内外伙伴保持密切合作。本报告将介绍语音技术在联想的应用，分享联想在设备语音交互及行业语音解决方案上所做的工作，与业界一起探讨智能语音的发展趋势。

报告人：洪青阳（厦门大学）

噪声环境下的说话人识别

报告摘要：说话人识别又称声纹识别，可用来判断用户的身份，在人机交互中起着越来越重要的作用。但在噪声环境下，说话人识别准确率会急剧下降，很大程度影响用户体验。本次报告将着重分析噪声对说话人特征的影响，并针对性给出数据扩增、x-vector网络优化、生成对抗网络（GAN）训练等改进方案。其中x-vector网络有很强的学习能力，结合噪声数据扩增可大大提升识别性能。而GAN训练以干净样本和带噪样本成对输入，通过利用生成对抗网络的强大生成能力，学习得到表征空间中噪声数据表征到干净数据表征的映射，从而提升系统的噪声鲁棒性。针对实际应用，还可采用基于深度神经网络的端点检测（DNN-VAD）方案，有效过滤噪声，以提高语音的检测和识别精度。

来源：ASC-2018 中国声学学会

原文链接：http://mp.weixin.qq.com/s?__biz=MzI1NzY3NjE4Ng==&mid=2247485335&idx=1&sn=2924c5e25b35091d61056e9989046b61&chksm=ea128162dd650874c0a919533c35e50f990d053f9e21d5b25497d417d71a473cafb30899d06f&scene=27#wechat_redirect

电话：（010）86409582

邮箱：kejie@scimall.org.cn

2020年全国声学大会语言声学分论坛介绍

相关推荐 换一换

人机融合智能：人工智能3.0

“传播科学火种·启迪科学梦想”科普志愿新疆行举办

看我们用人工智能分析人工智能产业政策

人工智能的缺憾

相关推荐换一换