语音伪造与鉴伪的发展与挑战

被引:35
作者
陶建华 [1 ,2 ,3 ]
傅睿博 [1 ,2 ]
易江燕 [1 ]
王成龙 [1 ]
汪涛 [1 ,2 ]
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
[2] 中国科学院大学人工智能技术学院
[3] 中国科学院自动化研究所中国科学院脑科学与智能技术研究中心
基金
国家重点研发计划;
关键词
语音伪造; 语音鉴伪; 发展与挑战;
D O I
10.19363/J.cnki.cn10-1380/tn.2020.02.03
中图分类号
TN912.3 [语音信号处理]; TP309 [安全保密];
学科分类号
081002 [信号与信息处理]; 081206 [计算机网络与安全];
摘要
本文对语音伪造与鉴伪的发展进行了梳理与阐释。针对语音伪造的适用场景与关键技术点,分别对身份风格伪造、音色与韵律伪造、语音模拟三大核心语音伪造技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音伪造的应对技术语音鉴伪技术,首先介绍整理了针对性较强、面向参数式语音伪造、拼接式语音伪造与语音模拟技术框架的应对技术,在此基础上介绍了具有普适性更强的基于深度鉴别网络语音鉴伪研究进展。在此基础上,本文针对语音伪造技术所面临口语化、低资源的挑战,对未来多风格、低成本、鲁棒性发展趋势进行分析。对于语音鉴伪,本文从语料库、特征挖掘、异常检测三个角度对未来的研究重点进行诠释。
引用
收藏
页码:28 / 38
页数:11
相关论文
共 3 条
[1]
Statistical parametric speech synthesis [J].
Zen, Heiga ;
Tokuda, Keiichi ;
Black, Alan W. .
SPEECH COMMUNICATION, 2009, 51 (11) :1039-1064
[2]
Prosody modeling with soft templates.[J].Greg Kochanski;Chilin Shih.Speech Communication.2002, 3
[3]
北京语音实验录.[M].林焘 著.北京大学出版社.1985,