人工智能识别主持人情感

被引:5
作者
王一婷 [1 ]
杜鹏 [2 ]
机构
[1] 浙江传媒学院播音主持艺术学院
[2] 中国电信股份有限公司浙江研究与开发分公司
关键词
语音识别; 人工智能; 深度学习; 主持人; 情感;
D O I
暂无
中图分类号
G222.2 [播送业务]; TP18 [人工智能理论];
学科分类号
050302 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
随着以深度学习为基础的人工智能的不断发展,未来势必越来越多的特定脑力辅助性领域工作将会被取代。人工智能通过语音识别辨识出主持人实时表达的情绪,再通过调用事先准备的大数据库,使用"情感标签"调用相应的背景音乐和图像实现自动配乐和配景。本文使用语谱图作为主持人语音情感识别的特征,利用深度残差网络(Resnet)对原始输入特征进行提取,然后使用长短记忆网络(LSTM)对Resnet的输出特征进行进一步提取,使其具有上下时刻关联性,大大提高了最终的识别结果,最后将提取出的特征通过支持向量机(SVM)进行分类,输出"情感标签"。
引用
收藏
页码:24 / 27
页数:4
相关论文
empty
未找到相关数据