一种基于语音和图像的说话人数目估计方法和系统

被引:0
专利类型
发明
申请号
CN202311278365.6
申请日
2023-10-07
公开(公告)号
CN117011924B
公开(公告)日
2024-02-13
发明(设计)人
白炳潮 宛敏红 宋伟 朱世强
申请人
之江实验室
申请人地址
311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
IPC主分类号
G06V40/16
IPC分类号
G06V10/764 G06F18/24 G06V10/80 G06V10/82 G06F18/25
代理机构
杭州天正专利事务所有限公司 33201
代理人
王兵;杨东炜
法律状态
授权
国省代码
浙江省 杭州市
引用
下载
收藏
共 50 条
[1]
一种基于说话人嵌入空间的竞争说话人数量估计方法及系统 [P]. 
曲天书 ;
吴玺宏 ;
彭超 .
中国专利 :CN111179959B ,2020-05-19
[2]
一种射频标签的数目估计方法和系统 [P]. 
龚伟 ;
刘云浩 .
中国专利 :CN103793670A ,2014-05-14
[3]
一种基于多特征融合的密集人数估计方法和系统 [P]. 
徐勇 ;
匡慈维 .
中国专利 :CN104504394A ,2015-04-08
[4]
一种基于图像分析和深度学习的人数统计方法 [P]. 
黄建华 ;
俞启尧 .
中国专利 :CN107330390A ,2017-11-07
[5]
一种基于语音交互和大模型的协同办公方法和系统 [P]. 
张裕桥 .
中国专利 :CN119380709A ,2025-01-28
[6]
基于图像分析的人数统计方法和人数统计装置 [P]. 
张杨 ;
杨鹏 .
中国专利 :CN106570440A ,2017-04-19
[7]
基于机器学习和FFT的盲源分离信源数目并行估计方法 [P]. 
王景景 ;
李爽 ;
杨星海 ;
吴承安 ;
郑轶 ;
鄢社锋 ;
乔钢 ;
施威 ;
张祥光 ;
郭瑛 ;
李海涛 .
中国专利 :CN112861066B ,2021-05-28
[8]
一种多人语音混合中目标说话人估计方法及系统 [P]. 
刘宏哲 ;
张启坤 .
中国专利 :CN108766459B ,2018-11-06
[9]
基于语音存在概率和相位估计的语音增强方法 [P]. 
赵彦平 ;
陈万忠 ;
赵晓晖 ;
王波 .
中国专利 :CN106971740A ,2017-07-21
[10]
用于音频/图像的说话者检测和定位的方法和装置 [P]. 
A·科尔梅纳雷兹 ;
H·J·斯特鲁贝 ;
S·古塔 .
中国专利 :CN100370830C ,2003-12-03